Форум Flasher.ru

Форум Flasher.ru (http://www.flasher.ru/forum/index.php)
-   Флейм (http://www.flasher.ru/forum/forumdisplay.php?f=53)
-   -   programma - sostovitel slovarey (http://www.flasher.ru/forum/showthread.php?t=68166)

nuran 21.08.2005 11:12

programma - sostovitel slovarey
 
Mne nugna programma, kotoraya iz textovogo faila so slovami delaet [UNIKALNIE SLOVA], t.e. ubiraet vse povtoryaushiesya slova, faili bolshie, 100-200Mb.

Sushestvuyut takie? :confused:

Sh@man 21.08.2005 18:51

Можна на Visual Prolog'e написать. Алгоритм несложный и что-то подобное я уже кажется когда-то писал.

nuran 22.08.2005 00:15

написать то можно, только объём файла сильно большой, не зависнет? у меня есть программа "составитель словарей", которая делает именно то, что мне нужно, но с такими большими файлами она не справляеться - зависает.

Bright 22.08.2005 07:34

а разделить файл на меньшие куски не пробовал?

nuran 22.08.2005 16:42

а какой смысл, мне же нужно составить уникальный словарь из разных слов.

Bright 23.08.2005 07:22

конечно, придётся повозиться подольше ( в каждом куске удаляя одинаковые слова)
Но зато программы не зависнут при работе с ним.
Можно использовать связку GetKeywords (анализирует текст и говорит какие слова сколько раз повторяются) и какой нибудь текст редактор (напр. WritePad) и в редакторе потом заменять эти слова на " "
Вопрос: сколько примерно уникальных слов в этом файле?


Часовой пояс GMT +4, время: 03:29.

Copyright © 1999-2008 Flasher.ru. All rights reserved.
Работает на vBulletin®. Copyright ©2000 - 2026, Jelsoft Enterprises Ltd. Перевод: zCarot
Администрация сайта не несёт ответственности за любую предоставленную посетителями информацию. Подробнее см. Правила.