![]() |
Цитата:
Всего слов (во всех формах): 246,940 Суммарная длина: 2,251,335 символов Т.е. это, в принципе, даже в RAM можно было бы держать при правильной организации. Цитата:
Цитата:
|
Цитата:
Не так уж редко встречается перенос между MySQL и Postgre, но лично мне не приходилось. |
Ты не ответил чем плох FULLTEXT в MySQL он ведь делает тоже самое+релевантность+скорость+ещё что-нибудь в 4-ой версии.
А где можно посмотреть на твой поиск? |
1. Эта фича MySQL относительно свежая и не везде стоит достаточно новая версия сервера.
2. Фича не до конца отлажена. 3. Нет уверенности, что она всегда корректно работает с русским языком. Был такой слух, но я не проверял. 4. Задолбаешься привинчивать к этому морфологический поиск если того протребует задача. |
А как ты привинчиваешь морфологический поиск к своим поисковым движкам?
|
Простейший вариант таков:
1. Помимо списка слов заводим список производных слов (два поля: id базового слова и текст слова). В список слов, упомянутый ранее, заносим только базовые формы. 2. При поиске и индексировании мы сначала проверяем, не является ли это слово производным и только потом -- при отрицательном результате -- ищем в базовом списке. Все новые слова на автомате регистрируются как базовые. Время от времени вручную или с использованием словарей производим вычистку списка базовых слов. |
Вроде списки синонимов (кошка = кошке = у кошки и т.д.) будут и в Mysql 4
|
...и это приятно.
|
Лично я пользуюсь Mastak Absolute Perl (раньше mPS)
рулит! |
А в чем конкретно он рулит?
|
| Часовой пояс GMT +4, время: 02:50. |
Copyright © 1999-2008 Flasher.ru. All rights reserved.
Работает на vBulletin®. Copyright ©2000 - 2026, Jelsoft Enterprises Ltd. Перевод: zCarot
Администрация сайта не несёт ответственности за любую предоставленную посетителями информацию. Подробнее см. Правила.