|
|
|||||
[+1 23.05.11]
Регистрация: Dec 2001
Сообщений: 4,159
|
Цитата:
Всего слов (во всех формах): 246,940 Суммарная длина: 2,251,335 символов Т.е. это, в принципе, даже в RAM можно было бы держать при правильной организации. Цитата:
Цитата:
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++ |
|
|||||
[+1 23.05.11]
Регистрация: Dec 2001
Сообщений: 4,159
|
Цитата:
Не так уж редко встречается перенос между MySQL и Postgre, но лично мне не приходилось.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++ |
|
|||||
Регистрация: Aug 2001
Адрес: Москва
Сообщений: 38
|
Ты не ответил чем плох FULLTEXT в MySQL он ведь делает тоже самое+релевантность+скорость+ещё что-нибудь в 4-ой версии.
А где можно посмотреть на твой поиск? |
|
|||||
[+1 23.05.11]
Регистрация: Dec 2001
Сообщений: 4,159
|
1. Эта фича MySQL относительно свежая и не везде стоит достаточно новая версия сервера.
2. Фича не до конца отлажена. 3. Нет уверенности, что она всегда корректно работает с русским языком. Был такой слух, но я не проверял. 4. Задолбаешься привинчивать к этому морфологический поиск если того протребует задача.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++ |
|
|||||
Регистрация: Aug 2001
Адрес: Москва
Сообщений: 38
|
А как ты привинчиваешь морфологический поиск к своим поисковым движкам?
|
|
|||||
[+1 23.05.11]
Регистрация: Dec 2001
Сообщений: 4,159
|
Простейший вариант таков:
1. Помимо списка слов заводим список производных слов (два поля: id базового слова и текст слова). В список слов, упомянутый ранее, заносим только базовые формы. 2. При поиске и индексировании мы сначала проверяем, не является ли это слово производным и только потом -- при отрицательном результате -- ищем в базовом списке. Все новые слова на автомате регистрируются как базовые. Время от времени вручную или с использованием словарей производим вычистку списка базовых слов.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++ |
|
|||||
Регистрация: Aug 2001
Адрес: Москва
Сообщений: 38
|
Вроде списки синонимов (кошка = кошке = у кошки и т.д.) будут и в Mysql 4
|
|
|||||
[+1 23.05.11]
Регистрация: Dec 2001
Сообщений: 4,159
|
...и это приятно.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++ |
|
|||||
Лично я пользуюсь Mastak Absolute Perl (раньше mPS)
рулит! |
|
|||||
[+1 23.05.11]
Регистрация: Dec 2001
Сообщений: 4,159
|
А в чем конкретно он рулит?
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++ |
Часовой пояс GMT +4, время: 20:47. |
|
« Предыдущая тема | Следующая тема » |
|
|