Форум Flasher.ru
Ближайшие курсы в Школе RealTime
Список интенсивных курсов: [см.]  
  
Специальные предложения: [см.]  
  
 
Блоги Правила Справка Пользователи Календарь Сообщения за день
 

Вернуться   Форум Flasher.ru > Архив Flasher.ru > Программирование > Perl

Версия для печати  Отправить по электронной почте    « Предыдущая тема | Следующая тема »  
Опции темы Опции просмотра
 
Создать новую тему  
Старый 06.03.2002, 22:43
Crazy вне форума Посмотреть профиль Отправить личное сообщение для Crazy Посетить домашнюю страницу Crazy Найти все сообщения от Crazy
  № 31  
Crazy
[+1 23.05.11]
 
Аватар для Crazy

Регистрация: Dec 2001
Сообщений: 4,159
Цитата:
Оригинал написал(а) mmb
Я об этом думал. Но мне кажется, что таблицы слов получаться большие?
Словарный запас современных авторов не особо велик. Так что все не так страшно. Из поисковой базы прошлогоднего проекта, заполнявшейся около двух лет:

Всего слов (во всех формах): 246,940
Суммарная длина: 2,251,335 символов

Т.е. это, в принципе, даже в RAM можно было бы держать при правильной организации.

Цитата:
Да и как определять релевантность?
Никак.

Цитата:
И ещё одно отступление от темы нити. У кого ты обычно хостишься?
А я у себя хостюсь. Увы.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++

Старый 06.03.2002, 22:44
Crazy вне форума Посмотреть профиль Отправить личное сообщение для Crazy Посетить домашнюю страницу Crazy Найти все сообщения от Crazy
  № 32  
Crazy
[+1 23.05.11]
 
Аватар для Crazy

Регистрация: Dec 2001
Сообщений: 4,159
Цитата:
Оригинал написал(а) mmb
А что часто люди переходят с MySQL на MSSQL или наоборот?
Я как раз сейчас переношу один проект с MS SQL на MySQL -- возникла потребность хостить его на чужой площадке, а там кроме MySQL ничего не предлагают.
Не так уж редко встречается перенос между MySQL и Postgre, но лично мне не приходилось.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++

Старый 06.03.2002, 22:50
mmb вне форума Посмотреть профиль Отправить личное сообщение для mmb Посетить домашнюю страницу mmb Найти все сообщения от mmb
  № 33  
mmb

Регистрация: Aug 2001
Адрес: Москва
Сообщений: 38
Ты не ответил чем плох FULLTEXT в MySQL он ведь делает тоже самое+релевантность+скорость+ещё что-нибудь в 4-ой версии.
А где можно посмотреть на твой поиск?

Старый 06.03.2002, 22:57
Crazy вне форума Посмотреть профиль Отправить личное сообщение для Crazy Посетить домашнюю страницу Crazy Найти все сообщения от Crazy
  № 34  
Crazy
[+1 23.05.11]
 
Аватар для Crazy

Регистрация: Dec 2001
Сообщений: 4,159
1. Эта фича MySQL относительно свежая и не везде стоит достаточно новая версия сервера.

2. Фича не до конца отлажена.

3. Нет уверенности, что она всегда корректно работает с русским языком. Был такой слух, но я не проверял.

4. Задолбаешься привинчивать к этому морфологический поиск если того протребует задача.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++

Старый 06.03.2002, 23:05
mmb вне форума Посмотреть профиль Отправить личное сообщение для mmb Посетить домашнюю страницу mmb Найти все сообщения от mmb
  № 35  
mmb

Регистрация: Aug 2001
Адрес: Москва
Сообщений: 38
А как ты привинчиваешь морфологический поиск к своим поисковым движкам?

Старый 06.03.2002, 23:20
Crazy вне форума Посмотреть профиль Отправить личное сообщение для Crazy Посетить домашнюю страницу Crazy Найти все сообщения от Crazy
  № 36  
Crazy
[+1 23.05.11]
 
Аватар для Crazy

Регистрация: Dec 2001
Сообщений: 4,159
Простейший вариант таков:

1. Помимо списка слов заводим список производных слов (два поля: id базового слова и текст слова). В список слов, упомянутый ранее, заносим только базовые формы.

2. При поиске и индексировании мы сначала проверяем, не является ли это слово производным и только потом -- при отрицательном результате -- ищем в базовом списке.

Все новые слова на автомате регистрируются как базовые. Время от времени вручную или с использованием словарей производим вычистку списка базовых слов.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++

Старый 07.03.2002, 16:35
mmb вне форума Посмотреть профиль Отправить личное сообщение для mmb Посетить домашнюю страницу mmb Найти все сообщения от mmb
  № 37  
mmb

Регистрация: Aug 2001
Адрес: Москва
Сообщений: 38
Вроде списки синонимов (кошка = кошке = у кошки и т.д.) будут и в Mysql 4

Старый 07.03.2002, 17:49
Crazy вне форума Посмотреть профиль Отправить личное сообщение для Crazy Посетить домашнюю страницу Crazy Найти все сообщения от Crazy
  № 38  
Crazy
[+1 23.05.11]
 
Аватар для Crazy

Регистрация: Dec 2001
Сообщений: 4,159
...и это приятно.
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++

Старый 07.03.2002, 19:44
Хрюндик вне форума Посмотреть профиль Отправить личное сообщение для Хрюндик Посетить домашнюю страницу Хрюндик Найти все сообщения от Хрюндик
  № 39  
Хрюндик
 
Аватар для Хрюндик

Регистрация: Sep 2000
Сообщений: 326
Отправить сообщение для Хрюндик с помощью ICQ
Лично я пользуюсь Mastak Absolute Perl (раньше mPS)
рулит!

Старый 08.03.2002, 15:08
Crazy вне форума Посмотреть профиль Отправить личное сообщение для Crazy Посетить домашнюю страницу Crazy Найти все сообщения от Crazy
  № 40  
Crazy
[+1 23.05.11]
 
Аватар для Crazy

Регистрация: Dec 2001
Сообщений: 4,159
А в чем конкретно он рулит?
__________________
GIT d++ s++:++ a C++$ UB++ P++ L+ E+ W+++ N++ w++ O+ M V- t-- 5-- X+ R+++ tv- b+++ D++

Создать новую тему   Часовой пояс GMT +4, время: 20:13.
Быстрый переход
  « Предыдущая тема | Следующая тема »  

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.


 


Часовой пояс GMT +4, время: 20:13.


Copyright © 1999-2008 Flasher.ru. All rights reserved.
Работает на vBulletin®. Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot
Администрация сайта не несёт ответственности за любую предоставленную посетителями информацию. Подробнее см. Правила.