|
|
|||||
Регистрация: Mar 2004
Сообщений: 9
|
Как выделить русские слова?
Люди, а как выделить русские слова из текста?
Например, я получаю html файл вот таким образом: use LWP::UserAgent; $ua = LWP::UserAgent->new; $url="http://aport.ru"; my $req = HTTP::Request->new(GET=>$url); #указываем тип контекста #$req->content_type('application/x-www-form-urlencoded'); #вводим сам контекст для передачи $req->content(""); my $res = $ua->request($req); $doc=$res->content; дальше... print "<br>$1" while $doc =~ m!(\w+)!g; Выводятся только английские слова. А как получить все русские слова из html документа? |
|
|||||
Регистрация: Mar 2004
Сообщений: 9
|
Отвечаю на свой же впрос:
print "<br>$1" while $doc =~ m!([абвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ]+)!g; |
Часовой пояс GMT +4, время: 06:36. |
|
« Предыдущая тема | Следующая тема » |
Опции темы | |
Опции просмотра | |
|
|