Форум Flasher.ru
Ближайшие курсы в Школе RealTime
Список интенсивных курсов: [см.]  
  
Специальные предложения: [см.]  
  
 
Блоги Правила Справка Пользователи Календарь Сообщения за день
 

Вернуться   Форум Flasher.ru > Flash > ActionScript 1.0/2.0

Версия для печати  Отправить по электронной почте    « Предыдущая тема | Следующая тема »  
Опции темы Опции просмотра
 
Создать новую тему Ответ
Старый 09.11.2006, 04:18
wvxvw вне форума Посмотреть профиль Отправить личное сообщение для wvxvw Найти все сообщения от wvxvw
  № 1  
Ответить с цитированием
wvxvw
Modus ponens
 
Аватар для wvxvw

модератор форума
Регистрация: Jul 2006
Адрес: #1=(list #1#)
Сообщений: 8,049
Записей в блоге: 38
По умолчанию Парсер для иврита

В принципе можно тему и в "Для начинающих" было запостить. Вобщем, модератору виднее. =)

Значит, решил я сделать парсер для иврита. Сначала объясню, зачем он вообще нужен.
Дело в том, что если пытатьтся отрендерить ивритский текст с использованием шрифтов из библиотеки в програмно созданном текстовом поле, то возникает довольно неприятная ситуация: плеер "не понимает" в какую сторону нужно читать текст и отображает ивритские тексты задом на перед, но это еще пол беды... А вот когда нужно сделать так, чтобы в текстовом поле отображались одновременно иврит и английский - начинаются более серьезные неприятности. К сожалению, для ивритских шрифтов не предусмотрены "родные" знаки препинания, поэтому, как правило, никто не делает флешек с использованием не системных шрифтов, ну или просто пользуются посторонним софтом для того, чтобы конвертнуть текст "зеркально" и потом уже такой вставлять во флешку. К сожалению, второй вариант так же имеет недостатки. Т.как если у заказчика нет (как правило ее таки нет) програмы для переворачивания текста, то он не сможет самовольно ничего поменять на сайте.

Код ниже - практически работающее решение проблемы, увы, у него есть 2 серьезных недостатка.
1. Мне не удалось решить проблему с wordWrap, т.е. если этот параметр у поля выставлен в true, то строки начинают отображаться в обратном порядке.
2. На мой взгляд, код через чур громоздкий. И я бы был очень признателен за любые советы по оптимизации.
Код:
class HebrewConvertor {
	static function conv(_str:String):String {
		var tt_arr:Array = _str.split("\r\n");
		for (var ii = 0; ii<tt_arr.length; ii++) {
			var t_arr:Array = tt_arr[ii].split("");
			var h_arr:Array = [];
			var h_str:String = "";
			var j:Number = 0;
			for (var i = 0; i<t_arr.length; i++) {
				var tmp_arr:Array = [];
				if (t_arr[i].charCodeAt(0)>=1488) {
					for (j=i; j<t_arr.length && t_arr[j].charCodeAt(0)>=1488; j++) {
						tmp_arr.push(t_arr.splice(j, 1, "%"));
					}
					tmp_arr.reverse();
					h_arr.push(tmp_arr.join(""));
				}
			}
			h_arr.reverse();
			for (var i = 0; i<t_arr.length; i++) {
				if (t_arr[i] == "%") {
					for (j=i+1; j<t_arr.length && t_arr[j] == "%"; ) {
						t_arr.splice(j, 1);
					}
				}
			}
			t_arr = t_arr.join("").split("%");
			for (var i = 0; i<t_arr.length; i++) {
				for (j=0; j<t_arr[i].length; j++) {
					if (t_arr[i].charAt(j) == "-" || t_arr[i].charAt(j) == "\"" || t_arr[i].charAt(j) == ":" || t_arr[i].charAt(j) == ";" || t_arr[i].charAt(j) == "." || t_arr[i].charAt(j) == "," || t_arr[i].charAt(j) == " ") {
						var tmp_arr:Array = t_arr[i].split("");
						t_arr[i] = HebrewConvertor.en_sort(tmp_arr);
						break;
					}
				}
			}
			t_arr.reverse();
			var rt:String = "";
			for (var i = 0; i<t_arr.length; i++) {
				h_arr[i] != undefined ? rt += t_arr[i]+h_arr[i] : "";
			}
			tt_arr[ii] = rt;
		}
		return tt_arr.join("\r\n");
	}
	static function en_sort(_arr:Array):String {
		var end_arr:Array = [];
		var tmp_arr:Array = [];
		var tmp1_arr:Array = [];
		var tmp_str:String = "";
		var r_arr:Array = _arr;
		if (r_arr.length>1) {
			for (var i = 0; i<_arr.length; i++) {
				if (r_arr[i] == " " || r_arr[i] == ":" || r_arr[i] == ";" || r_arr[i] == "-" || r_arr[i] == "," || r_arr[i] == "." || r_arr[i] == "\"") {
					for (var j = i; (r_arr[j] == " " || r_arr[j] == ":" || r_arr[j] == ";" || r_arr[j] == "-" || r_arr[j] == "," || r_arr[j] == "." || r_arr[j] == "\"") && j<r_arr.length; j++) {
						tmp_arr.push(r_arr.splice(j, 1, "%"));
						i++;
					}
					tmp_arr.reverse();
					tmp_str = tmp_arr.join("");
					tmp1_arr.splice(0, 1, r_arr.join(""));
					tmp_arr.splice(0);
				}
				end_arr.push(tmp_str);
				end_arr.reverse();
				tmp_str = "";
			}
			tmp1_arr = tmp1_arr.toString().split("");
			for (var i = 0; i<tmp1_arr.length; i++) {
				if (tmp1_arr[i] == "%" && tmp1_arr[i+1] == "%") {
					tmp1_arr.splice(i+1, 1);
					i--;
				}
			}
			for (var i = 0; i<tmp1_arr.length; i++) {
				if (tmp1_arr[i] == "%") {
					tmp1_arr[i] = end_arr.splice(0, 1);
				}
			}
			tmp_str = tmp1_arr.join("");
		} else {
			tmp_str = r_arr.join("");
		}
		return tmp_str;
	}
}
__________________
Hell is the possibility of sanity


Последний раз редактировалось wvxvw; 09.11.2006 в 04:48.
Старый 09.11.2006, 05:15
iNils вне форума Посмотреть профиль Отправить личное сообщение для iNils Посетить домашнюю страницу iNils Найти все сообщения от iNils
  № 2  
Ответить с цитированием
iNils
Негуру
 
Аватар для iNils

администратор
Регистрация: Jan 2000
Адрес: Кёнигсберг in Moscow
Сообщений: 21,883
Записей в блоге: 7
Было бы не плохо выложить пример исходного текста иврита в перемешку с латиницей и что из этого должно получится.
__________________
(и)Нильс.ru | Плагины для FlashDevelop

Старый 09.11.2006, 09:29
7thsky™ вне форума Посмотреть профиль Отправить личное сообщение для 7thsky™ Найти все сообщения от 7thsky™
  № 3  
Ответить с цитированием
7thsky™
Flash Aксакал
 
Аватар для 7thsky™

Регистрация: Jun 2005
Сообщений: 636
Есть зеркальные шрифты, спроси любого кто пользуется фрихандом.

твоя проблема очень просто решается с зеркальными шрифтами.

1. Устанавливается фонт зеркальный
2. текстовое поле флипится по вертикали
3. пробегаешься по тексту находишь английские слова и меняешь порядок букв на обратный

единственное но. фонт должен быть включен в свф

С невключенными шрифтами, сложнее...

Старый 09.11.2006, 11:05
wvxvw вне форума Посмотреть профиль Отправить личное сообщение для wvxvw Найти все сообщения от wvxvw
  № 4  
Ответить с цитированием
wvxvw
Modus ponens
 
Аватар для wvxvw

модератор форума
Регистрация: Jul 2006
Адрес: #1=(list #1#)
Сообщений: 8,049
Записей в блоге: 38
2 7thsky:
Да оно конечно хорошо, когда есть иксовые фонты =) а когда нет? А заказчику нужен, ну вот хоть застрелись, именно этот (он его купил, например =). Я могу переделать шрифт в фонтографере... но это кучу времени займет... (Кроме того, копирайты всякие... а если я случайно шрифт моего бывшего бывшего преподавателя "сопру"? Не красиво как-то) Если делать по-уму, то нужно делать битмапы хотябы под 2-5 разных размеров, (пиксельные метрики шрифтов) - это у меня как минимум неделя уйдет.

Да, речь идет именно об фонте включенном в СВФ.
ЗЫ. Пользуюсь фрихендом, очень активно =)

2 iNils:
Чуть попозже выложу, надо еще придумать как =)
__________________
Hell is the possibility of sanity

Старый 09.11.2006, 17:44
7thsky™ вне форума Посмотреть профиль Отправить личное сообщение для 7thsky™ Найти все сообщения от 7thsky™
  № 5  
Ответить с цитированием
7thsky™
Flash Aксакал
 
Аватар для 7thsky™

Регистрация: Jun 2005
Сообщений: 636
Если заказчик купил этот шрифт и он на ифрите, то практически сто пудово что есть его аналог Х, так что убеди его купить.

Потом поищи на flashoo.co.il, я помню там Mattman вроде выкладывал готовое решение.

Потом решение с текстом ОБЯЗАННО быть привязанно к текстовому полю, так как тебе еще надо разбивать на строки и менять их очередность.
Я давным давно это делал как то если найду вечером дома то вышлю если нужно

Старый 09.11.2006, 20:55
wvxvw вне форума Посмотреть профиль Отправить личное сообщение для wvxvw Найти все сообщения от wvxvw
  № 6  
Ответить с цитированием
wvxvw
Modus ponens
 
Аватар для wvxvw

модератор форума
Регистрация: Jul 2006
Адрес: #1=(list #1#)
Сообщений: 8,049
Записей в блоге: 38
Код:
_root.win = new Uwindow(_str);
var tl:TXTLoader = new TXTLoader("texts/contact.txt");
		tl.onData = function(_str:String) {
			var res_str:String = "";
			var t_arr:Array = _str.split("\r\n");
			for (var ii = 0; ii<t_arr.length; ii++) {
				var tmp_arr:Array = t_arr[ii].split(" ");
				for (var i = -1; i<tmp_arr.length-1; ) {
					if (tmp_arr.length>3) {
						res_str += tmp_arr.splice(0, 4).join(" ")+"\r\n";
					} else {
						res_str += tmp_arr.join(" ")+"\r\n";
						tmp_arr = [];
					}
				}
				res_str += "\r\n";
			}
			while (res_str.substr(-2) == "\r\n") {
				res_str = res_str.substring(0, res_str.length-2);
			}
			_root.win.createScrollField(HebrewConvertor.conv(res_str), {XX:10, YY:60}, {W:Stage.width-20, H:100}, _root.greenTF);
Ну это для начала привязка к текстовому полю. Сорри, вырвал из контекста, вобщем:
Uwindow - мой класс создающий страницу сайта
TXTLoader - класс-загрузчик текстов
_root.win.createScrollField() метод класса Uwindow создающий текстовое поле с некоторыми нужными мне изменениями.

Вот, попробую наглядно объяснить:
Вложение 15718
Это так будет отображаться текст если ничего с ним не делать, используя системные шрифты. В большинстве случаев - это просто не приемлимо, прочитать вообще не возможно. Единственный вариант, который более-менее читается - "_sans"

Вложение 15717
Кроме этого есть неприятность с выделением как созданным вручную, так и програмно, выделенная область переворачивается зеркально.

Вложение 15719
Так выглядит все тот же текст отрендеренный с помощью встроенных (библиотечных) шрифтов. С использованием функции-конвертора из первого поста.

Вложение 15716
Так выглядел бы сконвертированный текст, если бы отображался с помощбю системных шрифтов

Вложение 15720
Так выглядит текст, если его не конвертировать, но использовать при этом для рендеринга встроенный шрифт
__________________
Hell is the possibility of sanity


Последний раз редактировалось wvxvw; 27.04.2008 в 22:16.
Старый 09.11.2006, 21:09
iNils вне форума Посмотреть профиль Отправить личное сообщение для iNils Посетить домашнюю страницу iNils Найти все сообщения от iNils
  № 7  
Ответить с цитированием
iNils
Негуру
 
Аватар для iNils

администратор
Регистрация: Jan 2000
Адрес: Кёнигсберг in Moscow
Сообщений: 21,883
Записей в блоге: 7
Я говорил про текстовые файлы, то есть сделать *.txt в utf-8. Так как я ни чего не понимаю в иврите, то желательно подобрать символы весьма различные по написанию + немного латинских. Одной строчки будет достаточно.
__________________
(и)Нильс.ru | Плагины для FlashDevelop


Последний раз редактировалось iNils; 09.11.2006 в 21:12.
Старый 09.11.2006, 21:09
wvxvw вне форума Посмотреть профиль Отправить личное сообщение для wvxvw Найти все сообщения от wvxvw
  № 8  
Ответить с цитированием
wvxvw
Modus ponens
 
Аватар для wvxvw

модератор форума
Регистрация: Jul 2006
Адрес: #1=(list #1#)
Сообщений: 8,049
Записей в блоге: 38
2 7thSky:
Вроде искал... видно плохо искал.
А по поводу иксовых шрифтов... Ну, если честно... плохое это решение.
Из наверное сотни, которые у меня есть, половина вообще не в той раскладке, у части не хватает каких-нибудь символов, у некоторых отсутствуют напрочь латиница или спецсимволы. Наверное только у десяти из них сделаны битовые карты (при маленьком кегле просто невозможно использовать что-нибудь кроме битмаповской отрисовки). Но и у той части, у которой эти карты таки да есть, они зачастую автосгенеренные фонтографером - опять же, гадость.
Того же несчастного Наркиса-тама у меня наверное 5 вариантов, и только 1 более-менее рабочий.
А по поводу купить-заказать сделать хороший шрифт - так я только за =) Вот ток не всегда получается уламать заказчика =)... да и времени не всегда хватает.
__________________
Hell is the possibility of sanity

Старый 09.11.2006, 21:14
wvxvw вне форума Посмотреть профиль Отправить личное сообщение для wvxvw Найти все сообщения от wvxvw
  № 9  
Ответить с цитированием
wvxvw
Modus ponens
 
Аватар для wvxvw

модератор форума
Регистрация: Jul 2006
Адрес: #1=(list #1#)
Сообщений: 8,049
Записей в блоге: 38
Вложение 15721
Вот, в таком виде оно приходит от заказчика

Вложение 15722
Вот так надо отрисовать

Сорри, не подумал
__________________
Hell is the possibility of sanity


Последний раз редактировалось wvxvw; 27.04.2008 в 22:16.
Старый 09.11.2006, 21:25
iNils вне форума Посмотреть профиль Отправить личное сообщение для iNils Посетить домашнюю страницу iNils Найти все сообщения от iNils
  № 10  
Ответить с цитированием
iNils
Негуру
 
Аватар для iNils

администратор
Регистрация: Jan 2000
Адрес: Кёнигсберг in Moscow
Сообщений: 21,883
Записей в блоге: 7
А можно все таки сделать пример с одной строчкой символов на 20 в перемешку с латиницей, еще символов 5, (до и после), а то я уже глаза сломал
__________________
(и)Нильс.ru | Плагины для FlashDevelop

Создать новую тему Ответ Часовой пояс GMT +4, время: 13:46.
Быстрый переход
  « Предыдущая тема | Следующая тема »  

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.


 


Часовой пояс GMT +4, время: 13:46.


Copyright © 1999-2008 Flasher.ru. All rights reserved.
Работает на vBulletin®. Copyright ©2000 - 2026, Jelsoft Enterprises Ltd. Перевод: zCarot
Администрация сайта не несёт ответственности за любую предоставленную посетителями информацию. Подробнее см. Правила.