![]() |
Модераторы: korob2001, ginnie |
![]() ![]() ![]() |
|
Bulat |
|
|||
![]() татарский Нео ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1701 Регистрация: 22.3.2006 Где: Альметьевск Репутация: 5 Всего: 57 |
Постановка задачи проста, нужно определить на каком языке исходный текст.
В голове крутится один корявый способ, но более пока ничего... ![]() -------------------- менеджер по кодеврайтингу ![]() |
|||
|
||||
tishaishii |
|
|||
![]() Создатель ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1262 Регистрация: 14.2.2006 Где: Москва Репутация: 4 Всего: 8 |
А если на тарабарском и в тарабарском традиционном письме?
В общем случае - ни как. Можно для каждого языка и наречия написать свой фильтр. |
|||
|
||||
Bulat |
|
|||
![]() татарский Нео ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1701 Регистрация: 22.3.2006 Где: Альметьевск Репутация: 5 Всего: 57 |
tishaishii, ну речь о тарабарском не идет. Речь идет хотя бы об самых распространненых языках. Европейская группа языков, азиатская по возможности, и конечно же русский, украинский и т.п.
А ссылки или маны есть. Или по подробнее об этом P.S. По сути дела речь не идет о всех существующих языках, но хотя бы более или менее распространенные. -------------------- менеджер по кодеврайтингу ![]() |
|||
|
||||
vadiml |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 310 Регистрация: 27.7.2007 Репутация: 5 Всего: 7 |
берутся словари нужных языков (напр. aspell), загоняются в базу или несколько хешей и по ним сличаются слова на наличие (на вхождение),
С каким языком больше совпадений ... чем больше слов -- тем точнее результат есть одно НО -- в некоторых языках одну заковыристую букву могут обозначать 2-3 обычными буквами, например в немецком ss очень часто означает ß (но не всегда ![]() поэтому желательно иметь словари со всеми вариациями написания -- Есть еще один вариант -- посмотреть исходный код программы xneur ( http://xneur.ru/ ) там создаются словари недопустимых сочетаний (для 6 языков уже есть в программе) Такие словари получаются гораздо меньше размером, но если текст, на основе которого создается словари, мал, то будет много ошибок (похоже такая ситуация возникнет в v.0.8 с казахским языком, Андрей, который сейчас ведет эту программу, говорил что ему прислали всего 40+ КВ текста, а желательно 1-2 МВ, хотя может уже положение и исправили) |
|||
|
||||
amg |
|
|||
Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1145 Регистрация: 3.8.2006 Где: Новосибирск Репутация: 38 Всего: 50 |
|
|||
|
||||
Bulat |
|
|||
![]() татарский Нео ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1701 Регистрация: 22.3.2006 Где: Альметьевск Репутация: 5 Всего: 57 |
amg, уже заюзал, и не один, правда они чуток косячные... В итоге все свелось к он-лайн переводчику гугла, через проксю, работает не так быстро, но зато без косяков, по крайней мере пока
![]() ![]() -------------------- менеджер по кодеврайтингу ![]() |
|||
|
||||
shamber |
|
|||
![]() Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1422 Регистрация: 5.9.2006 Где: Россия Репутация: 17 Всего: 18 |
![]() Bulat, всякие там людишки, писали, что Google в скором времени картиночку введут, так что готовися ![]() ![]() |
|||
|
||||
Bulat |
|
|||
![]() татарский Нео ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1701 Регистрация: 22.3.2006 Где: Альметьевск Репутация: 5 Всего: 57 |
shamber, это даже хорошо, а то знаешь ли, сниффер + перл + чуть-чуть мозгов, и даже скучно становится. Мой модуль с он-лайн переводчиком гугла строк 20, может 30 занимает... А так хоть какое разнообразие
![]() -------------------- менеджер по кодеврайтингу ![]() |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Perl" | |
|
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Perl: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |