![]() |
|
![]() ![]() ![]() |
|
goblin |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 27 Регистрация: 31.5.2003 Репутация: нет Всего: нет |
Народ подскажите где инфы надыбать по этой теме...
Заранее благодарен... |
|||
|
||||
podval |
|
|||
![]() Где я? Кто я? ![]() ![]() ![]() ![]() Профиль Группа: Экс. модератор Сообщений: 3094 Регистрация: 25.3.2002 Где: СПб Репутация: 18 Всего: 62 |
На столь глобально поставленный вопрос за ответом даже к гадалке не ходи.
Нельзя ли поконкретнее, что именно ищем? |
|||
|
||||
val |
|
|||
![]() Program developer ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 992 Регистрация: 14.1.2003 Где: г. Киев Репутация: 1 Всего: 7 |
Мне кажется, что уважаемый goblin имеет ввиду распознавание текста... Так ли, goblin?
-------------------- Терпимость - величайшее благо человечества... Ярчайший признак интеллекта – постоянно хорошее настроение… |
|||
|
||||
MuToGeN |
|
|||
![]() Лесник ![]() ![]() ![]() ![]() Профиль Группа: Модератор Сообщений: 4379 Регистрация: 15.8.2002 Где: Москва Репутация: нет Всего: 32 |
на коднете где-то видел пример, определяющий буквы А и Б из растра
-------------------- Three pings for the token rings, Five pings for the UNIX machines, Hundred pings for the broken links, One special ping to check them all Through Simple Network Management Protocol! |
|||
|
||||
goblin |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 27 Регистрация: 31.5.2003 Репутация: нет Всего: нет |
Насамом деле я имел ввиду анализ содержимого текста (определить там тему, идею и тд...)
|
|||
|
||||
podval |
|
|||
![]() Где я? Кто я? ![]() ![]() ![]() ![]() Профиль Группа: Экс. модератор Сообщений: 3094 Регистрация: 25.3.2002 Где: СПб Репутация: 18 Всего: 62 |
На самом деле вполне реальна такая задача: определение тематики текста по ключевым словам.
|
|||
|
||||
goblin |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 27 Регистрация: 31.5.2003 Репутация: нет Всего: нет |
podval
об этом я знаю и почти реализовал... но хотелосьбы большего... |
|||
|
||||
podval |
|
|||
![]() Где я? Кто я? ![]() ![]() ![]() ![]() Профиль Группа: Экс. модератор Сообщений: 3094 Регистрация: 25.3.2002 Где: СПб Репутация: 18 Всего: 62 |
А чего именно, хоть в каком направлении?
|
|||
|
||||
val |
|
|||
![]() Program developer ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 992 Регистрация: 14.1.2003 Где: г. Киев Репутация: 1 Всего: 7 |
Так поделись опытом, что и как ты уже сделал, а там попробуем сделать апгрейт? -------------------- Терпимость - величайшее благо человечества... Ярчайший признак интеллекта – постоянно хорошее настроение… |
|||
|
||||
akul |
|
|||
Unregistered |
||||
|
||||
goblin |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 27 Регистрация: 31.5.2003 Репутация: нет Всего: нет |
podval
Хотелось бы сделать синтаксический анализ текста:
с подпунктами... val Что тебе интересно исходники или сам алгоритм? akul Бальшое спасибо... |
|||
|
||||
val |
|
|||
![]() Program developer ![]() ![]() Профиль Группа: Участник Клуба Сообщений: 992 Регистрация: 14.1.2003 Где: г. Киев Репутация: 1 Всего: 7 |
алгоритм... -------------------- Терпимость - величайшее благо человечества... Ярчайший признак интеллекта – постоянно хорошее настроение… |
|||
|
||||
goblin |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 27 Регистрация: 31.5.2003 Репутация: нет Всего: нет |
val
Алгоритм прост... Из текста выбираются слова по законам Зипфа(которые встречаются не слишком часто и не слишком редко), сравниваются со словарями и словарь с большим количеством совпадений соответствует направлености текста... |
|||
|
||||
Jey_k |
|
|||
![]() WEB-командир ![]() ![]() ![]() ![]() Профиль Группа: Комодератор Сообщений: 4149 Регистрация: 16.11.2003 Где: Москва Репутация: нет Всего: 61 |
По поводу похожей проблемы я писал в Разщработка защиты от спама
|
|||
|
||||
vertal |
|
|||
Новичок Профиль Группа: Участник Сообщений: 2 Регистрация: 29.1.2004 Репутация: нет Всего: нет |
Есть такой алгоритм : сначала для ряда образцовых текстов на интересующие нас темы формируется матрица относительной частоты встречаемости каждого слова в данной тематике , где по строкам "располагаются" слова(основы) , а по столбцам - темы. Для исследуемого текста формируется вектор-строка частоты встречаемости в нем слов(основ )(возможно , с учетом их веса - то есть контекста - напр . , размера шрифта ), которые есть в словаре . Эта вектор -строка перемножается на матрицу , в результате мы имеем вектор-строку , где порядковый номер наибольшего элемента - порядковый номер наиболее вероятной темы исследуемого текста. Взято из 'Магии ПК' за 2002 г , номера не помню и не могу найти.
|
|||
|
||||
goblin |
|
|||
![]() Новичок Профиль Группа: Участник Сообщений: 27 Регистрация: 31.5.2003 Репутация: нет Всего: нет |
vertal
Можно чуть поподробнее? |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Алгоритмы" | |
|
Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Алгоритмы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |