Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Цифровая обработка текста... 
:(
    Опции темы
goblin
Дата 8.12.2003, 15:15 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 27
Регистрация: 31.5.2003

Репутация: нет
Всего: нет



Народ подскажите где инфы надыбать по этой теме...
Заранее благодарен...
PM MAIL ICQ   Вверх
podval
Дата 8.12.2003, 20:59 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



На столь глобально поставленный вопрос за ответом даже к гадалке не ходи.
Нельзя ли поконкретнее, что именно ищем?
PM WWW ICQ   Вверх
val
Дата 9.12.2003, 15:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Program developer
**


Профиль
Группа: Участник Клуба
Сообщений: 992
Регистрация: 14.1.2003
Где: г. Киев

Репутация: 1
Всего: 7



Мне кажется, что уважаемый goblin имеет ввиду распознавание текста... Так ли, goblin?


--------------------
Терпимость - величайшее благо человечества...
Ярчайший признак интеллекта – постоянно хорошее настроение…
PM MAIL ICQ   Вверх
MuToGeN
Дата 9.12.2003, 17:18 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Лесник
****


Профиль
Группа: Модератор
Сообщений: 4379
Регистрация: 15.8.2002
Где: Москва

Репутация: нет
Всего: 32



на коднете где-то видел пример, определяющий буквы А и Б из растра


--------------------
Three pings for the token rings,
Five pings for the UNIX machines,
Hundred pings for the broken links,
One special ping to check them all
Through Simple Network Management Protocol!
PM MAIL ICQ   Вверх
goblin
Дата 9.12.2003, 18:43 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 27
Регистрация: 31.5.2003

Репутация: нет
Всего: нет



Насамом деле я имел ввиду анализ содержимого текста (определить там тему, идею и тд...)
PM MAIL ICQ   Вверх
podval
Дата 10.12.2003, 21:38 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



На самом деле вполне реальна такая задача: определение тематики текста по ключевым словам.
PM WWW ICQ   Вверх
goblin
Дата 11.12.2003, 05:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 27
Регистрация: 31.5.2003

Репутация: нет
Всего: нет



podval
об этом я знаю и почти реализовал...
но хотелосьбы большего...
PM MAIL ICQ   Вверх
podval
Дата 11.12.2003, 10:19 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Где я? Кто я?
****


Профиль
Группа: Экс. модератор
Сообщений: 3094
Регистрация: 25.3.2002
Где: СПб

Репутация: 18
Всего: 62



А чего именно, хоть в каком направлении?
PM WWW ICQ   Вверх
val
Дата 11.12.2003, 10:39 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Program developer
**


Профиль
Группа: Участник Клуба
Сообщений: 992
Регистрация: 14.1.2003
Где: г. Киев

Репутация: 1
Всего: 7



Цитата
об этом я знаю и почти реализовал...
но хотелосьбы большего...


Так поделись опытом, что и как ты уже сделал, а там попробуем сделать апгрейт?


--------------------
Терпимость - величайшее благо человечества...
Ярчайший признак интеллекта – постоянно хорошее настроение…
PM MAIL ICQ   Вверх
akul
Дата 11.12.2003, 13:45 (ссылка)    |    (голосов: 0) Загрузка ... Загрузка ... Быстрая цитата Цитата


Unregistered











  Вверх
goblin
Дата 12.12.2003, 07:35 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 27
Регистрация: 31.5.2003

Репутация: нет
Всего: нет



podval
Хотелось бы сделать синтаксический анализ текста:

  • Определить тему текста.
  • Определить тип текста.
  • Определить стиль текста.

с подпунктами...

val
Что тебе интересно исходники или сам алгоритм?

akul
Бальшое спасибо...


PM MAIL ICQ   Вверх
val
Дата 12.12.2003, 15:28 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Program developer
**


Профиль
Группа: Участник Клуба
Сообщений: 992
Регистрация: 14.1.2003
Где: г. Киев

Репутация: 1
Всего: 7



Цитата
Что тебе интересно исходники или сам алгоритм?

алгоритм...


--------------------
Терпимость - величайшее благо человечества...
Ярчайший признак интеллекта – постоянно хорошее настроение…
PM MAIL ICQ   Вверх
goblin
Дата 12.12.2003, 17:58 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 27
Регистрация: 31.5.2003

Репутация: нет
Всего: нет



val
Алгоритм прост...
Из текста выбираются слова по законам Зипфа(которые встречаются не слишком часто и не слишком редко), сравниваются со словарями
и словарь с большим количеством совпадений соответствует направлености текста...
PM MAIL ICQ   Вверх
Jey_k
Дата 9.1.2004, 18:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


WEB-командир
****


Профиль
Группа: Комодератор
Сообщений: 4149
Регистрация: 16.11.2003
Где: Москва

Репутация: нет
Всего: 61



По поводу похожей проблемы я писал в Разщработка защиты от спама


--------------------
PM MAIL WWW   Вверх
vertal
Дата 29.1.2004, 01:49 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 2
Регистрация: 29.1.2004

Репутация: нет
Всего: нет



Есть такой алгоритм : сначала для ряда образцовых текстов на интересующие нас темы формируется матрица относительной частоты встречаемости каждого слова в данной тематике , где по строкам "располагаются" слова(основы) , а по столбцам - темы. Для исследуемого текста формируется вектор-строка частоты встречаемости в нем слов(основ )(возможно , с учетом их веса - то есть контекста - напр . , размера шрифта ), которые есть в словаре . Эта вектор -строка перемножается на матрицу , в результате мы имеем вектор-строку , где порядковый номер наибольшего элемента - порядковый номер наиболее вероятной темы исследуемого текста. Взято из 'Магии ПК' за 2002 г , номера не помню и не могу найти.
PM MAIL   Вверх
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.1209 ]   [ Использовано запросов: 20 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.