Модераторы: Rickert
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Можно ли определить пол автора, по тексту с использованием НС 
:(
    Опции темы
daNick
Дата 3.1.2010, 23:21 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 114
Регистрация: 12.8.2006
Где: Казахстан, Астана

Репутация: нет
Всего: нет



В прошлом году одному из одногруппников было предложена тема курсовой, что-то вроде "Определение пола автора по тексту". Сейчас, спустя год, когда я начал самостоятельно ковыряться в нейронных сетях, меня заинтересовало: а возможно ли с помощью нейронных сетей решить эту задачу? То бишь, можно ли построить и обучить НС, которая будет определять с высокой степенью вероятности пол автора?
В случае положительного ответа, интересно, как подавать сети на вход текст? (совсем недавно начал изучать НС, пока о возможностях применения мало осведомлен smile 
--------------------
Долго не кончать - преимущество мужчины, а не оратора.Я так много читал о вреде курения, что решил бросить... читать.(с) Сергей Довлатов
PM MAIL ICQ   Вверх
VictorTsaregorodtsev
Дата 4.1.2010, 01:40 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 274
Регистрация: 28.7.2006

Репутация: нет
Всего: 8



Возможно, но только в случае получения реально отделимых друг от друга классов. Т.е. надо, чтобы в многомерном пространстве признаков-переменных (которые "извлечены" из текста и поданы на вход сети) рядом с какой-то точкой одного класса находились преимущественно точки этого же самого класса, и так для всех точек (примеров, векторов) выборки. "Девочки - налево, мальчики - направо", если говорить образно. Если такое будет достижимо, то и нейросети сработают, и статистика (если линейного дискриминанта не хватит, то см. на байесы, полиномиальные разделяющие поверхности, непараметрику), и машины опорных векторов, и МГУА. Т.е. от нейросетей всё тут будет зависеть в последнюю очередь (на хорошо разделимой выборке надо будет только подобрать размер сети и настройки алгоритма обучения).

В общем, всё упирается в получение репрезентативной и довольно хорошо разделимой выборки числовых данных из корпуса текстов. Как оцифровывать текст - ищите сами (мне основы и хитрости рассказывать лень, да и я на хитростях деньги зарабатываю). В конце концов, есть нейросетевые фильтры спама, есть автоматические рубрикаторы новостей, есть работающая с текстами подобласть data mining'а - значит, люди умеют и справляются. 

Это сообщение отредактировал(а) VictorTsaregorodtsev - 4.1.2010, 01:42
PM MAIL WWW   Вверх
bilbobagginz
Дата 6.1.2010, 16:57 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Naughtius Maximus
****


Профиль
Группа: Экс. модератор
Сообщений: 8813
Регистрация: 2.3.2004
Где: Israel

Репутация: нет
Всего: 317



Цитата(VictorTsaregorodtsev @  4.1.2010,  00:40 Найти цитируемый пост)
значит, люди умеют и справляются. 

не на 100%.




--------------------
Я ещё не демон. Я только учусь.
PM WWW   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Программирование игр, графики и искуственного интеллекта"
Rickert

НА ЗЛОБУ ДНЯ: Дорогие посетители, прошу обратить внимание что новые темы касающиеся новых вопросов создаются кнопкой "Новая тема" а не "Ответить"! Любые оффтопиковые вопросы, заданные в текущих тематических темах будут удалены а их авторы, при рецедиве, забанены.

  • Литературу, связанную с программированием графики, обсуждаем здесь
  • Действия модераторов можно обсудить здесь
  • С просьбами о написании курсовой, реферата и т.п. обращаться сюда
  • Вопросы связанные с программированием графики и мультимедии на языках С++ и Delphi
  • Вопросы по реализации алгоритмов рассматриваются здесь

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, Rickert.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Программирование игр, графики и искусственного интеллекта | Следующая тема »


 




[ Время генерации скрипта: 0.0632 ]   [ Использовано запросов: 20 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.