![]() |
|
![]() ![]() ![]() |
|
Jin X |
|
||||
![]() Бывалый ![]() Профиль Группа: Участник Сообщений: 157 Регистрация: 5.3.2004 Репутация: нет Всего: 1 |
Если кто знаком с настройкой Яндекс.Директа, там есть такая тема.
Создаём большой пул поисковых фраз, ранее вводимых пользователями, а затем нужно найти минус-слова, т.е. слова, которые не подходят по тематике. Если "скачать", "порно", "реферат" и т.п. - это универсальные минус-слова (ну ещё можно города минусовать), то как найти остальные? Или хотя бы собрать большое кол-во и предложить пользователю. Чтобы было понятно, например. Тематика продажа авто. Запрос "купить авто" (новые). Найденные фразы:
явные минус-слова:
Здесь всего сотня фраз, их можно отобрать вручную, но на делеих может быть десятки и даже сотни тысяч! Поэтому и нужна автоматизация... Как это можно сделать? --------------------
Бойся своей мечты, ибо она осуществима! |
||||
|
|||||
nworm |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 502 Регистрация: 22.10.2005 Репутация: 4 Всего: 8 |
Задача классификации.
Пример алгоритма решения - наивный байессовский классификатор. Ему на вход поступают 2-а множества фраз. 1-е множество. Те фразы, которые плохие. 2-е множество. Те фразы, которые хорошие. Классификатор строит словарь плохих и хороших слов. Но нужно всё равно строить вручную входные данные - множества плохих и хороших фраз. Десятки тысяч фраз - это лингвисту (у которого в школе было 5 по математике) не так и на долго. По паре сотен оригинальных фраз в час. Затем повторы пойдут. Вообще, в таких задачах ручные способы не так и плохо проходят. Это сообщение отредактировал(а) nworm - 30.6.2015, 17:44 |
|||
|
||||
Akina |
|
|||
Советчик ![]() ![]() ![]() ![]() Профиль Группа: Модератор Сообщений: 20581 Регистрация: 8.4.2004 Где: Зеленоград Репутация: 20 Всего: 454 |
Это для тебя они почему-то явные. Алгоритмически они вовсе даже не явные - до тех пор пока ты не подключишь смысловой анализатор (где бы ещё взять такой), который способен понять, что новые авто не бывают подержанными или там с пробегом... -------------------- О(б)суждение моих действий - в соответствующей теме, пожалуйста. Или в РМ. И высшая инстанция - Администрация форума. |
|||
|
||||
Jin X |
|
|||
![]() Бывалый ![]() Профиль Группа: Участник Сообщений: 157 Регистрация: 5.3.2004 Репутация: нет Всего: 1 |
В том-то и сложность...
--------------------
Бойся своей мечты, ибо она осуществима! |
|||
|
||||
Akina |
|
|||
Советчик ![]() ![]() ![]() ![]() Профиль Группа: Модератор Сообщений: 20581 Регистрация: 8.4.2004 Где: Зеленоград Репутация: 20 Всего: 454 |
Jin X, подумай вот в каком направлении.
Вот есть некий запрос (набор слов), он даёт некий результат. Добавим к этому запросу слово, которое нам нужно тестировать, и получим второй результат. Теперь сравним результаты. Вариант 1. Результаты практически идентичны (отсев составляет буквально проценты). Вывод - данное слово является словом-паразитом. Вариант 2. Результат зримо сократился, при этом его релевантность повысилась. Вывод - данное слово является важно-смысловым. Вариант 3. Результат зримо сократился, при этом его релевантность не изменилась. Вывод - данное слово является смысловым. Вариант 4. Результат зримо сократился, при этом его релевантность понизилась. Вывод - данное слово является нерелевантным. Это, конечно, не методика выявления минус-слов, но на кое-какие размышления навести может. А если обработать влияние некоего слова на массив начальных заведомо релевантных запросов - то результаты будут достойны принятия решения. -------------------- О(б)суждение моих действий - в соответствующей теме, пожалуйста. Или в РМ. И высшая инстанция - Администрация форума. |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Алгоритмы" | |
|
Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000. |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Алгоритмы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |