![]() |
Модераторы: Daevaorn |
![]() ![]() ![]() |
|
mrgloom |
|
||||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 829 Регистрация: 8.6.2011 Репутация: нет Всего: нет |
читаю
как удалить запятые и точки и т.д.? как исключить предлоги? и как потом найти сколько раз встречается слово в списке? Добавлено через 11 минут и 2 секунды нашел такой код,работает, но не совсем, то что нужно.
|
||||
|
|||||
mrgloom |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 829 Регистрация: 8.6.2011 Репутация: нет Всего: нет |
ну могу заставить видеть русские слова
в начале объявил # -*- coding: cp1251 -*- пробовал p = re.compile("\w+") p = re.compile("u'[а-яА-Я0-9-]+|[.,:;?!]+'") Добавлено через 1 минуту и 15 секунд так вроде заработало re.compile("[а-яА-Я0-9-]+|[.,:;?!]+") |
|||
|
||||
Backward |
|
|||
Новичок Профиль Группа: Участник Сообщений: 27 Регистрация: 5.6.2007 Репутация: 2 Всего: 2 |
Предлоги сами уберите. |
|||
|
||||
mrgloom |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 829 Регистрация: 8.6.2011 Репутация: нет Всего: нет |
использую такой вот код, а как добавить исключающие слова?
через re.compile?
|
|||
|
||||
Carlos0N |
|
|||
Шустрый ![]() Профиль Группа: Участник Сообщений: 73 Регистрация: 9.10.2007 Репутация: нет Всего: 1 |
Запятые и точки можно так к примеру убрать если не ошибаюсь
Убрать предлоги можно сравнивая слова со словарем, думаю тут сам справишься, т.к. составлять словарь из предлогов, а наверное ещё и союзов с частицами и междометиями мне лень. Есть правда куда более удобный способ - юзать pymorphy. Очень полезная библиотека для обработки текста. Это сообщение отредактировал(а) Carlos0N - 3.11.2012, 23:27 |
|||
|
||||
![]() ![]() ![]() |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Python: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |