|
Модераторы: Daevaorn |
|
Anriuser |
|
|||
Новичок Профиль Группа: Участник Сообщений: 16 Регистрация: 13.7.2014 Репутация: нет Всего: нет |
Добрый вечер. Вообщем есть реализирован первый который строит гистограму по словам в тексте.
"Измерим количество вхождений каждого слова в текст и возьмем только одно значение из каждой группы, имеющей одинаковую частоту. Расположим частоты по мере их убывания и пронумеруем, порядковый номер частоты назовем рангом частоты Выделение ключевых слов в текстовых документах ранг слова Выделение ключевых слов в текстовых документах). Наиболее часто встречающиеся слова будут иметь ранг 1, следующие за ними – 2 и так далее" Первое это проблема с кодировкой: На графике легенда отображается неправильно. Если я удалю эти строки reload(sys) sys.setdefaultencoding('Cp1252') Выдается ошибка при построении на русском и украинском языке. Нужно сделать тчоб график на любом языке нормально рисовался. Второе: Нужно построить второй график, отложив по оси абсцисс частоту вхождения слова, а по оси ординат – количество слов в данной частоте. Проект прикрепил Присоединённый файл ( Кол-во скачиваний: 1 ) ZipfTest.rar 1,60 Kb |
|||
|
||||
Anriuser |
|
|||
Новичок Профиль Группа: Участник Сообщений: 16 Регистрация: 13.7.2014 Репутация: нет Всего: нет |
Спасибо что скачали хоть глянуть. Если есть вопросы по самом законе то напишите
|
|||
|
||||
Anriuser |
|
|||
Новичок Профиль Группа: Участник Сообщений: 16 Регистрация: 13.7.2014 Репутация: нет Всего: нет |
Ато у меня там в реферате все пишет
Это сообщение отредактировал(а) Anriuser - 20.12.2016, 00:14 |
|||
|
||||
baldman88 |
|
|||
Бывалый Профиль Группа: Участник Сообщений: 210 Регистрация: 18.1.2009 Репутация: 2 Всего: 7 |
Какая ОС? Для работы с не ASCII символами лучше использовать UTF-8 (в Windows проще всего сохранять в чем-то вроде Notepad++, и выставлять кодировку в UTF-8).
Вот так, вроде, работает (если кириллический текст сохранен в UTF-8):
И да, я там немного поменял диапазон для Y (начинается с 1, а не с 0), так как взятие логарифма от 0 плохая идея. По второму пункту я ничего не понял. Добавлено @ 22:16 Пы.Сы.: Сам когда-то помучался делая изображения для презентаци на защиту диплома с подписями на кириллице (нормоконтроль потребовал ). Это сообщение отредактировал(а) baldman88 - 21.12.2016, 13:50 |
|||
|
||||
Anriuser |
|
|||
Новичок Профиль Группа: Участник Сообщений: 16 Регистрация: 13.7.2014 Репутация: нет Всего: нет |
Спачибо большое вам, сейчас проверю думал уже никто не поможет)
|
|||
|
||||
Anriuser |
|
|||
Новичок Профиль Группа: Участник Сообщений: 16 Регистрация: 13.7.2014 Репутация: нет Всего: нет |
Ну второй я вроде сам уже доделал
Это сообщение отредактировал(а) Anriuser - 24.12.2016, 17:09 |
|||
|
||||
Anriuser |
|
|||
Новичок Профиль Группа: Участник Сообщений: 16 Регистрация: 13.7.2014 Репутация: нет Всего: нет |
Я в пайтоне 3.5.2 вообщем ошибка там file = builtins.open(filename, mode, buffering)
PermissionError: [Errno 13] Permission denied: 'C:/Users/User/Desktop/zipf' |
|||
|
||||
Anriuser |
|
|||
Новичок Профиль Группа: Участник Сообщений: 16 Регистрация: 13.7.2014 Репутация: нет Всего: нет |
Я в пайтоне 3.5.2 вообщем ошибка там file = builtins.open(filename, mode, buffering)
PermissionError: [Errno 13] Permission denied: 'C:/Users/User/Desktop/zipf' |
|||
|
||||
Anriuser |
|
|||
Новичок Профиль Группа: Участник Сообщений: 16 Регистрация: 13.7.2014 Репутация: нет Всего: нет |
Заработало, пайтон 2.7 юзаю, сам незнаю что было вам большое спасибо за решение. Со вторым я уже сам поекспериментирую
|
|||
|
||||
baldman88 |
|
|||
Бывалый Профиль Группа: Участник Сообщений: 210 Регистрация: 18.1.2009 Репутация: 2 Всего: 7 |
Кстати, в моем коде не учтен один момент: если в тексте есть дефисы и тире, то после сравнения с string.punctuation в my_dictionary будут добавляться пустые строки. Лучше переделать так:
|
|||
|
||||
Anriuser |
|
|||
Новичок Профиль Группа: Участник Сообщений: 16 Регистрация: 13.7.2014 Репутация: нет Всего: нет |
щяс сделаем спасибо
Добавлено через 31 секунду baldman88, как тут чтоли лайк вам поставить ?))) Ато я тут недавно ) |
|||
|
||||
baldman88 |
|
|||
Бывалый Профиль Группа: Участник Сообщений: 210 Регистрация: 18.1.2009 Репутация: 2 Всего: 7 |
Большого человеческого спасибо вполне достаточно. Просто тоже старайтесь помогать другим, по возможности
|
|||
|
||||
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Python: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |