Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате |
Форум программистов > Python: Общие вопросы > Закон Ципфа |
Автор: Anriuser 19.12.2016, 18:01 |
Добрый вечер. Вообщем есть реализирован первый который строит гистограму по словам в тексте. "Измерим количество вхождений каждого слова в текст и возьмем только одно значение из каждой группы, имеющей одинаковую частоту. Расположим частоты по мере их убывания и пронумеруем, порядковый номер частоты назовем рангом частоты Выделение ключевых слов в текстовых документах ранг слова Выделение ключевых слов в текстовых документах). Наиболее часто встречающиеся слова будут иметь ранг 1, следующие за ними – 2 и так далее" Первое это проблема с кодировкой: На графике легенда отображается неправильно. Если я удалю эти строки reload(sys) sys.setdefaultencoding('Cp1252') Выдается ошибка при построении на русском и украинском языке. Нужно сделать тчоб график на любом языке нормально рисовался. Второе: Нужно построить второй график, отложив по оси абсцисс частоту вхождения слова, а по оси ординат – количество слов в данной частоте. Проект прикрепил |
Автор: Anriuser 20.12.2016, 00:13 |
Спасибо что скачали хоть глянуть. Если есть вопросы по самом законе то напишите |
Автор: Anriuser 20.12.2016, 00:13 |
Ато у меня там в реферате все пишет |
Автор: baldman88 20.12.2016, 22:07 | ||
Какая ОС? Для работы с не ASCII символами лучше использовать UTF-8 (в Windows проще всего сохранять в чем-то вроде Notepad++, и выставлять кодировку в UTF-8). Вот так, вроде, работает (если кириллический текст сохранен в UTF-8):
И да, я там немного поменял диапазон для Y (начинается с 1, а не с 0), так как взятие логарифма от 0 плохая идея. По второму пункту я ничего не понял. Добавлено @ 22:16 Пы.Сы.: Сам когда-то помучался делая изображения для презентаци на защиту диплома с подписями на кириллице (нормоконтроль потребовал ![]() |
Автор: Anriuser 24.12.2016, 17:08 |
Спачибо большое вам, сейчас проверю думал уже никто не поможет) |
Автор: Anriuser 24.12.2016, 17:08 |
Ну второй я вроде сам уже доделал |
Автор: Anriuser 24.12.2016, 17:26 |
Я в пайтоне 3.5.2 вообщем ошибка там file = builtins.open(filename, mode, buffering) PermissionError: [Errno 13] Permission denied: 'C:/Users/User/Desktop/zipf' |
Автор: Anriuser 24.12.2016, 17:26 |
Я в пайтоне 3.5.2 вообщем ошибка там file = builtins.open(filename, mode, buffering) PermissionError: [Errno 13] Permission denied: 'C:/Users/User/Desktop/zipf' |
Автор: Anriuser 24.12.2016, 17:46 |
Заработало, пайтон 2.7 юзаю, сам незнаю что было вам большое спасибо за решение. Со вторым я уже сам поекспериментирую |
Автор: baldman88 24.12.2016, 22:49 | ||
Кстати, в моем коде не учтен один момент: если в тексте есть дефисы и тире, то после сравнения с string.punctuation в my_dictionary будут добавляться пустые строки. Лучше переделать так:
|
Автор: Anriuser 25.12.2016, 00:30 |
щяс сделаем спасибо Добавлено через 31 секунду baldman88, как тут чтоли лайк вам поставить ?))) Ато я тут недавно ) |
Автор: baldman88 25.12.2016, 12:11 |
Большого человеческого спасибо вполне достаточно. Просто тоже старайтесь помогать другим, по возможности ![]() |