Модераторы: Daevaorn
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> генерация биграмм 
:(
    Опции темы
darel86
Дата 20.3.2010, 10:27 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 13
Регистрация: 17.3.2010

Репутация: нет
Всего: нет



Здравствуйте.
Подскажите пожалуйста, как генерировать текст на основе вероятности встречаемости символов и биграмм(все значения вероятностей известны,естьи значения вероятности триграмм)?
Например текст без вероятности встречаемости символов можно генерировать так : берём например ГСЧ,генерируем число, берём его по модулю 32,из массива добавляем символ.
А вот с вероятностью как?Помогите пожалуйста.
PM MAIL   Вверх
GoldFinch
Дата 20.3.2010, 11:54 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата



****


Профиль
Группа: Завсегдатай
Сообщений: 2141
Регистрация: 30.11.2008

Репутация: 15
Всего: 26



например задать вероятности как есть массив целых положительных чисел (таблица вероятностей),
брать из ГСЧ число от 0 до N, где N - сумма всех чисел в массиве, потом определять какому символу оно соответствует

т.е. если есть 3 символа с вероятностями 10, 30 и 20
генерим 0< x < (10+30+20), допустим 15, и видим что оно соответствует 2му символу: 10<15<10+30
PM MAIL ICQ   Вверх
darel86
Дата 22.3.2010, 20:09 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 13
Регистрация: 17.3.2010

Репутация: нет
Всего: нет



Спасибо!
Да, так и нужно для частоты встречаемости символов.
Уже пишу.
А как быть с биграммами? Там матрица 32х32 сумма элементов 4985. 
В-принципе можно брать строку текущего символа, вычислить сумму строк до него и после, в этих пределах потом генерировать число,
с последующим выбором, который вы предложили.Но как быть с пробелом его в матрица нет, блин.Или вот: смотреть если "не пробел",то генерить с учётом биграмм, если "пробел",то "пробел" )))).
Может так.Или есть ошибки в моей логике?
PM MAIL   Вверх
darel86
Дата 29.3.2010, 09:57 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 13
Регистрация: 17.3.2010

Репутация: нет
Всего: нет



Так,текст с учётом биграмм у меня генерируется,но вот проблема,частота встречаемости отдельных символов изменилась.
Ну это и понятно, ведь генерируется с учётом биграмм, а не отдельных символов.
Может кто подскажет,как генерировать,чтобы генерация с учётом биграмм выдовала эталонную частоту встречаемости символов.

PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "С++:Общие вопросы"
Earnest Daevaorn

Добро пожаловать!

  • Черновик стандарта C++ (за октябрь 2005) можно скачать с этого сайта. Прямая ссылка на файл черновика(4.4мб).
  • Черновик стандарта C (за сентябрь 2005) можно скачать с этого сайта. Прямая ссылка на файл черновика (3.4мб).
  • Прежде чем задать вопрос, прочтите это и/или это!
  • Здесь хранится весь мировой запас ссылок на документы, связанные с C++ :)
  • Не брезгуйте пользоваться тегами [code=cpp][/code].
  • Пожалуйста, не просите написать за вас программы в этом разделе - для этого существует "Центр Помощи".
  • C++ FAQ

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, Earnest Daevaorn

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | C/C++: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0788 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.