Добро пожаловать, гость
:: алгоритмы  и методы :: :: олимпиадные задачи :: :: связь :: :: о сайте :: :: форум ::

Форум работает в режиме архива, только для чтения и поиска.
Архив 2004 Архив 2007 Архив 2013

 
 
Опции темы Поиск в этой теме Опции просмотра
  #1  
Старый 29.10.2009, 21:22
Новичок

Отправить личное сообщение для lafaforaster Посмотреть профиль Найти все сообщения от lafaforaster
 
Регистрация: 29.10.2009
Сообщений: 2

частотный анализ текста
Здравствуйте!
Посоветуйте как лучше решить задачу (или просто решить) Есть текст записанный при помощи простой замены, нужно по нему определить исходный, допустимы погрешности.
  #2  
Старый 29.10.2009, 21:48
гость

 
Сообщений: n/a

char str[] = "text", *ptr = str;
int hist[ 256 ] = { 0 };
while( *ptr ) hist[ *ptr++ ]++;

Вот подсчет частоты символов, дальше тебе просто нужно отсортировать по убыванию и сравнить со средними значениями для русского языка, также отсортированными.
  #3  
Старый 30.10.2009, 09:23
Новичок

Отправить личное сообщение для lafaforaster Посмотреть профиль Найти все сообщения от lafaforaster
 
Регистрация: 29.10.2009
Сообщений: 2

Сообщение от гость
отсортировать по убыванию и сравнить со средними значениями для русского языка, также отсортированными.
к сожалению частоты в тексте могут не совподать со средним значением, это может быть из-за длинны текста или его особенностей (пр. функция, дифференциал, коэффициент и значение быквы ф в тексте значительно выше среднего)
Можно, наверное, для начала так поступить с 10ю самыми популярными буквами алфовита (хотя тоже будут ошибки) а затем делать анализ на основании биграмм и триграмм (сочетание букв). Вот только как
 


Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Алгоритмы генерации текста Кристиан Математические алгоритмы 5 22.07.2009 15:24
Вывод цветного текста на Си под Linux Гость Реализация, исходники, языки 3 17.11.2008 01:25
Парсинг текста dominity Сортировка и поиск 5 14.09.2007 09:29
определение кодировки текста Madgeniy Реализация, исходники, языки 2 15.01.2007 02:09
генерация текста как? незарегистрированный Реализация, исходники, языки 0 20.11.2006 11:20