Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Определение прототипа последовательности 
:(
    Опции темы
Fally
Дата 25.10.2008, 18:32 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 265
Регистрация: 17.8.2006
Где: Dahla

Репутация: нет
Всего: 4



Здравствуте. Сейчас столкнулся с проблемой, и не знаю с какой стороны к ней подойти...
К примеру, у меня есть исходная последовательность "абвгд", и есть набор след. последовательностей: "ааабббвввгггддд", "аабввггдед", "дададабаба", "ккллммнноо".... и мне необходимо определить прототипом каких последовательностей является исходна... В данном случае, первая последовательность удовлетворяет нашим требованиям, поскольку там все символы повторяются равное число раз, вторая тоже подходит под прототипируемую, несмотря на наличие шума в виде некоторых ошибок, исходная последовательность не является прототипом третьей последовательности, но в то же время является прототипом четвёртой последовательности. Мощность алфавита строго задана и не может превышать 15 символов, при этом каждый "соседние символы" могут заменять друг друга и считаются похожими. Также может подойти последовательность со схожей структурой, например 4ая..
Наверное условие поставлено ужасно, поэтому изображу наглядно ^__^:
Код

Исходная последовательность: 
"абвгд"

Набор имеющихся последовательностей:
"ааббввггдд"
"аабввггдед"
"дададабба"
"ккллммнноо"

Последовательности, в результате обработки исходной:
"ааббввггдд"
"аабввггдед"
"ккллммнноо"

Очень хотелось бы, чтобы кто-нибудь подсказал направление куда мне копать и что считать.
Заранее спасибо.


--------------------
Прежде чем задать вопрос на форуме воспользуйтесь поиском.
user posted image
user posted image
PM MAIL   Вверх
DRUID3
Дата 25.10.2008, 19:26 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 463
Регистрация: 20.6.2005
Где: Kyyiv

Репутация: 2
Всего: 9



хм... а на каком языке предстоит решить это? И еще не понял о 4-й последовательности... Она то чем похожа??? smile 


--------------------
Every time if you use Linux, you are joined to the communism...
практика - критерий истины ... отделенной от нас пропастью субъективного восприятия...
PM MAIL WWW Skype   Вверх
Fally
Дата 27.10.2008, 15:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 265
Регистрация: 17.8.2006
Где: Dahla

Репутация: нет
Всего: 4



DRUID3, Язык будет С++.. А обоснование похожести последовательности #4 в том, что символы хоть и отличаются от исходной но находятся в таком же расстоянии, что и символы исходной, а также количество их повторов кратно количеству аналогичных символов в исходной... т.е. приблизительная цепочка такова: "абвг" == "бвгд" == "ввггддее" != "апде". Имеет роль количество повторов, и расстояние между символами..

 и + к условию тот факт, что порядок символов в алфавите жёстко задан...


--------------------
Прежде чем задать вопрос на форуме воспользуйтесь поиском.
user posted image
user posted image
PM MAIL   Вверх
nworm
Дата 28.10.2008, 02:40 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 502
Регистрация: 22.10.2005

Репутация: 4
Всего: 8



1) получаем однобуквенные последовательности, из которых могла произойти проверяемая последовательность
2) находим расстояния между первой буквой и второй, второй и третьей и т.д.

Если все расстояния совпадают всё ок.

Пример
ккллммнноо
1)клмно
2) 1 1 1 1 1

совпадает с ааббввггдд
1)абвгд
2) 1 1 1 1 1

----------------------------------------------------------------------------------------------------------------------------------

Иногда, если требуется определять на сколько одно сочетаний букв похоже на другое, вводят метрику 
(аналог расстояния между этими сочетаниями букв).
PM MAIL WWW   Вверх
Fally
Дата 28.10.2008, 10:50 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 265
Регистрация: 17.8.2006
Где: Dahla

Репутация: нет
Всего: 4



nworm, спасибо большое за подсказку, а Вы случайно не знаете, какую литературу можно почитать прямо или косвенно связанную с эффективной обработкой больших последовательностей, т.к. я только для примера сделал такие короткие, а реально они будут минимум шестьсот-семьсот элементов?


--------------------
Прежде чем задать вопрос на форуме воспользуйтесь поиском.
user posted image
user posted image
PM MAIL   Вверх
nworm
Дата 28.10.2008, 23:18 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 502
Регистрация: 22.10.2005

Репутация: 4
Всего: 8



Надо знать Вашу предметную область. У одних и тех же последовательностей может быть совершенно разный смысл.

Например, можете что-нибудь почитать про поиск в Интернете
http://www.i2r.ru/static/334/out_6055.shtml
По ссылке про любые тексты, так что можете что-то придумывать для своего случая.

Если у Вас биология, то можно смотреть другие источники
Тут поисковик какие-то нуклеотидные последовательности выдал:
http://www.impb.ru/index.php?lang=rus&...km/lunina_proj3



Это сообщение отредактировал(а) nworm - 28.10.2008, 23:19
PM MAIL WWW   Вверх
Fally
Дата 29.10.2008, 12:47 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 265
Регистрация: 17.8.2006
Где: Dahla

Репутация: нет
Всего: 4



Спасибо большое за информацию. 


--------------------
Прежде чем задать вопрос на форуме воспользуйтесь поиском.
user posted image
user posted image
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Алгоритмы"

maxim1000

Форум "Алгоритмы" предназначен для обсуждения вопросов, связанных только с алгоритмами и структурами данных, без привязки к конкретному языку программирования и/или программному продукту.


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, maxim1000.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Алгоритмы | Следующая тема »


 




[ Время генерации скрипта: 0.0618 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.