Модераторы: Daevaorn
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Парсер бинарных данных, существует ли такой? 
:(
    Опции темы
andrew_121
Дата 10.1.2010, 21:35 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Кодофей
****


Профиль
Группа: Завсегдатай
Сообщений: 3448
Регистрация: 3.1.2008

Репутация: 6
Всего: 33



Всем привет.
Есть дампы сетевых пакетов. Нужно их парсить. Но чем/кем?



--------------------
Удалил аккаунт. Прощайте!
PM MAIL   Вверх
xvr
Дата 10.1.2010, 22:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Комодератор
Сообщений: 7046
Регистрация: 28.8.2007
Где: Дублин, Ирландия

Репутация: 60
Всего: 223



Вопрос в структуре того, что надо парсить. Можно ли эту структуру описать регулярными выражениями, или нужны грамматики.
Если достаточно регулярных выражений, то можно взять boost::regex.
Если нужна грамматика, то любым грамматическим парсером (bison или boost::spirit). Парсер работает на уровне лексем, а побить бинарные данные на лексемы можно вручную.

PM MAIL   Вверх
andrew_121
Дата 10.1.2010, 22:56 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Кодофей
****


Профиль
Группа: Завсегдатай
Сообщений: 3448
Регистрация: 3.1.2008

Репутация: 6
Всего: 33



Цитата(xvr @  10.1.2010,  22:06 Найти цитируемый пост)
Вопрос в структуре того, что надо парсить.

пакеты содержат в себе и непечатные символы. tr1::regex не адекватно реагирует.
если перевести дамп в hex код, то тут вообще не понимаю что и как делать, и как отреагирует regex.

вообще, хотелось бы использовать regex, чтоб не городить кучу кода.


--------------------
Удалил аккаунт. Прощайте!
PM MAIL   Вверх
mes
Дата 11.1.2010, 01:33 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


любитель
****


Профиль
Группа: Участник Клуба
Сообщений: 7954
Регистрация: 14.1.2006

Репутация: 144
Всего: 250



Цитата(andrew_121 @  10.1.2010,  21:56 Найти цитируемый пост)
содержат в себе и непечатные символы

например :
Цитата

base64 — это схема, по которой произвольная последовательность байт преобразуется в последовательность печатных ASCII символов. 

http://ru.wikipedia.org/wiki/Base64



--------------------
PM MAIL WWW   Вверх
andrew_121
Дата 11.1.2010, 01:49 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Кодофей
****


Профиль
Группа: Завсегдатай
Сообщений: 3448
Регистрация: 3.1.2008

Репутация: 6
Всего: 33



mes, вы предлагаете мне конвертировать пакеты, а потом передавать в регулярки? ...хм, нужно пробовать.


--------------------
Удалил аккаунт. Прощайте!
PM MAIL   Вверх
xvr
Дата 11.1.2010, 15:11 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Комодератор
Сообщений: 7046
Регистрация: 28.8.2007
Где: Дублин, Ирландия

Репутация: 60
Всего: 223



Цитата(andrew_121 @ 10.1.2010,  22:56)
Цитата(xvr @  10.1.2010,  22:06 Найти цитируемый пост)
Вопрос в структуре того, что надо парсить.

пакеты содержат в себе и непечатные символы. tr1::regex не адекватно реагирует.

Не знаю, как tr1::regex, а boost::regex можно заставить парсить бинарные данные - надо его специализировать не от char, а от своего класса. 
(Где то у меня что то такое было, поищу)

Цитата

если перевести дамп в hex код, то тут вообще не понимаю что и как делать, и как отреагирует regex.
Элементарно. Задавать данные в виде hex последовательностей (можно через пробел)

base64 - это не вариант, в нем несколько входных байтов дают несколько выходных символов. Будет сложно написать образец именно на уровне БАЙТОВ

PM MAIL   Вверх
xvr
Дата 11.1.2010, 22:04 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
****


Профиль
Группа: Комодератор
Сообщений: 7046
Регистрация: 28.8.2007
Где: Дублин, Ирландия

Репутация: 60
Всего: 223



Нашел (см атач)
Использование:
Код

class HexRegEx {
 string org_re;
 HexREString re_string;
 hex_regex re;
 
public:
 HexRegEx() {}
 HexRegEx(const string &s) :org_re(s), re_string(s,false), re(re_string.begin(),re_string.end()) {}
 
 void operator=(const string &s)
  {
   org_re=s; re_string.assign_me(s,false);
   if (!org_re.empty()) re.assign(re_string.begin(),re_string.end());
  }
 
 string get_prefix_bin() {return re_string.get_prefix_bin();}
 string get_prefix_src() {return re_string.get_prefix_src();}
 size_t get_prefix_len() {return re_string.get_prefix_len();}
 string get_org() {return org_re;}
 string get_src() {return re_string.get_src();}
 
 bool match(const string& s)
  {
   if (org_re.empty()) return true;
   HexREString pat;
   pat.assign_me(s,true);
   return regex_match(pat.begin(),pat.end(),re);
  }
 bool empty() {return org_re.empty();}
};

Примеры патернов
Код

0x40 % .{20}
0x41
0x41 % .+
0xC1 % 0x01 ?
0x42 % .{9}
0xC2 % 
% [0xF0-0xFD] .*
0b1??????? % . .+
Символ % отделяет часть патерна, длинну/содержимое которой можно извлечь соотвествующим методом (get_prefix*) (RE до % не поддерживаются)



Присоединённый файл ( Кол-во скачиваний: 2 )
Присоединённый файл  hexre.zip 5,35 Kb
PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "С++:Общие вопросы"
Earnest Daevaorn

Добро пожаловать!

  • Черновик стандарта C++ (за октябрь 2005) можно скачать с этого сайта. Прямая ссылка на файл черновика(4.4мб).
  • Черновик стандарта C (за сентябрь 2005) можно скачать с этого сайта. Прямая ссылка на файл черновика (3.4мб).
  • Прежде чем задать вопрос, прочтите это и/или это!
  • Здесь хранится весь мировой запас ссылок на документы, связанные с C++ :)
  • Не брезгуйте пользоваться тегами [code=cpp][/code].
  • Пожалуйста, не просите написать за вас программы в этом разделе - для этого существует "Центр Помощи".
  • C++ FAQ

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, Earnest Daevaorn

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | C/C++: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0723 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.