Модераторы: Poseidon, Snowy, bems, MetalFan
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Универсальность кода, для парсинга страниц 
:(
    Опции темы
Canyon
Дата 30.3.2012, 10:21 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 38
Регистрация: 11.3.2012

Репутация: нет
Всего: нет



Как сделать следующее:

К примеру у меня есть вот такой код

Код

var
 s : string;
 I, h : integer;
Begin
 S := 'HTML СТРАНИЦа ';
 I := Pos ('href=', S);
 Copy(S, i, 10);
End;


и резко мне надо в этом же приложении использовать другой метод парсинга, т.е. дабовить больше функций.

Как это сделать не переделывая готовый exe????
В какую сторону капать, поподробней пожалуйста.

Это сообщение отредактировал(а) Canyon - 30.3.2012, 10:21
PM   Вверх
Данкинг
Дата 30.3.2012, 10:22 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Yersinia pestis
****


Профиль
Группа: Завсегдатай
Сообщений: 8302
Регистрация: 7.11.2006
Где: მოსკოვი

Репутация: 9
Всего: 130



Цитата(Canyon @  30.3.2012,  11:21 Найти цитируемый пост)
Как это сделать не переделывая готовый exe????

Как не переделывая, не понял? Исполняемый файл хакнуть, что ли?


--------------------
There's nothing left but silent epitaphs.
PM MAIL WWW   Вверх
Canyon
Дата 30.3.2012, 10:25 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 38
Регистрация: 11.3.2012

Репутация: нет
Всего: нет



Не перекомпилировать. 
Т.е. я укажу где нибудь в memo синтаксис по которому парсить строки, и он мне сделает по тому коду по которой написан в memo

Это сообщение отредактировал(а) Canyon - 30.3.2012, 10:27
PM   Вверх
Akella
Дата 30.3.2012, 10:34 (ссылка) |    (голосов:1) Загрузка ... Загрузка ... Быстрая цитата Цитата


Творец
****


Профиль
Группа: Модератор
Сообщений: 18485
Регистрация: 14.5.2003
Где: Корусант

Репутация: 36
Всего: 329



Use regexpr, Luke
PM MAIL   Вверх
Canyon
Дата 30.3.2012, 10:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 38
Регистрация: 11.3.2012

Репутация: нет
Всего: нет



использовать эту http://regexpstudio.com/

Если честно, ни чиго не могу понять в этом regexp, сколько раз не садился разбираться что и как, не смог понять.

Но даже с regexp придеться частично иногда изменять код.

Может все таки можно как то придумать без регулярки?
PM   Вверх
Alexeis
Дата 30.3.2012, 10:43 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Амеба
Group Icon


Профиль
Группа: Админ
Сообщений: 11743
Регистрация: 12.10.2005
Где: Зеленоград

Репутация: 109
Всего: 459



Цитата(Akella @  30.3.2012,  11:34 Найти цитируемый пост)
Use regexpr, Luke 

+1 . Это позволит тебе задавать правила поиска в текстовом поле, а затем применять для поиска. Другое дело, что таким же образом не удастся обобщить обработку найденных строк.


--------------------
Vit вечная память.

Обсуждение действий администрации форума производятся только в этом форуме

гениальность идеи состоит в том, что ее невозможно придумать
PM ICQ Skype   Вверх
Qu1nt
Дата 30.3.2012, 11:17 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 602
Регистрация: 13.1.2007

Репутация: 18
Всего: 50



Я просто оставлю это здесь.
PM MAIL   Вверх
Akella
Дата 30.3.2012, 14:19 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Творец
****


Профиль
Группа: Модератор
Сообщений: 18485
Регистрация: 14.5.2003
Где: Корусант

Репутация: 36
Всего: 329



Тогда смотри в сторону PascalScriptFastScript или на побобные библиотеки/компоненты.

Добавлено через 32 секунды
Canyon, но без регулятор тебе парсить HTML будет реально трудно!

Добавлено через 6 минут и 20 секунд
Qu1nt, ты бы в двух словах мог рассказать?  smile 
PM MAIL   Вверх
Canyon
Дата 30.3.2012, 17:58 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 38
Регистрация: 11.3.2012

Репутация: нет
Всего: нет



Если долго мучаться, что-нибудь получится.
Вообщем нашел статью от журнала Хакер, про регулярные выражения, я буквально сразу почти понял как что делать,
а справку стандартную несколько раз перечитывал и нифигашечки не понял.

Но осталась маленькое но, не знаю как убрать символ из найденой строки.

пример строки которую ищу в html
Код

"/mail/signup.php?s=&PHPSESSID=6290d2hj56egh6bdcdd9687jf29fa7"

результат нужен без ковычек

вот регулярка
Код

\"+\/[\w]+\/[\w.]+\?+r+\=+\&+[\w]+\=+[\w]+\"

(указал в начале и в конце ковычки, т.к. без них выдает еще кучу результатов котоыре не нужны)

Как исключить эти ковычки из результат при помощи регулярки?
И мне еще кажеться что я сделал как то не красиво эту регулярку. Можно было сделать подругому?

Это сообщение отредактировал(а) Canyon - 30.3.2012, 18:32
PM   Вверх
Canyon
Дата 30.3.2012, 18:35 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 38
Регистрация: 11.3.2012

Репутация: нет
Всего: нет



Начал парсить русский текст и наткнулся на камень.

Пример
Код

<a href="/articles/item/168-Kak_dostatb-soseda.html">
            Как достать соседа 7? (Как dostatb soseda7?).        </a>


Результат должен быть "Как достать соседа 7? (Как dostatb soseda7?)."

Начинаю искать от .html"> до </a> но что то не выходит. 
Приведите пример регулярки для этого поиска

Это сообщение отредактировал(а) Canyon - 30.3.2012, 18:37
PM   Вверх
Akella
Дата 31.3.2012, 12:09 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Творец
****


Профиль
Группа: Модератор
Сообщений: 18485
Регистрация: 14.5.2003
Где: Корусант

Репутация: 36
Всего: 329



Canyon, Фридла почитай

Добавлено @ 12:11
Canyon, используй модификатор s

Код
(?is).html">([^<]+)</a>

PM MAIL   Вверх
Akella
Дата 4.4.2012, 10:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Творец
****


Профиль
Группа: Модератор
Сообщений: 18485
Регистрация: 14.5.2003
Где: Корусант

Репутация: 36
Всего: 329



PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Delphi: Общие вопросы"
SnowyMetalFan
bemsPoseidon
Rrader

Запрещается!

1. Публиковать ссылки на вскрытые компоненты

2. Обсуждать взлом компонентов и делиться вскрытыми компонентами

  • Литературу по Дельфи обсуждаем здесь
  • Действия модераторов можно обсудить здесь
  • С просьбами о написании курсовой, реферата и т.п. обращаться сюда
  • Вопросы по реализации алгоритмов рассматриваются здесь
  • 90% ответов на свои вопросы можно найти в DRKB (Delphi Russian Knowledge Base) - крупнейшем в рунете сборнике материалов по Дельфи


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, Snowy, MetalFan, bems, Poseidon, Rrader.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Delphi: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.1035 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.