Модераторы: Partizan, gambit
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Парсинг исходника страницы, http://www.google.ru/ie?q=test&num=100 
V
    Опции темы
W1zArD
Дата 5.2.2009, 08:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 285
Регистрация: 29.1.2006

Репутация: нет
Всего: 3



Добрый день. Возникла проблема.
По адресу: "http://www.google.ru/ie?q=test&num=100" необходимо получить все ссылки.
У меня встал вопрос, что быстрее webBrowser.Links или Regex.
выбрал regex.

собственно паттерн - @"href\s*=\s*(?:""(?<1>[^""]*)""|(?<1>\S+))"

примерный вариант того как он ищет:
http://www.russian.language.ru/test.htm>Study
http://www.test.etoast.ru/>Психологические
http://www.test.com/><em&amp.../em>.com
http://tests.kulichki.com/>Тесты.
http://www.lidenz.ru/online-test/>Free
http://grudina.info/newyear/test.php>Новогодний
http://www.rg.ru/test>Тест
http://test.allbest.ru/>Тесты
http://www.socionika.info/test.html>Тест
http://test.bio-met.ru/>Психологический
http://aeterna.ru/test.php>Тесты

исходный вариант:
... href=http://www.regular-expressions.info/>

вобщем как мне выбрать все что до символа ">", т.е. в этом вся и загвоздка, найду все что до ">" и все...



рабочий вариант, но грузит cpu на 100% - new Regex(@"(?<=<(\S|\s)*)((?<=(href=('|"")+))|(?<=(href=))[^('|"")])([^'>""\s)]*)(?=('|""|[\S])?)", RegexOptions.IgnoreCase | RegexOptions.Compiled);

Это сообщение отредактировал(а) W1zArD - 5.2.2009, 13:35
PM   Вверх
Bogdan1024
Дата 5.2.2009, 13:18 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1436
Регистрация: 28.9.2005
Где: Киев

Репутация: 3
Всего: 13



Засеки время выполнения ;)
А XmlReader'ом пробовал работать? Мне кажется что так будет быстрее всего.



--------------------
user posted image
PM MAIL   Вверх
W1zArD
Дата 5.2.2009, 14:23 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 285
Регистрация: 29.1.2006

Репутация: нет
Всего: 3



мб, посоветуете самый оптимальный вариант?
а как тут XmlReaderom пробегаться?
можно пример или хотя бы в 2-х словах объяснить

спасибо smile
PM   Вверх
diadiavova
Дата 5.2.2009, 14:45 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Доктор Зло(диагност, настоящий, с лицензией и полномочиями)
****


Профиль
Группа: Модератор
Сообщений: 5821
Регистрация: 14.8.2008
Где: В Коньфпольте

Репутация: 18
Всего: 142



Попробуй воспользоваться вот этой штучкой.


--------------------
Хочешь получить мудрый совет - читай подписи участников форумов.
Злой доктор Щасзаболит smile
PM   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Прежде чем создать тему, посмотрите сюда:
Partizan
PashaPash

Используйте теги [code=csharp][/code] для подсветки кода. Используйтe чекбокс "транслит" если у Вас нет русских шрифтов.
Что делать если Вам помогли, но отблагодарить помощника плюсом в репутацию Вы не можете(не хватает сообщений)? Пишите сюда, или отправляйте репорт. Поставим :)
Так же не забывайте отмечать свой вопрос решенным, если он таковым является :)


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, mr.DUDA, Partizan, PashaPash.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | .NET для новичков | Следующая тема »


 




[ Время генерации скрипта: 0.0550 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.