Модераторы: Partizan, gambit
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Парсинг страниц, Парсинг страниц 
:(
    Опции темы
CyberTramp
Дата 13.6.2012, 21:49 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 46
Регистрация: 8.11.2011

Репутация: нет
Всего: нет



Привет всем,

Подскажите в чем ошибка почему не удается получить данные
Код
        protected void Button1_Click(object sender, EventArgs e)
        {
            var request = WebRequest.Cre ate("view-source:http://www.cyprusjobs.com/index.php?module_page=my_jobs&jobs_step=jobs_details&job_jobs_id=16202");
            using (var responses = request.GetResponse())
            {
                using (var streams = responses.GetResponseStream())
                using (var readers = new StreamReader(streams))
                {
                    //в переменной html наш сайт
                    string html = readers.ReadToEnd();
                    //ищем определенное место
                    var UpdExp = new Regex(@"<td align=""left"">Job category:</td><td valign=""top"" align=""left"">(?<upd>\d.*)</tr>");
                    //в переменной upDate наша искомая дата обновления
                    string upDate = UpdExp.Match(html).Groups["upd"].Value; // дата
                    Label1.Text = upDate; //выводим значение на форму
                }
            }
        }


По логике вывод должен быть: "Marketing"
PM MAIL   Вверх
CyberTramp
Дата 13.6.2012, 22:27 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 46
Регистрация: 8.11.2011

Репутация: нет
Всего: нет



Может можно как то парсить по номеру страки ?
PM MAIL   Вверх
CyberTramp
Дата 13.6.2012, 23:14 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 46
Регистрация: 8.11.2011

Репутация: нет
Всего: нет



Если изменить стрoку 
var UpdExp = new Regex(@"<td align=""left"">Job category:</td><td valign=""top"" align=""left"">(?<upd>\d.*)</tr>");
на
var UpdExp = new Regex(@"<td align=""left"">(?<upd>.*) :</td>");

то парсит == Job title

есил добавить для более точного направления что то подомбное 
var UpdExp = new Regex(@"<tr>\n\t\t\t\t\t\t\t\t\t\t\t\t\t<td align=""left"">(?<upd>.*) :</td>");
сразу труба
var UpdExp = new Regex(@"<tr><td align=""left"">(?<upd>.*) :</td>"); так же труба.

Что делать как правельно загнать в Label1 например 
<td align="left">Phone:</td>


Это сообщение отредактировал(а) CyberTramp - 13.6.2012, 23:22
PM MAIL   Вверх
xkor
Дата 15.6.2012, 20:34 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 51
Регистрация: 8.1.2007
Где: Питер

Репутация: нет
Всего: 4



CyberTramp, во первых "view-source:" в начале адреса явно лишнее, во вторых в вашем регулярном выражении пробельные символы между тегами не учитываются, в третьих непонятно где вы по той ссылке вообще дату нашли, Job category это категория а не дата. А "\n\t\t\t\t\t\t\t\t\t\t\t\t\t" лучше заменить на "\s*".
В общем как то так надо:
Код

var UpdExp = new Regex(@"<td align=""left"">Job category:</td>\s*<td valign=""top"" align=""left"">\s*(?<upd>.*?)\s*</td>");


Это сообщение отредактировал(а) xkor - 15.6.2012, 20:43
PM MAIL WWW ICQ Skype GTalk Jabber   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Прежде чем создать тему, посмотрите сюда:
mr.DUDA
THandle

Используйте теги [code=csharp][/code] для подсветки кода. Используйтe чекбокс "транслит" если у Вас нет русских шрифтов.
Что делать если Вам помогли, но отблагодарить помощника плюсом в репутацию Вы не можете(не хватает сообщений)? Пишите сюда, или отправляйте репорт. Поставим :)
Так же не забывайте отмечать свой вопрос решенным, если он таковым является :)


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, mr.DUDA, THandle.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Общие вопросы по .NET и C# | Следующая тема »


 




[ Время генерации скрипта: 0.0641 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.