Модераторы: korob2001, ginnie

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> спарсить ответ сервера 
:(
    Опции темы
GR0Mi
Дата 10.4.2010, 16:56 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 85
Регистрация: 9.4.2010

Репутация: нет
Всего: нет



нужно спарсить значение , вот кусок кода от куда нужно спарсить интересует чисто которое в ()



</div>
<h3>
<a href="http://сайт/user/267752/friends/">Друзья (92)</a>
</h3>




пробывал так

Код

=~ /Друзья <span>\((.*)\)<\/span>/;


ошибка

Use of uninitialized value in concatenation (.) or string at

и вот так

Код

<a\s+href="http:\/\/.+?\/friends\/">Друзья\s*\((\d+)\)<\/a>


ошибка

Unrecognized escape \s in character class passed through at
unrecognized character \xC4 in column 59 at



помогите решить проблемку

Это сообщение отредактировал(а) GR0Mi - 10.4.2010, 16:58
PM MAIL   Вверх
nIkTo
Дата 10.4.2010, 17:27 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 218
Регистрация: 5.7.2007

Репутация: нет
Всего: нет



Код

#!/usr/bin/perl -w
use strict;

my $str = '</div>
<h3>
<a href="http://сайт/user/267752/friends/">Друзья (92)</a>
</h3>';

print $1 if ($str =~/">Друзья \((\d*)\)</)


Это сообщение отредактировал(а) nIkTo - 10.4.2010, 17:28
PM   Вверх
GR0Mi
Дата 10.4.2010, 17:37 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 85
Регистрация: 9.4.2010

Репутация: нет
Всего: нет



Цитата(nIkTo @ 10.4.2010,  17:27)
Код

#!/usr/bin/perl -w
use strict;

my $str = '</div>
<h3>
<a href="http://сайт/user/267752/friends/">Друзья (92)</a>
</h3>';

print $1 if ($str =~/">Друзья \((\d*)\)</)

не подходит строка http://сайт/user/267752 постоянно меянется нужно спарсить именно количество друзей
вот похожий код 
Код

<div id="votesInfo">
<a id="votesIco" title="Твои голоса" href=сайт">
<span class="ico"></span><span id="votesInfoCount">0</span>
</a>
</div>

спарсил вот так 

Код

my ($vote) = $resp =~ /<span id="votesInfoCount">(\d+)<\/span>/;



а вот спарсить друзей не получается

Это сообщение отредактировал(а) GR0Mi - 10.4.2010, 17:40
PM MAIL   Вверх
nIkTo
Дата 10.4.2010, 17:41 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Бывалый
*


Профиль
Группа: Участник
Сообщений: 218
Регистрация: 5.7.2007

Репутация: нет
Всего: нет



любая строка которая содержит :
Цитата

">Друзья (_число_)<

подойдёт под регулярное выражение :
Цитата

">Друзья \((\d*)\)<


то есть подойдут строки :
Цитата

<a href="http://сайт/user/267752/friends/">Друзья (92)</a>
<a href="http://сайт/user/187476/friends/">Друзья (92)</a>
тут_что_угодно">Друзья (92)<и_тут_тоже


Это сообщение отредактировал(а) nIkTo - 10.4.2010, 17:43
PM   Вверх
GR0Mi
Дата 10.4.2010, 17:52 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 85
Регистрация: 9.4.2010

Репутация: нет
Всего: нет



Цитата(nIkTo @ 10.4.2010,  17:41)
любая строка которая содержит :
Цитата

">Друзья (_число_)<

подойдёт под регулярное выражение :
Цитата

">Друзья \((\d*)\)<


то есть подойдут строки :
Цитата

<a href="http://сайт/user/267752/friends/">Друзья (92)</a>
<a href="http://сайт/user/187476/friends/">Друзья (92)</a>
тут_что_угодно">Друзья (92)<и_тут_тоже

ПЕрвый раз имею дело с регулярками. чтот не вьеду немножко. прочитал стьи всеранво не понятно.
вот сделал запрос
Код

my ($frend) = $resp =~ />Друзья \((\d*)\)<;

куча ошибок. также 
unrecognized character \xC4 in column 59 at
кодировка страници windows-1251 
PM MAIL   Вверх
White_Eagle
Дата 10.4.2010, 18:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 13
Регистрация: 28.3.2007

Репутация: нет
Всего: нет



nIkTo  дал вам правильную регулярку.

попробуйте так 
Код

my ($frend) = $resp =~/">Друзья \((\d*)\)</;

забыли в конце "/"

Это сообщение отредактировал(а) White_Eagle - 10.4.2010, 18:21
PM MAIL   Вверх
GR0Mi
Дата 10.4.2010, 22:03 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 85
Регистрация: 9.4.2010

Репутация: нет
Всего: нет



и снова ошибки...
запрос верен. теперь ошибка 
use of uninitialized value $frend in concatenation <.> or string at lina 60
то есть в регулярку передается неинициализированное значение
вот 60 строка 
print "[ + ] [vote=$vote];[Friends=$frend]\n";

сори если мои вопросы ламерские.  раньше работал на дельфи сейчас нужно на perl
PM MAIL   Вверх
shamber
Дата 11.4.2010, 19:49 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1422
Регистрация: 5.9.2006
Где: Россия

Репутация: 17
Всего: 18



GR0Mi, вам сказали, что в ваших запросах проблемы с состалениями регулярок. почитайте про них чтоли.
Люди дают вам правильные примеры smile
вы же приводите только сообщения об ошибках не приводя свой код, 
Цитата
вот 60 строка 
print "[ + ] [vote=$vote];[Friends=$frend]\n";


кто ж его знает что у вас там в первых 59
телепат только вчера в отпуск отъехал smile

Это сообщение отредактировал(а) shamber - 11.4.2010, 19:52
PM MAIL Jabber   Вверх
GR0Mi
Дата 20.4.2010, 16:50 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 85
Регистрация: 9.4.2010

Репутация: нет
Всего: нет



зачем остальной код. если он полностью рабочий. а проблема только в регулярке
вот кусок кода.
остальное я думаю не нужно

Код

 my $resp = $ua->post("http://сайт/user/login/",
                            ["timestamp" => time,
                             "user_email" => $mail,
                             "user_password" => $pass,
                             "submitBtn" => "%C2%EE%E9%F2%E8",
                             "redirect"  => "%2F",
                             "submitted" => "1",])->as_string;
wf($file, $resp);

if ($resp =~ "domain=.сайт")
         {
         $resp = $ua->get('http://сайт/index.php')->as_string;
$resp =~ /<div id="moneyInfo">.*?<span><\/span>(\d+\.)<small>(\d+)<\/small>.*?<\/div>/smi;
my $money = $1 . $2;
my ($vote) = $resp =~ /<span id="votesInfoCount">(\d+)<\/span>/;
my ($frend) = $resp =~/">Друзья \((\d*)\)</;

wf($good_mails, "$mail;$pass        money=$money;vote=$vote\n");
            print "[ + ] $mail;$pass;[money=$money];[vote=$vote];[Friends=$frend]\n";
            
         }
        else
        {
            print "[ - ] $mail;$pass\n";
        }
      }
}



Это сообщение отредактировал(а) GR0Mi - 20.4.2010, 16:51
PM MAIL   Вверх
ming
Дата 24.4.2010, 21:23 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 97
Регистрация: 30.1.2009
Где: Новосибирск

Репутация: 2
Всего: 3



а кто будет экранировать кавычки в регулярке? 
my ($frend) = $resp =~/\">Друзья \((\d*)\)</;
PM MAIL ICQ Jabber   Вверх
Pfailed
Дата 24.4.2010, 21:29 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 933
Регистрация: 19.7.2009

Репутация: 22
Всего: 39



Цитата(ming @  24.4.2010,  21:23 Найти цитируемый пост)
а кто будет экранировать кавычки в регулярке? 


Зачем экранировать кавычки в регулярке?



--------------------
PM MAIL   Вверх
GR0Mi
Дата 29.4.2010, 10:27 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 85
Регистрация: 9.4.2010

Репутация: нет
Всего: нет



давно уже все решил. теперь столкнулся что в ругулярке знак $ 

<div>Общий заработок: <span>$5.03</span></div>



Код

$resp =~ /<div>Общий заработок: <span>\$(\d+\.)(\d+)<\/span><\/div>/smi;

        my ($money) = $1 . $2;



usr of ininitialized velue $1 и $2
PM MAIL   Вверх
shamber
Дата 29.4.2010, 11:12 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1422
Регистрация: 5.9.2006
Где: Россия

Репутация: 17
Всего: 18



GR0Mi, а просто . поставить? Вас ведь валюта не интересует
PM MAIL Jabber   Вверх
GR0Mi
Дата 29.4.2010, 11:30 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 85
Регистрация: 9.4.2010

Репутация: нет
Всего: нет



в смысле? вместо $ точку поставить?
PM MAIL   Вверх
shamber
Дата 29.4.2010, 11:38 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Эксперт
***


Профиль
Группа: Завсегдатай
Сообщений: 1422
Регистрация: 5.9.2006
Где: Россия

Репутация: 17
Всего: 18



GR0Mi, да
PM MAIL Jabber   Вверх
Ответ в темуСоздание новой темы Создание опроса
Правила форума "Perl"
korob2001
sharq
  • В этом разделе обсуждаются общие вопросы по языку Perl
  • Если ваш вопрос относится к системному программированию, задавайте его здесь
  • Если ваш вопрос относится к CGI программированию, задавайте его здесь
  • Интерпретатор Perl можно скачать здесь ActiveState, O'REILLY, The source for Perl
  • Справочное руководство "Установка perl-модулей", можно скачать здесь


Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, korob2001, sharq.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | Perl: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0908 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.