VPF::Помогите с регуляркой - Форум программистов

Orient

Дата 21.9.2009, 19:54 (ссылка)

(нет голосов)

Загрузка ...

Шустрый

Профиль
Группа: Участник
Сообщений: 144
Регистрация: 17.7.2004

Репутация: нет
Всего: нет

Здравствуйте столкнулся со странной проблемой

Есть сайт http://dle.good-advices.com/

На этой станице есть текст с ссылками:

Код



<a href="http://test.com?url=00001" target="_blank" rel="nofollow">скачать с test.com1 </a></noindex></b><br />test   <b><noindex><a href="http://test.com?url=00002" target="_blank" rel="nofollow">скачать с test.com2 </a></noindex></b><br />test   <b><noindex><a href="http://test.com?url=00003" target="_blank" rel="nofollow">скачать с test.com3 </a></noindex></b><br />test   <b><noindex><a href="http://test.com?url=00004" target="_blank" rel="nofollow">скачать с test.com4 </a>

Собственно мне надо вынуть все ссылки с этого блока, которые ведут на сайт test.com.
Я использую вот такую регулярку:

Код


$mask = '|<a(.*)href="(.*)'. $value[ 'host' ] .'(.*)".*>|';
preg_match_all( $mask, $txt, $arr );
print_r( $arr );

В результате получаю вот это:

Код


Array
(
    [0] => Array
        (
            [0] => <a href="http://test.com?url=00001" target="_blank" rel="nofollow">скачать с test.com1 </a></noindex></b><br />test   <b><noindex><a href="http://test.com?url=00002" target="_blank" rel="nofollow">скачать с test.com2 </a></noindex></b><br />test   <b><noindex><a href="http://test.com?url=00003" target="_blank" rel="nofollow">скачать с test.com3 </a></noindex></b><br />test   <b><noindex><a href="http://test.com?url=00004" target="_blank" rel="nofollow">скачать с test.com4 </a></noindex></b></div></td>
        )

    [1] => Array
        (
            [0] =>  href="http://test.com?url=00001" target="_blank" rel="nofollow">скачать с test.com1 </a></noindex></b><br />test   <b><noindex><a href="http://test.com?url=00002" target="_blank" rel="nofollow">скачать с test.com2 </a></noindex></b><br />test   <b><noindex><a href="http://test.com?url=00003" target="_blank" rel="nofollow">скачать с test.com3 </a></noindex></b><br />test   <b><noindex><a 
        )

    [2] => Array
        (
            [0] => http://
        )

    [3] => Array
        (
            [0] => ?url=00004" target="_blank" rel="nofollow
        )

)

Т.е. моя регулярка почему-то воспринимает этот блок как одну большую ссылку. Как мне вынуть из него все мои ссылки? Не подскажете ли как это сделать?

Спасибо

NLspieler

Дата 22.9.2009, 03:16 (ссылка)

(нет голосов)

Загрузка ...

Опытный

Профиль
Группа: Участник
Сообщений: 619
Регистрация: 13.10.2008
Где: Берлин

Репутация: 1
Всего: 19

Код


$domen = 'test.com' ;
$pattern = '/(http:\/\/' . $domen . '\S+)\"/';
preg_match_all ( $pattern , $text , $array) ;
$links_array = $array[1] ;
print_r ($links_array) ;

Orient

Дата 22.9.2009, 08:15 (ссылка)

(нет голосов)

Загрузка ...

Шустрый

Профиль
Группа: Участник
Сообщений: 144
Регистрация: 17.7.2004

Репутация: нет
Всего: нет

NLspieler, Спасибо большое, помогло. А нельзя ли пояснить почему моя маска не работала? И в чем особенность применения \S в маске?

Ferroks

Дата 22.9.2009, 09:35 (ссылка)

(нет голосов)

Загрузка ...

Новичок

Профиль
Группа: Участник
Сообщений: 13
Регистрация: 29.6.2008

Репутация: нет
Всего: нет

мне тож помогите с регуляркой

есть html

структура такая

<DIV id=main>
<DIV id=main-content>
тут всяка хрень
<DIV>всяка хрень</DIV>
</DIV></DIV>

составил регулярку

preg_match('/<div(.*?)(id=main-content>)(.*?)<\/div><\/div>/i', $text,$mathces)

echo $mathces ничего не выводит

NLspieler

Дата 22.9.2009, 18:08 (ссылка)

(нет голосов)

Загрузка ...

Опытный

Профиль
Группа: Участник
Сообщений: 619
Регистрация: 13.10.2008
Где: Берлин

Репутация: 1
Всего: 19

Orient
\w символ слова: ангиские буквы и цифры.
\W все, кроме ангиских букв и цифр
\s пробельный символ: пробел, табуляция, первод строки, первод каретки
\S не пробельный мимвол
\d цифра
\D все, кроме цифры

\S+ означает любое количество не пробелов

Почему твоя регулярка не работает, не знаю.
Расшифровать не удается

Ferroks
А что должно получится в результате?

Ferroks

Дата 23.9.2009, 14:00 (ссылка)

(нет голосов)

Загрузка ...

Новичок

Профиль
Группа: Участник
Сообщений: 13
Регистрация: 29.6.2008

Репутация: нет
Всего: нет

Цитата(NLspieler @ 22.9.2009, 18:08

)

FerroksА что должно получится в результате?

нужно получить вот это

<DIV id=main-content>
тут всяка хрень
<DIV>всяка хрень</DIV>
</DIV>

NewDima

Дата 25.9.2009, 06:54 (ссылка)

(нет голосов)

Загрузка ...

Опытный

Профиль
Группа: Участник
Сообщений: 922
Регистрация: 20.2.2006
Где: <?here?>

Репутация: -1
Всего: 12

Ferroks, зачем здесь регулярка? smile

--------------------

Начинаем черкать!

1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема \| PHP: Тексты \| Следующая тема »