![]() |
Модераторы: skyboy, MoLeX, Aliance, ksnk |
![]() ![]() ![]() |
|
DenWPF |
|
|||
Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1659 Регистрация: 26.9.2009 Репутация: нет Всего: 1 |
Как достать просто текст с вебсайта?
вот если открыть в браузере какой то сайт и нажать ctrl+A то выделиться весь текст на сайте. Вот как забрать только текст с сайта? |
|||
|
||||
s0lman |
|
|||
![]() Белый и лохматый ![]() ![]() Профиль Группа: Участник Сообщений: 637 Регистрация: 1.11.2007 Где: Ukraine Репутация: 9 Всего: 29 |
Как вариант считать весь код и preg_replace'ом убрать все тэги.
-------------------- Когда я уже выучусь на волшебника? :( |
|||
|
||||
DenWPF |
|
|||
Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1659 Регистрация: 26.9.2009 Репутация: нет Всего: 1 |
да я скачивал типо готовый, но чот он очень искривляет данные, многие куда то теряются.
да ещё и с кодировкой проблема...как определить кодировку не понимаю |
|||
|
||||
Ozerich |
|
|||
![]() Бывалый ![]() Профиль Группа: Участник Сообщений: 164 Регистрация: 2.8.2009 Где: Минск, Беларусь Репутация: нет Всего: 5 |
strip_tags
--------------------
C++(STL) / DHTML(CSS) / Javascript / PHP Developer |
|||
|
||||
DenWPF |
|
|||
Эксперт ![]() ![]() ![]() Профиль Группа: Завсегдатай Сообщений: 1659 Регистрация: 26.9.2009 Репутация: нет Всего: 1 |
эта функция не работает нормально, она справляется только с обычным html тегами, с правильной структурой...шаг влево шаг вправо - растрел!
|
|||
|
||||
enoff |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 297 Регистрация: 30.6.2010 Где: Санкт-Петербург Репутация: 11 Всего: 13 |
http://forum.dklab.ru/viewtopic.php?p=153841
можно регулярками вручную аккуратно все убрать. Некоторые теги удалять вместе с содержимым (head, script, style, etc) Остальные - только теги. Оставшиеся вхождения <> преобразовать в html-сущности. |
|||
|
||||
Dima 2015 |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 287 Регистрация: 16.3.2008 Где: SPb Репутация: 2 Всего: 2 |
Определить кодировку в общем случае очень сложно. Но, если это рабочий сайт то на 99% это либо utf-8 либо cp-1251. Попробуй вывести в том или другом, там где не будет кракозяблов там и нужная кодировка.
|
|||
|
||||
![]() ![]() ![]() |
Правила форума "PHP" | |
|
Новичкам:
Важно:
Внимание:
Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, IZ@TOP, skyboy, SamDark, MoLeX, awers. |
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | PHP: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |