Модераторы: skyboy, MoLeX, Aliance, ksnk

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Нужно удалить из тела html таблицу стилей 
:(
    Опции темы
Alek74
Дата 30.3.2006, 13:13 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 113
Регистрация: 23.3.2006

Репутация: нет
Всего: нет



Вопрос собственно в названии.

Код

  $htmlText = file_get_contents($file);


Удалить потом из $htmlText все в месте с тегами <style></style> при условии что они есть.

Это сообщение отредактировал(а) Alek74 - 30.3.2006, 13:14
--------------------
---------------------------------- «Филисофия жизни ©»  ---------------------------------- 
PM MAIL   Вверх
sugee
Дата 30.3.2006, 16:15 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 423
Регистрация: 12.6.2005

Репутация: 1
Всего: 4



Код

$htmlText = preg_replace("#<style(\stype=style/css){0,1}>.*?</style>#is", "", $htmlText);

Добавлено @ 16:18
А проверить есть ли стили можно с помощью preg_match.
PM MAIL   Вверх
Alek74
Дата 30.3.2006, 17:34 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 113
Регистрация: 23.3.2006

Репутация: нет
Всего: нет



Спасибо!!!
--------------------
---------------------------------- «Филисофия жизни ©»  ---------------------------------- 
PM MAIL   Вверх
Alek74
Дата 30.3.2006, 18:16 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 113
Регистрация: 23.3.2006

Репутация: нет
Всего: нет



Странно, но не получаеться.


Код

 $htmlText = file_get_contents($file);
 $htmlText = preg_replace("#<style(\stype=style/css){0,1}>.*?</style>#is", "", $htmlText);



Такого вида таблицу:
Код

<style type="text/css">
        A { color : #0002CC }
        A:HOVER { color : #BF0000 }
</style>


Не вырезает.
--------------------
---------------------------------- «Филисофия жизни ©»  ---------------------------------- 
PM MAIL   Вверх
CyClon
Дата 30.3.2006, 18:47 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 838
Регистрация: 3.12.2005

Репутация: 3
Всего: 4



Код
$htmlText = file_get_contents($file);
$htmlText = preg_replace("#<style.*>.*</style>#is", "", $htmlText);



--------------------
user posted image
PM   Вверх
sugee
Дата 30.3.2006, 19:04 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 423
Регистрация: 12.6.2005

Репутация: 1
Всего: 4



Oops! А что такое style/css? smile Обычно пишут text/css и ещё в кавычках.
Вот так лучше будет
Код

$file = preg_replace("#<style(\stype=\"text/css\"){0,1}>.*?</style>#is", "", $file);

Добавлено @ 19:12
CyClon, ты не учёл что есть такое явление как жадность квантификаторов. Твоя регулярка не останавливается на закрывающем теге </style>, а идет дальше, потому-что .* это любая строка.
Ты сам то проверял свой код?
PM MAIL   Вверх
Alek74
Дата 30.3.2006, 20:06 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 113
Регистрация: 23.3.2006

Репутация: нет
Всего: нет



Самое интересное, что ни тот ни другой вариант не работает. Это первое.

А вот если в теге <style> помимо type="text/css" есть еще некий аттрибут, к примеру, media="screen". Это если файл имеет структуру fictionbook 2.0.

Как его добавить в эту функцию?

Это сообщение отредактировал(а) Alek74 - 30.3.2006, 20:07
--------------------
---------------------------------- «Филисофия жизни ©»  ---------------------------------- 
PM MAIL   Вверх
sugee
Дата 30.3.2006, 20:21 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 423
Регистрация: 12.6.2005

Репутация: 1
Всего: 4



Цитата(Alek74 @ 30.3.2006, 20:06 Найти цитируемый пост)
Самое интересное, что ни тот ни другой вариант не работает.
Я вставил в html-страницу именно ту таблицу стилей которую ты привел для примера, и она моей регуляркой прекрасно вырезается. smile
Может ты просто вставил мой код как есть? У меня там имя переменной
не такое как у тебя.
Добавлено @ 20:27
Цитата(Alek74 @ 30.3.2006, 20:06 Найти цитируемый пост)
А вот если в теге <style> помимо type="text/css" есть еще некий аттрибут, к примеру, media="screen".

Код

#<style(\stype=\"text/css\"){0,1}(\smedia=\"screen\"){0,1}>.*?</style>#is

А что такое fictionbook 2.0?
PM MAIL   Вверх
Alek74
Дата 30.3.2006, 20:46 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 113
Регистрация: 23.3.2006

Репутация: нет
Всего: нет



fictionbook 2.0 это формат электронных книг от Дмитрия Грибова. fictionbook 2.0 Это билиотека

О формате тут:
http://www.gribuser.ru/xml/fictionbook/2.0
--------------------
---------------------------------- «Филисофия жизни ©»  ---------------------------------- 
PM MAIL   Вверх
sugee
Дата 30.3.2006, 21:05 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 423
Регистрация: 12.6.2005

Репутация: 1
Всего: 4



Вторая ссылка че то битая.
Ну а код то заработал?

PM MAIL   Вверх
Alek74
Дата 30.3.2006, 21:13 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 113
Регистрация: 23.3.2006

Репутация: нет
Всего: нет



Тестировал.

Да, спасибо. Код заработал.

А так можно сделать?
Код

 $htmlText = preg_replace("#<style(\stype=\"text/css\"){0,1}>.*?</style>#is", "", $htmlText);
 $htmlText = preg_replace("#<style(\stype=\"text/css\"){0,1}(\smedia=\"screen\"){0,1}(\smedia=\"print\"){0,1}>.*?</style>#is", "", $htmlText);


Первой строкой, же нельзя удалить часть тега?
Просто в некоторых файлах так, а в других так.
Проверка в принципе не нужна. Это работает классы для конвертации html в несколько форматов. При скачивании. Конвертирует и зипует на лету. Там ошибки не выдаються. И ноутисы тоже.
--------------------
---------------------------------- «Филисофия жизни ©»  ---------------------------------- 
PM MAIL   Вверх
sugee
Дата 30.3.2006, 22:07 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 423
Регистрация: 12.6.2005

Репутация: 1
Всего: 4



А зачем ты в первом реге дублируешь то что уже есть во втором?
Конструкция {0,1} означает что то что находится перед ней встречается в тексте 0 или 1 раз, то есть любой из указанных атрибутов может содержаться в теге <style>, но не один из них не является обязательным.
PM MAIL   Вверх
sugee
Дата 30.3.2006, 22:33 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 423
Регистрация: 12.6.2005

Репутация: 1
Всего: 4



Кстати кавычки обрамляющие text/css могут быть и одинарными или их
может не быть вообще. С учётом этого доработал ещё
Код

#<style(\stype=[\"\']?text/css[\"\']?){0,1}>.*?</style>#is

Остальные атрибуты добавишь по аналогии.
PM MAIL   Вверх
Alek74
Дата 31.3.2006, 06:15 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 113
Регистрация: 23.3.2006

Репутация: нет
Всего: нет



Т.е. если в файле может встречаться регулярное выражение более одного раза, то надо вставить {0,2} - два раза?

И, как я догадываюсь, если это встречаеться n раз, то {0,2} лучше вообще убрать и не накладывать ограничение?
Добавлено @ 06:19
К примеру:

Надо убрать знак пробела &nbsp;

Код

 $htmlText = preg_replace("#&nbsp;#is", " ", $htmlText);


А если надо заменить одинарный апостроф на кавычки то

Код

 $htmlText = preg_replace("#'#is", "\" ", $htmlText);



--------------------
---------------------------------- «Филисофия жизни ©»  ---------------------------------- 
PM MAIL   Вверх
sugee
Дата 31.3.2006, 09:01 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Опытный
**


Профиль
Группа: Участник
Сообщений: 423
Регистрация: 12.6.2005

Репутация: 1
Всего: 4



Нет, {0,1} означает что в подстроке которая должна совпасть с регулярным выражением(в данном случае в таблице стилей) символ или группа символов которая находится непосредственно перед {0,1}
должна встретится 0 или 1 раз. Эта группа символов заключена в круглые скобки.
X{n,m} - значит X может встретится в искомой подстроке от n до m раз.
Сама подстрока т.е. в твоем случае таблица стилей может встретиться в тексте сколько угодно раз и всякий раз будет заменена на пустую строку.
PM MAIL   Вверх
Ответ в темуСоздание новой темы Создание опроса
Правила форума "PHP"
Aliance
IZ@TOP
skyboy
SamDark
MoLeX

Новичкам:

  • PHP редакторы собираются и обсуждаются здесь
  • Электронные книги по PHP, документацию можно найти здесь
  • Интерпретатор PHP, полную документацию можно скачать на PHP.NET

Важно:

  • Не брезгуйте пользоваться тегами [code=php]КОД[/code] для повышения читабельности текста/кода.
  • Перед созданием новой темы воспользуйтесь поиском и загляните в FAQ
  • Действия модераторов можно обсудить здесь

Внимание:

  • Темы "ищу скрипт", "подскажите скрипт" и т.п. будут переноситься в форум "Web-технологии"
  • Темы с именами: "Срочно", "помогите", "не знаю как делать" будут УДАЛЯТЬСЯ

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, IZ@TOP, skyboy, SamDark, MoLeX, awers.

 
0 Пользователей читают эту тему (0 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | PHP: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.0875 ]   [ Использовано запросов: 22 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.