Модераторы: skyboy, MoLeX, Aliance, ksnk
  

Поиск:

Ответ в темуСоздание новой темы Создание опроса
> Специалистам по парсингу. По языку запросов ХPath. 
:(
    Опции темы
danminin
Дата 4.12.2019, 13:57 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 7
Регистрация: 4.12.2019

Репутация: нет
Всего: нет



На странице mql5.com/ru/signals/561919 нужно спарсить это значение:

user posted image

Это svg-графика.

Если нажать в браузере F12, то показывает такое:

user posted image

Какой ХPath запрос нужно задать?

И возможно ли вообще парсить значения с svg-графики?

(пользуюсь программой Screaming Frog SEO Spider)

пс: вариант   //*[name()='text'][8]//*[name()='tspan'][2]   не сработал
отсюда я делаю предположение, что программа Screaming Frog SEO Spider просто не умеет работать с svg-графикой.

Это сообщение отредактировал(а) danminin - 5.12.2019, 20:08
PM MAIL   Вверх
whatisnot
Дата 6.12.2019, 16:42 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Шустрый
*


Профиль
Группа: Участник
Сообщений: 130
Регистрация: 14.12.2014

Репутация: 1
Всего: 2



А РНР тут причем?
PM MAIL   Вверх
danminin
Дата 6.12.2019, 18:07 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 7
Регистрация: 4.12.2019

Репутация: нет
Всего: нет



Цитата(whatisnot @ 6.12.2019,  16:42)
А РНР тут причем?

не знаю. просто не знал в каком разделе разместить эту тему.  smile 
PM MAIL   Вверх
ksnk
Дата 7.12.2019, 01:00 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


прохожий
****


Профиль
Группа: Комодератор
Сообщений: 6855
Регистрация: 13.4.2007
Где: СПб

Репутация: 96
Всего: 386



С svg Xpath работает странновато 
Если скопировать XPath из консоли отладки, то получится вот такое что-то
Код

//*[@id="radarChart"]/svg/text[8]/tspan[2]

Однако оно не работает, а вот такое - работает
Код

//*[@id="radarChart"]/*[name()="svg"]/*[name()="text"][8]/*[name()="tspan"][2]

Тоесть любой элемент svg требуется подменить на конструкцию с поиском по имени... 
За что, и про что на ровном месте такой геморрой - тайна сия велика есть...


--------------------
Человеку свойственно ошибаться, программисту свойственно ошибаться профессионально ! user posted image
PM MAIL WWW Skype   Вверх
danminin
Дата 8.12.2019, 08:23 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 7
Регистрация: 4.12.2019

Репутация: нет
Всего: нет



Цитата(ksnk @ 7.12.2019,  01:00)
Однако оно не работает, а вот такое - работает
Код

//*[@id="radarChart"]/*[name()="svg"]/*[name()="text"][8]/*[name()="tspan"][2]

Тоесть любой элемент svg требуется подменить на конструкцию с поиском по имени... 
За что, и про что на ровном месте такой геморрой - тайна сия велика есть...

да работает. но в моей программе Screaming Frog SEO Spider оно не работает.
не умеет эта программа свг графику читать(

Это сообщение отредактировал(а) danminin - 8.12.2019, 08:25
PM MAIL   Вверх
ksnk
Дата 8.12.2019, 11:16 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


прохожий
****


Профиль
Группа: Комодератор
Сообщений: 6855
Регистрация: 13.4.2007
Где: СПб

Репутация: 96
Всего: 386



Screaming Frog, если не ошибаюсь, просто качает исходный текст страницы и пытается его разобрать. А в исходнике никакого svg нет, он рисуется скриптами.
Убеди лягуху искать вот этот кусок текста по исходникам
Код

{
                                value : 34.5,
                                name : 'Максимальная просадка',
                                title : '...



--------------------
Человеку свойственно ошибаться, программисту свойственно ошибаться профессионально ! user posted image
PM MAIL WWW Skype   Вверх
danminin
Дата 8.12.2019, 18:43 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 7
Регистрация: 4.12.2019

Репутация: нет
Всего: нет



Цитата(ksnk @ 8.12.2019,  11:16)
Screaming Frog, если не ошибаюсь, просто качает исходный текст страницы и пытается его разобрать. А в исходнике никакого svg нет, он рисуется скриптами.
Убеди лягуху искать вот этот кусок текста по исходникам
Код

{
                                value : 34.5,
                                name : 'Максимальная просадка',
                                title : '...


Нашел такое содержимое в исходнике:

value : 34.5,

name : 'Максимальная просадка',

title : 'Денежная просадка показывает зафиксированную максимальную просадку в денежном выражении и является наибольшим перепадом между последним максимумом и текущим минимумом. Может превышать абсолютную просадку и дает представление о сумме возможного проигрыша даже при торговле с прибыльным результатом. В скобках дается значение в процентах на момент достижения просадки. '

-------------------------------------------------------------------------------------

А как ХPath задать, чтобы вытянуть эту цифру 34,5, не знаю...

В программе есть  еще поиск по CSSPAth, и по Regex.
Может ими как-то воспользоваться?

Это сообщение отредактировал(а) danminin - 8.12.2019, 19:18
PM MAIL   Вверх
danminin
Дата 9.12.2019, 11:19 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 7
Регистрация: 4.12.2019

Репутация: нет
Всего: нет



Цитата(ksnk @ 8.12.2019,  11:16)
Screaming Frog, если не ошибаюсь, просто качает исходный текст страницы и пытается его разобрать. А в исходнике никакого svg нет, он рисуется скриптами.
Убеди лягуху искать вот этот кусок текста по исходникам
Код

{
                                value : 34.5,
                                name : 'Максимальная просадка',
                                title : '...

Я вообще не знаю, что такое value, name и title. И как их брать со страницы с помощью XPath.
PM MAIL   Вверх
ksnk
Дата 9.12.2019, 14:23 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


прохожий
****


Профиль
Группа: Комодератор
Сообщений: 6855
Регистрация: 13.4.2007
Где: СПб

Репутация: 96
Всего: 386



Это текст внутри вставки javascript на странице. Вероятно, искать нужно регуляркой, так как Xpath тут будет бессилен. Какой синтаксис регулярок у лягухи - не в курсе. Для php это было бы что-то вроде
"/value : ([\.\d]+),\s+name : 'Максимальная просадка'/siu",


--------------------
Человеку свойственно ошибаться, программисту свойственно ошибаться профессионально ! user posted image
PM MAIL WWW Skype   Вверх
danminin
Дата 9.12.2019, 15:32 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 7
Регистрация: 4.12.2019

Репутация: нет
Всего: нет



Цитата(ksnk @ 9.12.2019,  14:23)
Это текст внутри вставки javascript на странице. Вероятно, искать нужно регуляркой, так как Xpath тут будет бессилен. Какой синтаксис регулярок у лягухи - не в курсе. Для php это было бы что-то вроде
"/value : ([\.\d]+),\s+name : 'Максимальная просадка'/siu",

Спасибо за наводку.
Почитаю про регулярные выражения в Screaming Frog SEO Spider.
PM MAIL   Вверх
danminin
Дата 9.12.2019, 19:01 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 7
Регистрация: 4.12.2019

Репутация: нет
Всего: нет



Цитата(ksnk @ 9.12.2019,  14:23)
Это текст внутри вставки javascript на странице. Вероятно, искать нужно регуляркой, так как Xpath тут будет бессилен. Какой синтаксис регулярок у лягухи - не в курсе. Для php это было бы что-то вроде
"/value : ([\.\d]+),\s+name : 'Максимальная просадка'/siu",

Спасибо.

Это регулярное выражение подошло:

value : ([\.\d]+),\s+name : 'Максимальная просадка'
PM MAIL   Вверх
Xahina
Дата 26.12.2020, 18:24 (ссылка) | (нет голосов) Загрузка ... Загрузка ... Быстрая цитата Цитата


Новичок



Профиль
Группа: Участник
Сообщений: 12
Регистрация: 25.12.2020

Репутация: нет
Всего: нет




Модератор: Сообщение скрыто.

PM MAIL   Вверх
  
Ответ в темуСоздание новой темы Создание опроса
Правила форума "PHP"
Aliance
IZ@TOP
skyboy
SamDark
MoLeX

Новичкам:

  • PHP редакторы собираются и обсуждаются здесь
  • Электронные книги по PHP, документацию можно найти здесь
  • Интерпретатор PHP, полную документацию можно скачать на PHP.NET

Важно:

  • Не брезгуйте пользоваться тегами [code=php]КОД[/code] для повышения читабельности текста/кода.
  • Перед созданием новой темы воспользуйтесь поиском и загляните в FAQ
  • Действия модераторов можно обсудить здесь

Внимание:

  • Темы "ищу скрипт", "подскажите скрипт" и т.п. будут переноситься в форум "Web-технологии"
  • Темы с именами: "Срочно", "помогите", "не знаю как делать" будут УДАЛЯТЬСЯ

Если Вам понравилась атмосфера форума, заходите к нам чаще! С уважением, IZ@TOP, skyboy, SamDark, MoLeX, awers.

 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:
« Предыдущая тема | PHP: Общие вопросы | Следующая тема »


 




[ Время генерации скрипта: 0.1879 ]   [ Использовано запросов: 21 ]   [ GZIP включён ]


Реклама на сайте     Информационное спонсорство

 
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности     Powered by Invision Power Board(R) 1.3 © 2003  IPS, Inc.