![]() |
Модераторы: LSD, AntonSaburov |
![]() ![]() ![]() |
|
telecom |
|
|||
Новичок Профиль Группа: Участник Сообщений: 8 Регистрация: 9.2.2010 Репутация: нет Всего: нет |
Доброго времени суток.
У меня возник такой вопрос, извиняюсь, если не та ветка. Необходимо прочитать htm файл большого размера (примерно 18mb), т.е. его контент. В этом контенте таблица с кучей строк, так вот необходимо их прочитать, т.е. извлечь данные, а именно заголовок таблицы(названия столбцов) и соответственно данные из строк .... т.е. возможно, все эти данные "прочитать" либо в таблицу БД или Excel.. Подскажите, пожалуйста, как мне поступить, как это реализовать? |
|||
|
||||
aleksandy |
|
|||
Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 260 Регистрация: 17.12.2006 Репутация: 4 Всего: 5 |
Парсить исходный код страницы либо вручную, либо регулярными выражениями.
|
|||
|
||||
kemiisto |
|
|||
![]() Дикий Кот. =^.^= ![]() ![]() ![]() ![]() Награды: 1 Профиль Группа: Участник Клуба Сообщений: 3292 Регистрация: 29.7.2007 Репутация: 5 Всего: 160 |
Парсить HTML регулярными выражениями дозволено только Чаку Норису. ![]() Это сообщение отредактировал(а) kemiisto - 15.10.2010, 09:26 -------------------- |
|||
|
||||
Nofate |
|
|||
![]() Опытный ![]() ![]() Профиль Группа: Участник Сообщений: 266 Регистрация: 13.10.2008 Репутация: 4 Всего: 8 |
Вот недавно обсуждали: http://forum.vingrad.ru/forum/topic-309512...y2209674/0.html
-------------------- The future is not set, there is no fate but what we make for ourselves. Нофейтово пространство и смежные области |
|||
|
||||
telecom |
|
|||
Новичок Профиль Группа: Участник Сообщений: 8 Регистрация: 9.2.2010 Репутация: нет Всего: нет |
Вот мой код HTML:
И как мне из таблицы вытянуть данные? |
|||
|
||||
mantracoder |
|
|||
Шустрый ![]() Профиль Группа: Участник Сообщений: 51 Регистрация: 3.8.2007 Репутация: 1 Всего: 1 |
Не так давно тоже искал вменяемый парсер для HTML. После нескольких экспериментов выбрал этот:
http://sourceforge.net/projects/nekohtml/ Причины: 1) Дружит с SAX; 2) Быстрый и надежный (проверялось на больших и не валидных HTML страницах); 3) Неплохо документирован. Это сообщение отредактировал(а) mantracoder - 15.10.2010, 15:02 |
|||
|
||||
![]() ![]() ![]() |
Правила форума "Java" | |
|
Если Вам помогли, и атмосфера форума Вам понравилась, то заходите к нам чаще! С уважением, LSD, AntonSaburov, powerOn, tux, javastic. |
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) | |
0 Пользователей: | |
« Предыдущая тема | Java: Общие вопросы | Следующая тема » |
|
По вопросам размещения рекламы пишите на vladimir(sobaka)vingrad.ru
Отказ от ответственности Powered by Invision Power Board(R) 1.3 © 2003 IPS, Inc. |