Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум программистов > Yandex > Яндекс заходит на сайт, но не индексирует. Почему?


Автор: mita 21.1.2007, 12:44
Яндекс заходит на сайт, но не индексирует. Почему?

В логах записано:

"GET /robots.txt HTTP/1.1" 200 23 "-" "Yandex/1.03.003 (compatible; Win16; I)"
"GET / HTTP/1.1" 200 10866 "-" "Yandex/1.03.003 (compatible; Win16; I)"


и после этого все, яндекс у меня на сайте больше ничего не делает и уходит.

В robots.txt записано следующее:
User-agent: *
Disallow:
, т.е. разрешает индексить всё, но не индексирует.

Притом эта проблема не так давно возникла на многих сайтах.

Помогите разобраться в чем дело, и как заставить робота делать то что он должен??

Автор: mishaSL 23.1.2007, 12:18
Цитата(mita @  21.1.2007,  12:44 Найти цитируемый пост)
В robots.txt записано следующее:
User-agent: *
Disallow:


Это означает, что весь сайт закрыт к индексации. Поменяй robots.txt и все будет индексироваться. А на будущее вот пару ссылок:
Проверка robots.txt Яндексом:
http://www.yandex.ru/cgi-bin/test-robots

Стандпрт файла robots.txt:
http://www.citforum.ru/internet/search/rbtspec.shtml


Автор: mita 23.1.2007, 22:06
Цитата

Это означает, что весь сайт закрыт к индексации. 



...проверила - все нормально...

http://www.yandex.ru/cgi-bin/test-robots
>>Данный файл robots.txt ничего не запрещает.

эта запись означает что весь сайт разрешен к индексации,
а вот запись Disallow:/   как раз значит что весь сайт закрыт


Автор: mishaSL 25.1.2007, 16:22
mita, ты пойми что есть стандарт по которому пишется robots.txt, если ты пишешь в robots.txt Disallow:, то дальше должен идти url (или его часть) который запрещен к индексации. 
Самый лучший вариант это написать в support Яндекса, обычно отвичают в течении 5 дней. Может на твой сайт наложен фильтр или вообще забанен smile 


Автор: mita 25.1.2007, 21:33
вот как раз по стандарту:

Disallow: - разрешить все

Disallow:/  - запретить все

Если я буду по каджому своему сайту писать в саппорт меня спамером там назовут smile

Сайты не в бане.

Они только что созданы, имеют уникальный контент,  в общем ничего левого за что банят.

Однако такое поведение яндекса наблюдается......возможно это нормально, еси так что что это значит??

Почему основной индексирующий заходит, обращается к роботс, корню и уходит??

"GET /robots.txt HTTP/1.1" 200 23 "-" "Yandex/1.03.003 (compatible; Win16; I)"
"GET / HTTP/1.1" 200 10866 "-" "Yandex/1.03.003 (compatible; Win16; I)"

(кстати дело совсем не в роботс.тхт, там где он отсутствует тож иногда яндекс себя так ведет)

Автор: mishaSL 26.1.2007, 12:48
Есть конечно еще куча вариантов почему может не индексировать, но это уже странно:
1. Сервер отдает ответ не равный 200 (посмотри заголовки, если не 200, то индексации не будет, это бывает крайне редко, когда сервер настроен не правильно)
2. Один раз видел что не индексировался из-из html кода (видел только один раз такое, но нам html было сложно назвать html-ем все о одну строку и атрибуты вообще неизвестно откуда)
3. Иногда не индексируется из-за очень большого времени отклика сервера (когда время загрузки большое (точно не могу сказать сколько, но где-то более 5 сек))
4. Не индексируется если домен определен зеркалом другого домена (в твоем случае это не подходит)
5. Ну и соответственно скажи зону и домен какого уровня (последнее время очень плохо индексируются бесплатные домены).


Автор: mita 26.1.2007, 13:58
Цитата

1. Сервер отдает ответ не равный 200 (посмотри заголовки, если не 200, то индексации не будет, это бывает крайне редко, когда сервер настроен не правильно)
2. Один раз видел что не индексировался из-из html кода (видел только один раз такое, но нам html было сложно назвать html-ем все о одну строку и атрибуты вообще неизвестно откуда)
3. Иногда не индексируется из-за очень большого времени отклика сервера (когда время загрузки большое (точно не могу сказать сколько, но где-то более 5 сек))
4. Не индексируется если домен определен зеркалом другого домена (в твоем случае это не подходит)
5. Ну и соответственно скажи зону и домен какого уровня (последнее время очень плохо индексируются бесплатные домены).



1. норм
2. Да вродь все норм
3. как это можно проверить? 
4.-
5. планый нормальный домен


Еще хочу заметить, что такую фигню видела только у яндексовского бота....ниодин так больше не делает

Автор: mishaSL 26.1.2007, 15:53
Скажи адрес сайта.

Автор: mita 26.1.2007, 16:21
ang-kurs.com например

 - - [18/Jan/2007:03:34:47 +0300] "GET /robots.txt HTTP/1.1" 404 - "-" "Yandex/1.01.001 (compatible; Win16; I)"
 - - [18/Jan/2007:03:34:49 +0300] "GET / HTTP/1.1" 200 22809 "-" "Yandex/1.01.001 (compatible; Win16; I)"


или тут australia-gid.ru

 - - [19/Jan/2007:09:02:38 +0300] "GET /robots.txt HTTP/1.1" 404 8148 "-" "Yandex/1.01.001 (compatible; Win16; I)" (вот тут еще интересно, 404 ошибка, а 8 к принял)
 - - [19/Jan/2007:09:02:38 +0300] "GET / HTTP/1.1" 200 10622 "-" "Yandex/1.01.001 (compatible; Win16; I)"


Автор: catlion 26.1.2007, 18:37
Цитата

Еси заходит робот, который приходит при добавлении сайта в АддУрл, то происходит то что описано выше. Однако если приходит основной индексирующий робот - он все нормально индексирует


Насколько я знаю, задача робота "который приходит при добавлении сайта в АддУрл", тупо проверять сайт на доступность. Никаких действий по индексации контента он не производит.

Автор: mita 26.1.2007, 19:19
Тут я немного ошиблась с формулировкой...

На самом деле АддУрл робот заходит как правильно только для проверки, однако как-то видела что он и индексировал...но меня волнует не вопрос АддУрл-овского робота, а основного индексируещего.

Автор: mishaSL 28.1.2007, 16:37
посмотрел на australia-gid.ru вроде все должно индексироваться. Если не индексируется больше месяца, то пиши в support яндекса. Так скажут точно. smile 

Автор: Igor_CH 28.1.2007, 17:09
Было подобное, пиши в support, иногда у них ошибка.
Толко не надейся что с первого раза помогут, скажут что все ок, а сайт все ровно не индексируется, еще раз писать, а может и еще раз, помогут, верь...

Автор: mita 29.1.2007, 21:33
хм....и сколько раз писать?
один раз меня уже послали smile

Автор: mishaSL 30.1.2007, 12:58
Цитата(mita @  29.1.2007,  21:33 Найти цитируемый пост)
один раз меня уже послали

Каким образом послали?



Цитата(mita @  29.1.2007,  21:33 Найти цитируемый пост)
хм....и сколько раз писать?

Обычно 1 2 раза хватает. Только пиши уважительно и по делу не прикидваясь обычным пользователем интернета который случайно обзовелся сайтом smile  Пиши точные факты,  в течении 2 периода мой сайт не индексируется яндексом, в логах пишется то-то, скажите в чем может быть проблема. не наложен ли на мой сайт какой-нибудь фильтр и т.д. Как правило помогает.

Автор: mita 30.1.2007, 16:50
так....уже с двуя сайтами "послали"

Послали в том плане, что говоорят что все хоршо и ваш сайт обязательно будет проиндексирован по мере обхода робота.

Ну 2 месяца это уже слишком для ожидания его обхода.

Автор: mishaSL 30.1.2007, 17:24
Еще раз подробнее рассмотрел проблемы с твоим сайтом australia-gid.ru.
Вроде все нормально, сегодня ночью была индексация у тебя проиндексировало 1 страницу http://www.yandex.ru/yandsearch?ras=1&text=&site=australia-gid.ru

Только посмотри в логах какой робот индексировал, если Yandex/1.01.001 (compatible; Win16; I)  - это основной индексирующий робот, то должен дальше тоже нормально индексироваться. Если Yandex/1.03.003 (compatible; Win16; D) - это робот, обращающийся к странице при добавлении ее через форму, то может снова потерять твой сайт.

А вообще должен индексировать, с сервером вроде все нормально, другие сайты с этого сервера тоже индексирует http://search.msn.com/results.aspx?q=ip%3A64.21.16.208&FORM=MSNH

На самом деле последние месяцы Яндекс плохо индексировал большенство сайтов, т.к. железо меняли они. smile 

Автор: mita 30.1.2007, 20:58
Индексировал основной индексирующий.

Интересно почему в логах у меня проиндексировано еще 26 января страниц 20, 
а в поиске после апдейта отображается только одна...

Возможно просто нужно ждать следующего апдейта, но возможно этому есть объяснение...

такая же ситуация и со вторым сайтом: ang-kurs.com

Автор: mishaSL 31.1.2007, 12:38
Страницы могут быть проиндексированы давно, а появиться в результатах сейчас. Они появляются постепенно. В твоем случае я думаю они должны появиться smile 

Автор: Str!pe 5.2.2007, 19:25
Цитата(mita @  30.1.2007,  16:50 Найти цитируемый пост)
Послали в том плане, что говоорят что все хоршо и ваш сайт обязательно будет проиндексирован по мере обхода робота.


Робот может и даллеко не через месяц прийти.

mita
На валидность кода проверь его 
http://validator.w3.org/

Автор: dimihendrix 27.10.2012, 17:56
Написал статью «Почему сайт не индексируется, или, о чём нужно было позаботиться заранее» http://webcaum.ru/pochemu-sajt-ne-indeksiruetsya.html. Почитайте, может кому-то пригодится.

Автор: lesic25 29.12.2012, 03:42
для Яндекса создается отедельная запись в robots.txt обязательно укажите host:название главного зеркала сайта

Автор: SozdaySayt 16.1.2013, 19:18
Для быстрой индексации сайта, рекомендую воспользоваться нашим сервисом http://sozdaysayt.ru, выполним качественно кросспостинг по различным блогам и микроблогам, есть бесплатный тарифный план, так что платить даже не придется. После данной услуги Ваш сайт начнет индексироваться гораздо быстрее и лучше.

Автор: Gampos 23.4.2013, 07:48
Кросспостинг, твитер, все это ускорит индексацию.

Автор: Алексей1985 5.10.2013, 17:59
Цитата(mita @ 21.1.2007,  12:44)
Яндекс заходит на сайт, но не индексирует. Почему?

В логах записано:

"GET /robots.txt HTTP/1.1" 200 23 "-" "Yandex/1.03.003 (compatible; Win16; I)"
"GET / HTTP/1.1" 200 10866 "-" "Yandex/1.03.003 (compatible; Win16; I)"


и после этого все, яндекс у меня на сайте больше ничего не делает и уходит.

В robots.txt записано следующее:
User-agent: *
Disallow:
, т.е. разрешает индексить всё, но не индексирует.

Притом эта проблема не так давно возникла на многих сайтах.

Помогите разобраться в чем дело, и как заставить робота делать то что он должен??

Да возможно сайт закрыт от индексации в файле robots.txt, просмотреть можно набрав в строке браузера доменное имя вашего сайта и после слеша "/" дописать  "robots.txt" , например так http://ваш сайт/robots.txt и посмотрите какие папки и директории закрыты. Более подробно о настройке индексайии читайте тут : http://inetdomrabota.ru/optimizaciya-html-koda-shablona-dlya-luchshej-indeksacii/

Автор: kryapov 3.3.2014, 14:57
Возможно по фильтр попал.
_________________
http://www.etc-russia.ru/projects/light/

Автор: GlobalTechnology 4.3.2014, 09:46
Ценное замечание) Спустя несколько лет)

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)