Błędy indeksowania: następna generacja
poniedziałek, 12 marca 2012
Błędy indeksowania to jedna z najpopularniejszych funkcji narzędzi dla webmasterów.
wykrywamy i zgłaszamy wiele nowych typów błędów. Aby pomóc zrozumieć nowe dane, podzieliliśmy błędy na dwie części: błędy witryny i błędy URL.
błędy witryny
błędy witryny to błędy, które nie są specyficzne dla określonego adresu URL—wpływają na całą witrynę. Należą do nich awarie rozdzielczości DNS, problemy z łącznością z serwerem internetowym i problemy z pobieraniem robotów.plik txt. Kiedyś zgłaszaliśmy te błędy za pomocą adresu URL, ale nie miało to większego sensu, ponieważ nie są one specyficzne dla poszczególnych adresów URL—w rzeczywistości uniemożliwiają Googlebotowi nawet żądanie adresu URL! Zamiast tego śledzimy wskaźniki awaryjności dla każdego typu błędów w całej witrynie. Postaramy się również wysłać Ci alerty, gdy te błędy staną się na tyle częste, że zasługują na uwagę.
Ponadto, jeśli nie masz (i nie miałeś ostatnio) żadnych problemów w tych obszarach, jak ma to miejsce w przypadku wielu witryn, nie będziemy ci przeszkadzać w tej sekcji. Zamiast tego pokażemy Ci kilka przyjaznych znaków czekowych, abyś wiedział, że wszystko jest super.
błędy URL
błędy URL to błędy specyficzne dla konkretnej strony. Oznacza to, że gdy Googlebot próbował przeszukiwać adres URL, był w stanie rozwiązać Twój DNS, połączyć się z serwerem, pobrać i odczytać roboty.plik txt, a następnie zażądać tego adresu URL, ale coś poszło nie tak po tym. Błędy URL dzielimy na różne kategorie w zależności od przyczyny błędu. Jeśli Twoja witryna obsługuje dane Google News lub mobile (CHTML / XHTML), pokażemy osobne kategorie dla tych błędów.
mniej znaczy więcej
kiedyś pokazywaliśmy ci co najwyżej 100 000 błędów każdego typu. Próbowanie spożywania wszystkich tych informacji było jak picie z firehose, a ty nie miałeś możliwości dowiedzieć się, który z tych błędów jest ważny (Twoja strona główna jest wyłączona) lub mniej ważny (czyjaś osobista strona popełniła literówkę w linku do twojej strony). Nie było realistycznego sposobu na wyświetlenie wszystkich 100 000 błędów—nie było sposobu na sortowanie, wyszukiwanie ani zaznaczanie postępów. W nowej wersji tej funkcji skupiliśmy się na próbie podania z góry tylko najważniejszych błędów. Dla każdej kategorii podamy to, co uważamy za 1000 najważniejszych i możliwych do zastosowania błędów. Możesz sortować i filtrować te najlepsze błędy 1000, dać nam znać, gdy uważasz, że je naprawiłeś, i zobaczyć szczegóły na ich temat.
niektóre witryny mają więcej niż 1000 błędów danego typu, więc nadal będziesz mógł zobaczyć całkowitą liczbę błędów każdego typu, a także wykres przedstawiający dane historyczne z 90 dni wstecz. Dla tych, którzy obawiają się, że szczegóły błędu 1000 plus łączna liczba zagregowanych nie wystarczą, rozważamy dodanie dostępu programmatic (API), aby umożliwić Ci pobranie każdego ostatniego błędu, więc przekaż nam swoją opinię, jeśli potrzebujesz więcej.
usunęliśmy również listę stron zablokowanych przez roboty.txt, bo choć czasami mogą być przydatne do diagnozowania problemu z robotami.plik txt, są to często strony celowo zablokowane. Bardzo chcieliśmy skupić się na błędach, więc poszukaj informacji o zrobotyzowanych adresach URL, które wkrótce pojawią się w funkcji „Dostęp gąsienicowy” w sekcji „Konfiguracja witryny”.
zanurz się w szczegółach
kliknięcie indywidualnego adresu URL błędu z głównej listy powoduje wyświetlenie panelu szczegółów z dodatkowymi informacjami, w tym kiedy ostatnio próbowaliśmy przeszukiwać adres URL, kiedy po raz pierwszy zauważyliśmy problem i krótkie wyjaśnienie błędu.
z panelu szczegółów możesz kliknąć link adresu URL, który spowodował błąd, aby zobaczyć na własne oczy, co się dzieje podczas próby odwiedzenia go. Możesz również oznaczyć błąd jako „naprawiony” (więcej na ten temat później!), wyświetlanie zawartości pomocy dla typu błędu, wyświetlanie map witryn zawierających adres URL, zobacz inne strony, które zawierają link do tego adresu URL, a nawet Googlebot pobiera adres URL już teraz, aby uzyskać więcej informacji lub dwukrotnie sprawdzić, czy Twoja poprawka zadziałała.
podejmij działanie!
jedną z rzeczy, z których jesteśmy bardzo podekscytowani w tej nowej wersji funkcji błędów indeksowania, jest to, że możesz naprawdę skupić się na naprawieniu tego, co najważniejsze. Mamy rankingu błędy tak, że te na górze listy priorytetów będą te, w których jest coś, co można zrobić, czy to naprawianie uszkodzonych linków na własnej stronie, naprawianie błędów w oprogramowaniu serwera, aktualizowanie map witryn, aby przycinać martwe adresy URL, lub dodanie przekierowania 301, aby uzyskać użytkowników do „prawdziwej” strony. Określamy to na podstawie wielu czynników, w tym tego, czy adres URL został umieszczony w mapie witryny, z ilu miejsc jest połączony (i czy któreś z nich znajduje się również w Twojej witrynie) oraz czy adres URL uzyskał ostatnio ruch z wyszukiwarki.
gdy uważasz, że naprawiłeś problem (możesz przetestować poprawkę, pobierając adres URL jako Googlebot), możesz dać nam znać, oznaczając błąd jako „naprawiony”, jeśli jesteś użytkownikiem z pełnymi uprawnieniami dostępu. Spowoduje to usunięcie błędu z listy. W przyszłości błędy oznaczone jako naprawione nie będą uwzględniane na liście najlepszych błędów, chyba że napotkaliśmy ten sam błąd podczas próby ponownego przeszukiwania adresu URL.
włożyliśmy wiele pracy w nową funkcję błędów indeksowania, więc mamy nadzieję, że będzie ona dla ciebie bardzo przydatna. Daj nam znać, co myślisz, a jeśli masz jakieś sugestie, odwiedź nasze forum!
autor: Kurt Dresner, zespół Webmaster Tools