erori de accesare cu crawlere: următoarea generație
luni, 12 martie 2012
erori de accesare cu crawlere este una dintre cele mai populare caracteristici din instrumentele pentru webmasteri, iar astăzi lansăm câteva îmbunătățiri foarte importante care o vor face și mai utilă.
acum detectăm și raportăm multe tipuri noi de erori. Pentru a ajuta la înțelegerea noilor date, am împărțit erorile în două părți: erori de site și erori URL.
erori de Site
erorile de Site sunt erori care nu sunt specifice unei anumite adrese URL—ele afectează întregul site. Acestea includ eșecuri de rezoluție DNS, probleme de conectivitate cu serverul dvs. web și probleme de preluare a roboților.fișier txt. Obișnuiam să raportăm aceste erori prin URL, dar asta nu avea prea mult sens, deoarece nu sunt specifice adreselor URL individuale—de fapt, împiedică Googlebot să solicite chiar și o adresă URL! În schimb, acum urmărim ratele de eșec pentru fiecare tip de eroare la nivel de site. De asemenea, vom încerca să vă trimitem alerte atunci când aceste erori devin suficient de frecvente încât să justifice atenția.
mai mult, dacă nu aveți (și nu ați avut recent) probleme în aceste domenii, așa cum este cazul multor site-uri, nu vă vom deranja cu această secțiune. În schimb, vă vom arăta doar câteva semne de verificare prietenoase pentru a vă anunța că totul este frumos.
erori URL
erori URL sunt erori specifice unei anumite pagini. Aceasta înseamnă că atunci când Googlebot a încercat să acceseze cu crawlere adresa URL, a reușit să vă rezolve DNS-ul, să vă conecteze la serverul dvs., să vă aducă și să vă citească roboții.fișier txt, apoi solicitați această adresă URL, dar ceva a mers prost după aceea. Împărțim Erorile URL în diferite categorii pe baza a ceea ce a cauzat eroarea. Dacă site-ul dvs. servește date Google News sau mobile (CHTML/XHTML), vom afișa categorii separate pentru aceste erori.
Less is more
obișnuiam să vă arătăm cel mult 100.000 de erori ale fiecărui tip. Încercarea de a consuma toate aceste informații a fost ca și cum ai bea dintr-o firehose și nu aveai de unde să știi care dintre aceste erori erau importante (pagina ta de pornire este în jos) sau mai puțin importante (site-ul personal al cuiva a făcut o greșeală de scriere într-un link către site-ul tău). Nu a existat nici o modalitate realistă de a vizualiza toate cele 100.000 de erori—nici o modalitate de a sorta, de căutare, sau marca progresul. În noua versiune a acestei funcții, ne-am concentrat pe încercarea de a vă oferi doar cele mai importante erori în față. Pentru fiecare categorie, vă vom oferi ceea ce credem că sunt cele mai importante 1000 de erori. Puteți sorta și filtra aceste erori de top 1000, să ne anunțați când credeți că le-ați remediat și să vizualizați detalii despre ele.
unele site-uri au mai mult de 1000 de erori de un anumit tip, astfel încât veți putea vedea în continuare numărul total de erori pe care le aveți pentru fiecare tip, precum și un grafic care prezintă Date istorice care datează de 90 de zile. Pentru cei care vă faceți griji că detaliile de eroare 1000 plus un număr total agregat nu vor fi suficiente, ne gândim să adăugăm acces programatic (un API) pentru a vă permite să descărcați fiecare ultimă eroare pe care o aveți, așa că vă rugăm să ne oferiți feedback dacă aveți nevoie de mai mult.
am eliminat, de asemenea, lista de pagini blocate de roboți.txt, pentru că, deși acestea pot fi uneori utile pentru diagnosticarea unei probleme cu roboții dvs.fișier txt, acestea sunt frecvent pagini pe care le blocat în mod intenționat. Am vrut cu adevărat să ne concentrăm asupra erorilor, așa că căutați informații despre adresele URL robotizate pentru a apărea în curând în funcția „acces pe șenile” din „Configurare Site”.
scufundați-vă în detalii
dacă faceți clic pe o adresă URL de eroare individuală din lista principală, apare un panou de detalii cu informații suplimentare, inclusiv când am încercat ultima dată să accesăm URL-ul, când am observat prima dată o problemă și o scurtă explicație a erorii.
din panoul Detalii puteți face clic pe linkul pentru adresa URL care a cauzat eroarea pentru a vedea singur ce se întâmplă atunci când încercați să o vizitați. De asemenea, puteți marca eroarea ca fiind „fixă” (mai multe despre asta mai târziu!), vizualizați conținutul de ajutor pentru tipul de eroare, listați Sitemap-urile care conțin adresa URL, vedeți alte pagini care se leagă de această adresă URL și chiar Solicitați Googlebot să aducă adresa URL chiar acum, fie pentru mai multe informații, fie pentru a verifica dacă remedierea dvs. a funcționat.
ia măsuri!
un lucru de care suntem foarte încântați în această nouă versiune a funcției erori de accesare cu crawlere este că vă puteți concentra cu adevărat pe remedierea a ceea ce este cel mai important mai întâi. Am clasat erorile astfel încât cele din partea de sus a listei de priorități să fie cele în care puteți face ceva, indiferent dacă remediați linkurile rupte de pe propriul site, remediați erorile din software-ul serverului, actualizați Sitemap-urile pentru a tăia adresele URL moarte sau adăugați o redirecționare 301 pentru a atrage utilizatorii la pagina „reală”. Determinăm acest lucru pe baza unei multitudini de factori, inclusiv dacă ați inclus sau nu adresa URL într-un Sitemap, din Câte locuri este legată (și dacă oricare dintre acestea se află și pe site-ul dvs.) și dacă adresa URL a obținut trafic recent din căutare.
după ce credeți că ați rezolvat problema (puteți testa remedierea dvs. prin preluarea adresei URL ca Googlebot), ne puteți anunța marcând eroarea ca „fixă” dacă sunteți un utilizator cu permisiuni de acces complet. Aceasta va elimina eroarea din lista dvs. În viitor, erorile pe care le-ați marcat ca fiind remediate nu vor fi incluse în lista de erori de top, cu excepția cazului în care am întâlnit aceeași eroare atunci când încercăm să redirecționăm o adresă URL.
am pus o mulțime de muncă în noua caracteristică erori de accesare cu crawlere, așa că sperăm că va fi foarte util pentru tine. Spuneți-ne ce credeți și dacă aveți sugestii, vă rugăm să vizitați forumul nostru!
scris de Kurt Dresner, echipa de instrumente pentru webmasteri