Crawl Errors: The Next Generation
Hétfő, március 12, 2012
a Crawl errors a Webmestereszközök egyik legnépszerűbb funkciója, és ma néhány nagyon jelentős fejlesztést vezetünk be, amelyek még hasznosabbá teszik.
most számos új típusú hibát észlelünk és jelentünk. Az új adatok értelmezésének elősegítése érdekében a hibákat két részre osztottuk: webhelyhibákra és URL-hibákra.
Webhelyhibák
a Webhelyhibák olyan hibák, amelyek nem egy adott URL—re vonatkoznak-a teljes webhelyet érintik. Ezek közé tartoznak a DNS-felbontási hibák, a webkiszolgálóval kapcsolatos csatlakozási problémák és a robotok letöltésével kapcsolatos problémák.txt fájl. Ezeket a hibákat URL szerint szoktuk jelenteni, de ennek nem volt sok értelme, mert nem specifikusak az egyes URL—ekre-sőt, megakadályozzák, hogy a Googlebot még URL-t is kérjen! Ehelyett most nyomon követjük az egyes webhelyszintű hibák meghibásodási arányát. Megpróbálunk riasztásokat is küldeni, ha ezek a hibák elég gyakoriak ahhoz, hogy figyelmet érdemeljenek.
Továbbá, ha nincs (és nem volt mostanában) problémája ezeken a területeken, mint sok webhely esetében, nem fogjuk zavarni ezt a részt. Helyette, csak mutatunk néhány barátságos pipát, hogy tudd, minden hunky-dory.
URL-hibák
az URL-hibák egy adott oldalra jellemző hibák. Ez azt jelenti, hogy amikor a Googlebot megpróbálta feltérképezni az URL-t, képes volt feloldani a DNS-t, csatlakozni a szerverhez, letölteni és olvasni a robotokat.txt fájlt, majd kérje ezt az URL-t,de valami rosszul ment. Az URL-hibákat különböző kategóriákra bontjuk annak alapján, hogy mi okozta a hibát. Ha webhelye Google Hírek vagy mobil (CHTML/XHTML) adatokat szolgáltat, külön kategóriákat jelenítünk meg ezekre a hibákra.
a kevesebb több
minden típusból legfeljebb 100 000 hibát mutattunk meg. Az összes információ elfogyasztása olyan volt, mint egy tűzoltóból való ivás, és nem lehetett tudni, hogy ezek közül a hibák közül melyik fontos (a kezdőlapod nem működik) vagy kevésbé fontos (valaki személyes webhelye elírta a webhelyére mutató linket). Nem volt reális módja annak, hogy megtekinthesse az összes 100 000 hibát—nem lehet rendezni, keresni vagy megjelölni a haladást. Ennek a szolgáltatásnak az új verziójában arra összpontosítottunk, hogy csak a legfontosabb hibákat próbáljuk megadni. Minden kategóriában megadjuk az 1000 legfontosabb és végrehajtható hibát. Rendezheti és szűrheti ezeket az 1000 legfontosabb hibát, tudassa velünk, ha úgy gondolja, hogy kijavította őket, és megtekintheti a róluk szóló részleteket.
egyes webhelyeken több mint 1000 hiba van egy adott típusban, így továbbra is láthatja az egyes típusok hibáinak teljes számát, valamint egy grafikont, amely 90 napra visszamenőleg mutatja a korábbi adatokat. Azok számára, akik attól tartanak, hogy az 1000 hiba részletei, valamint a teljes összesített szám nem lesz elég, fontolóra vesszük a programozott hozzáférés (API) hozzáadását, hogy minden utolsó hibát letölthessen, ezért kérjük, adjon visszajelzést, ha többre van szüksége.
eltávolítottuk a robotok által blokkolt oldalak listáját is.txt, mert bár ezek néha hasznosak lehetnek a robotok problémájának diagnosztizálásához.TXT fájl, gyakran szándékosan blokkolt oldalak. Nagyon szerettünk volna a hibákra összpontosítani, ezért keressen információkat a robotolt URL-ekről, amelyek hamarosan megjelennek a “bejáró hozzáférés” funkcióban a “webhely konfigurációja”alatt.
merülés a részletekbe
a fő listából egy egyedi hiba URL-re kattintva megjelenik egy részletes ablaktábla, amely további információkat tartalmaz, beleértve azt is, amikor utoljára próbáltuk feltérképezni az URL-t, amikor először észleltünk egy problémát, valamint a hiba rövid magyarázatát.
A részletek ablaktáblán rákattinthat a hibát okozó URL hivatkozására, hogy megnézze, mi történik, amikor megpróbálja meglátogatni. A hibát “fixed” – ként is megjelölheti (erről később!), tekintse meg a hibatípus súgótartalmát, sorolja fel az URL-t tartalmazó webhelytérképeket, tekintse meg az erre az URL-re hivatkozó többi oldalt, sőt a Googlebot azonnal lekérje az URL-t, vagy további információkért, vagy annak ellenőrzéséhez, hogy a javítás működött-e.
tegyen lépéseket!
egy dolog, amit nagyon izgatottak vagyunk a feltérképezési hibák ezen új verziójában, az az, hogy először valóban a legfontosabb javításra összpontosíthat. A hibákat úgy rangsoroltuk, hogy a prioritási lista tetején lévők azok legyenek, ahol van valami, amit tehetünk, függetlenül attól, hogy a saját webhelyén hibás linkeket rögzítünk, a szerver szoftver hibáit kijavítjuk, frissítjük a webhelytérképeket a halott URL-ek metszésére, vagy hozzáadunk egy 301-es átirányítást, hogy a felhasználók a “valódi” oldalra kerüljenek. Ezt számos tényező alapján határozzuk meg, beleértve azt is, hogy felvette-e az URL-t egy Webhelytérképbe, hány helyről kapcsolódik (és ha ezek közül bármelyik is szerepel a webhelyén), és hogy az URL kapott-e forgalmat a közelmúltban a keresésből.
ha úgy gondolja, hogy kijavította a problémát (tesztelheti a javítást úgy, hogy az URL-t Googlebot-ként tölti be), tudassa velünk, ha a hibát “javítva” – ként jelöli meg, ha teljes hozzáférési jogosultsággal rendelkező felhasználó. Ez eltávolítja a hibát a listáról. A jövőben a javítottként megjelölt hibák nem szerepelnek a legfontosabb hibák listájában, kivéve, ha ugyanazzal a hibával találkoztunk, amikor megpróbáltunk újra feltérképezni egy URL-t.
sok munkát fektettünk az új feltérképezési hibák funkcióba, ezért reméljük, hogy ez nagyon hasznos lesz az Ön számára. Tudassa velünk, mit gondol, és ha bármilyen javaslata van, kérjük, látogasson el fórumunkra!
írta: Kurt Dresner, Webmestereszközök csapata