Crawl Errors: The Next Generation

Lunedì, marzo 12, 2012

Crawl errors è una delle caratteristiche più popolari in Strumenti per i Webmaster, e oggi stiamo implementando alcuni miglioramenti molto significativi che lo renderanno ancora più utile.

Ora rileviamo e segnaliamo molti nuovi tipi di errori. Per dare un senso ai nuovi dati, abbiamo diviso gli errori in due parti: errori del sito e errori URL.

Errori del sito

Gli errori del sito sono errori che non sono specifici per un particolare URL, ma influenzano l’intero sito. Questi includono errori di risoluzione DNS, problemi di connettività con il server Web e problemi di recupero dei robot.file txt. Abbiamo usato per segnalare questi errori per URL, ma questo non ha molto senso perché non sono specifici per i singoli URL – infatti, impediscono a Googlebot di richiedere anche un URL! Invece, ora teniamo traccia dei tassi di errore per ogni tipo di errore a livello di sito. Cercheremo anche di inviarti avvisi quando questi errori diventano abbastanza frequenti da giustificare l’attenzione.

Visualizza il tasso di errore e i conteggi del sito nel tempo

Inoltre, se non hai (e non hai avuto di recente) problemi in queste aree, come nel caso di molti siti, non ti disturberemo con questa sezione. Anziché, ci limiteremo a mostrare alcuni segni di spunta amichevoli per farvi sapere tutto è hunky-dory.

Un sito senza errori recenti a livello di sito

Errori URL

Gli errori URL sono errori specifici per una determinata pagina. Ciò significa che quando Googlebot ha cercato di eseguire la scansione dell’URL, è stato in grado di risolvere il DNS, connettersi al server, recuperare e leggere i robot.txt, e quindi richiedere questo URL, ma qualcosa è andato storto dopo che. Suddividiamo gli errori URL in varie categorie in base a ciò che ha causato l’errore. Se il tuo sito fornisce dati di Google News o mobile (CHTML / XHTML), mostreremo categorie separate per tali errori.

Errori URL per tipo con conteggi correnti e storici completi

Less is more

Ti mostravamo al massimo 100.000 errori di ogni tipo. Cercare di consumare tutte queste informazioni era come bere da un firehose, e non avevi modo di sapere quale di questi errori fosse importante (la tua home page è inattivo) o meno importante (il sito personale di qualcuno ha fatto un errore di battitura in un link al tuo sito). Non c’era modo realistico per visualizzare tutti i 100.000 errori—nessun modo per ordinare, cercare o contrassegnare i tuoi progressi. Nella nuova versione di questa funzione, ci siamo concentrati sul tentativo di darvi solo gli errori più importanti in anticipo. Per ogni categoria, ti daremo quelli che pensiamo siano i 1000 errori più importanti e perseguibili. È possibile ordinare e filtrare questi primi 1000 errori, fateci sapere quando si pensa di averli corretti, e visualizzare i dettagli su di loro.

Filtrare e ordinare istantaneamente gli errori su qualsiasi colonna

Alcuni siti hanno più di 1000 errori di un determinato tipo, quindi sarai ancora in grado di vedere il numero totale di errori che hai di ogni tipo, così come un grafico che mostra i dati storici che risalgono a 90 giorni. Per coloro che temono che i dettagli di errore 1000 più un conteggio totale aggregato non saranno sufficienti, stiamo considerando l’aggiunta di accesso programmatico (un’API) per consentirti di scaricare ogni ultimo errore che hai, quindi ti preghiamo di darci un feedback se hai bisogno di più.

Abbiamo anche rimosso l’elenco delle pagine bloccate dai robot.txt, perché mentre questi a volte possono essere utili per diagnosticare un problema con i tuoi robot.file txt, sono spesso pagine intenzionalmente bloccato. Volevamo davvero concentrarci sugli errori, quindi cerca informazioni sugli URL robotizzati da mostrare presto nella funzione ” Accesso crawler “in”Configurazione del sito”.

Immergiti nei dettagli

Facendo clic su un singolo URL di errore dall’elenco principale viene visualizzato un riquadro dei dettagli con informazioni aggiuntive, tra cui l’ultima volta che abbiamo provato a eseguire la scansione dell’URL, la prima volta che abbiamo notato un problema e una breve spiegazione dell’errore.

Dettagli per ogni errore URL

Dal riquadro dettagli è possibile fare clic sul link per l’URL che ha causato l’errore per vedere di persona cosa succede quando si tenta di visitarlo. Puoi anche contrassegnare l’errore come “fisso” (ne parleremo più avanti!), visualizza il contenuto della guida per il tipo di errore, elenca le Sitemap che contengono l’URL, vedi altre pagine che si collegano a questo URL e persino Googlebot recupera l’URL in questo momento, per ulteriori informazioni o per controllare due volte che la correzione abbia funzionato.

Visualizza le pagine che si collegano a questo URL

Agisci!

Una cosa di cui siamo davvero entusiasti in questa nuova versione della funzione Crawl errors è che puoi davvero concentrarti sulla correzione di ciò che è più importante prima. Abbiamo classificato gli errori in modo che quelli in cima alla lista di priorità saranno quelli in cui c’è qualcosa che si può fare, se questo è il fissaggio collegamenti interrotti sul proprio sito, correggere i bug nel software del server, aggiornare le sitemap per potare URL morti, o l’aggiunta di un reindirizzamento 301 per ottenere gli utenti alla pagina “reale”. Determiniamo questo in base a una moltitudine di fattori, tra cui se hai incluso o meno l’URL in una Sitemap, da quanti posti è collegato (e se qualcuno di questi è anche sul tuo sito) e se l’URL ha ottenuto traffico di recente dalla ricerca.

Una volta che pensi di aver risolto il problema (puoi testare la tua correzione recuperando l’URL come Googlebot), puoi farcelo sapere contrassegnando l’errore come “corretto” se sei un utente con autorizzazioni di accesso complete. Questo rimuoverà l’errore dalla tua lista. In futuro, gli errori che hai contrassegnato come corretti non saranno inclusi nell’elenco degli errori principali, a meno che non abbiamo riscontrato lo stesso errore quando si tenta di eseguire nuovamente la scansione di un URL.

Selezionare gli errori e contrassegnarli come fisso

Abbiamo messo un sacco di lavoro nella nuova funzione di scansione errori, quindi speriamo che sarà molto utile per voi. Fateci sapere cosa ne pensate e se avete suggerimenti, si prega di visitare il nostro forum!

Scritto da Kurt Dresner, team di strumenti per i webmaster

Leave a Reply

Il tuo indirizzo email non sarà pubblicato.