robot

Da ormai 8 mesi sto curando il mio piccolo Blog di Crescita Personale: settimana dopo settimana ho visto le visite crescere, gli iscritti al feed RSS aumentare ed il traffico di Google impennarsi. Fino a maggio, quando sono scomparso da Google.

Il Problema

Controllando distrattamente le crawl stats nel mio pannello degli Strumenti di Google per Webmaster, noto che il Googlebot ha smesso di visitare il mio blog. โ€œPoco male, sarร  andato a prendersi un caffรจโ€ penso tra me e me.

Il pre dramma

I giorni passano, la pausa caffรจ del Googlebot non accenna a terminare, ma in compenso le visite al blog continuano ad aumentare, e negli stessi giorni raggiungo il picco di visitatori da Google, grazie alla keyword โ€œcambiare vitaโ€. โ€œMah, Big G starร  facendo qualche aggiornamento al servizio per webmasterโ€ continuo a pensare da neofita. Neanche un mese e si scatena lโ€™infernoโ„ข (marchio registrato dal Gladiatore): il Blog EfficaceMente svanisce da quasi tutte le SERP di Google e le visite dai motori di ricerca si azzerano. Il dramma.

Il dramma

La Causa

Prima un breve flashback: Sfruttando avanzatissime tecniche di memorizzazione ;-), ricollego la pausa caffรจ del Googlebot ad un down del servizio di hosting del mio blog. Approfondendo la questione ho la certezza che ci sia un legame tra lโ€™azzeramento delle visite da Google e lโ€™ultimo crash del server. Preso dal panico, contatto qualsiasi persona che abbia una connessione ad internet da piรน di 10 anni, finchรฉ finalmente Davide, che sta gentilmente ospitando questo post, mi consiglia di rivolgermi ai ragazzi di Getseen. Nel giro di qualche giorno, grazie ad unโ€™analisi dettagliata e scrupolosa, viene svelato lโ€™arcano: il mio server non restituisce correttamente gli http headers.

E perchรฉ questo dovrebbe essere un problema? Lo spider di google prima di visitare qualsiasi pagina del tuo sito/blog cerca un file: il file robots.txt. Questo piccolissimo file.txt, presente nella root del tuo dominio, serve per filtrare gli spider dei diversi motori di ricerca e per dare indicazioni su quali pagine possono essere visualizzate dai bot e quali invece non devono essere considerate. In realtร  questo file non deve essere indispensabilmente presente. La cosa importante รจ che il Googlebot cercandolo abbia queste due risposte dal server:

  • status 200. Ok il file รจ presente, terrรฒ in considerazione il suo contenuto.
  • status 404. Ok il file non รจ presente, faccio il crawl anche del tuo libretto universitario.

Ma se il tuo server non restituisce correttamente gli http headers… beh hai un problema. Infatti se il Googlebot non riesce a leggere il tuo file robots.txt e non รจ sicuro che non esista, taglia corto e smette di fare il crawl delle tue pagine. Questo non ha effetti immediati, ma lentamente il tuo sito/blog perde posizioni nelle SERP, finchรฉ non avrai neanche una pagina indicizzata da Big G.

Insomma, Il robot(s) puรฒ cancellarti da Google. Puoi accorgertene facilmente guardando gli errori nel pannello degli Strumenti di Google per Webmaster, se hai un: โ€œrobots.txt unreacheableโ€, sei entrato nel club! ๐Ÿ˜‰ La Soluzione A questo punto hai due alternative: scambi 57 e-mail con il tuo servizio di hosting (il numero di e-mail รจ reale) senza che siano in grado di risolverti il problema, oppure… cambi servizio di hosting.

Dopo il cambio di hosting, il Blog EfficaceMente รจ tornato lentamente alla normalitร , recuperando posizioni nelle SERP e traffico da Google. Morale della favola: forse non avrai bisogno di una Ferrari per il tuo hosting, ma non scegliere un triciclo per risparmiare 1$ al mese. In un precedente Davide ha fatto una bella lista dei migliori hosting per blog. Ti รจ mai capitato un problema simile?

Autore: Andrea Giuliodori (di Efficacemente.com) per il Max Valle.

Max Valle

Da oltre 30 anni, offro consulenza e servizi digitali ad aziende e professionisti che desiderano far crescere il proprio business. Attraverso l’acquisizione di nuovi clienti in modo etico ed efficace, e l’utilizzo delle piรน recenti tecnologie web, aiuto i miei clienti a raggiungere i loro obiettivi nel pieno rispetto delle normative vigenti.

  • Certified Professional Ethical Hacker nยฐ4053103 
  • International Web Association nยฐ0312827
  • Membro Federprivacy nยฐFP-9572
  • Associazione Informatici Professionisti nยฐ3241
  • Consulente Tecnico d’Ufficio (CTU)

Oppure chiamami gratuitamente:

Numero Verde Max Valle