Googlebot scansiona solo i primi 15 MB di contenuto HTML

Condividi su:

Il crawler web di Google Googlebot scansiona solo i primi 15 MB dell’HTML di una pagina per determinare le classifiche, quindi fate attenzione alle dimensioni delle vostre pagine web!

Un aggiornamento al documento di aiuto del crawler web di Google contiene la conferma che Googlebot scansiona solo i primi 15 MB di una pagina Web e qualsiasi cosa dopo questo limite non verrà incluso nei calcoli delle classifiche.

Google specifica nel documento:

Tutte le risorse a cui si fa riferimento nell’HTML come immagini, video, CSS e JavaScript vengono recuperate separatamente.
Dopo i primi 15 MB del file, Googlebot interrompe la scansione e considera solo i primi 15 MB del file per l’indicizzazione.
Il limite di dimensione del file viene applicato ai dati non compressi.

Ciò ha lasciato alcuni nella comunità SEO a chiedersi se ciò significasse che Googlebot avrebbe completamente ignorato il testo che superava il limite nei file HTML, magari al di sotto delle immagini.

È specifico del file HTML stesso, che le risorse e icontenuti incorporati inseriti con i tag IMG non fanno parte del file HTML.

ha chiarito via Twitter John Mueller, Google Search Advocate.

Googlebot scansiona solo i primi 15 MB: Cosa significa per la SEO?

Per garantire che sia ponderato da Googlebot, i contenuti importanti devono ora essere inclusi nella parte superiore delle pagine web.

Ciò significa che il codice deve essere strutturato in modo da inserire le informazioni rilevanti per la SEO entro i primi 15 MB in un file HTML o basato su testo supportato.

Significa anche che immagini e video dovrebbero essere compressi e non essere codificati direttamente nell’HTML, quando possibile.

Le migliori pratiche SEO attualmente consigliano di mantenere le pagine HTML a 100 KB o meno , quindi molti siti non saranno interessati da questo limite. Le dimensioni della pagina possono essere verificate con una varietà di strumenti, tra cui Google Page Speed Insights.

In teoria, può sembrare preoccupante che tu possa potenzialmente avere contenuti su una pagina che non viene utilizzata per l’indicizzazione. In pratica, tuttavia, 15 MB sono una quantità considerevolmente grande di HTML.

Come afferma Google, le risorse come immagini e video vengono recuperate separatamente. In base alla formulazione di Google, sembra che questo taglio di 15 MB si applichi solo all’HTML.

Sarebbe difficile superare quel limite con l’HTML a meno che tu non stia pubblicando il testo di interi libri su una singola pagina.

Se hai pagine che superano i 15 MB di HTML, è probabile che tu abbia problemi di fondo che devono comunque essere risolti.

Conclusioni

Il fatto che Googlebot scansiona solo i primi 15 MB dell’HTML non è un cambiamento ma solo una precisazione e John Mueller di Google lo ha chiarito in un tweet recente.

Condividi su: