Indicizzazione sito web: i fattori principali

  • Home
  • News
  • Indicizzazione sito web: i fattori principali
indicizzazione sito web - i fattori principali

Indicizzazione sito web: definizione

Abbiamo già parlato di indicizzazione sito web nel precedente articolo e ne abbiamo delineato i contorni, tracciando il confine con il processo spesso confuso, vale a dire il posizionamento. Definiamola meglio:

L’indicizzazione di un sito web è quel processo mediante il quale Google inserisce uno o più contenuti del nostro sito web all’interno del database. Avviene mediante un processo di scansione effettuato dagli spider che stabiliscono se un sito è conforme o meno alle norme Google e associano ad esso una categoria di business.

Ebbene, niente di nuovo rispetto a quanto già risaputo. Sorge spontanea la domanda: cosa sono le norme Google? Sicuramente rappresenta dei vincoli, ma anche il “pass” per un posizionamento coi fiocchi. Vediamole insieme:

Norme Google per l’indicizzazione dei siti web: server e sicurezza

  • Certificato SSL (Solid State Logic): un sito il cui server comunica col browser in maniera crittografata rappresenta una sicurezza contro i cyber-crimini, rafforza la considerazione del brand e la sicurezza dei dati sensibili immagazzinati;
  • Dominio geolocalizzato: se il sito è destinato alla visione dei contenuti da parte dei soli utenti italiani, non ha senso scegliere un’estensione (.eu, .biz, .net). Scegliamo il .it che sarà ben apprezzato da Google;
  • Errori al server: se lo spider non riesce ad accedere o lo fa trovando degli errori al server, alle pagine, ai contenuti, come può giudicare tale sito? Facciamola franca: non lo giudica affatto e lo scarta;
  • Errore 404: uno dei più comuni errori al server già presentati poco sopra. Fa riferimento a quei link che puntano a pagine esterne o interne al sito non più esistenti, perché cancellate o rimosse;

Norme Google per i contenuti

  • Cannibalizzazione delle parole chiave: creare pagine contenenti molteplici ripetizioni di una o più parole chiave, oltre a rappresentare un contenuto di poco valore è un pass per l’oblio totale;
  • Cloaking: quando si mostra allo spider un contenuto non accessibile agli utenti. Esempi classici sono: link nascosti, parole chiave nascoste, iframe, video, immagini non visibili agli utenti, ma solo allo spider;
  • Immagini contenenti testo o link: vale lo stesso discorso del cloaking e non viene ritenuto un contenuto valido. Oltretutto, lo spider (e nemmeno il crawler) non riesce a leggere il testo interno all’immagine;
  • Contenuti duplicati: spesso, qualcuno si sente così tanto furbo da creare due (o più) pagine con contenuto quasi simile con il (vano) tentativo di scalare le SERP velocemente. Altre volte, creano dei “riassunti” dello stesso contenuto. Non va;
  • Contenuti non pertinenti: se il tuo sito si chiama www.facciolepizze.it non è coerente parlare di politica, religione o pace del mondo. Siate seri, suvvia!;
  • Contenuti non ammessi: contenuti protetti da copyright, consulenza medica, contenuti fraudolenti;
  • Contenuti vietati: incitazione all’odio, violenza esplicita, sesso eplicito, furti di identità, gesti promotori di autolesionismo, molestie, cyberbullismo, automutilazione, disturbi alimentari, minacce o sostegno di organizzazioni a delinquere e altri siti contenenti tecniche e virus spam, adware o malware. Trovi tutto qui;

Autorevolezza, GDPR e trattamento dei dati personali

  • Privacy e Cookie Policy: con il decreto emanato il 10 Agosto 2018, il Garante della Privacy obbliga tutti i siti ad integrare, al proprio interno, un documento che esplichi le modalità di acquisizione dei dati personali di ogni utente, nonché il responsabile del loro trattamento. Inoltre, vanno specificate le tipologie di dati acquisiti, comprendenti servizi di terze parti, con relativa possibilità di negare quelli facoltativi da parte dell’utente.

La violazione di una o più norme può comportare l’oscuramento temporaneo o la cancellazione dell’intero sito web, mediante ordinanza delle autorità informatiche o dello stesso Google. Ovviamente, ogni norma non ha la stessa gravità. Nei casi “meno gravi” Google avvisa tramite e-mail o tramite la Google Search Console.

Fattori che influenzano l’indicizzazione di un sito web

Dopo aver capito quali regole rispettare, la domanda successiva è: come si indicizza un sito web?

A tal proposito, vengono in mente alcuni “siparietti simpatici” dove alcuni clienti mi chiedevano:”Me lo indicizzi il sito?”. Non che fosse scorretto, ma si riferivano, ovviamente, al posizionamento del sito web.

Come abbiamo già capito, l’indicizzazione di un sito web è il processo antecedente al posizionamento. Senza indicizzazione, non può esistere posizionamento. Ci sono delle “buone pratiche” che influenzano positivamente l’indicizzazione, velocizzandone il processo:

  • Dominio inferiore ai 20 caratteri: questo è più un consiglio che un vincolo. Poiché lo slug di una pagina o di un articolo potrebbe aggiungere ancora caratteri, vale la pena di considerare un dominio quanto più corto possibile;
  • Sitemap XML: creazione di una sitemap in formato xml contenente tutti i contenuti multimediali presenti nel sito web. Meglio crearne differenti per tipologia (immagini, pagine, articoli, video, ecc.). Inserire le sitemap su Google Search Console, verificando la proprietà del sito;
  • File robot.txt: è un file di sistema del nostro sito web che indica allo spider quali contenuti scansionare e quali no, evitando l’indicizzazione di pagine indesiderate o contenenti errori;
  • Architettura informativa semplice: creare livelli di profondità troppo elevati diminuisce la User Experience. È meglio creare una struttura semplice e facilmente comprensibile, in modo tale che gli utenti possano capire come spostarsi all’interno del sito in maniera semplice e intuibile;
  • Paginazione: evitare la scrittura di articoli suddivisi in più pagine cliccabili. Scoraggia l’utente nella continuazione della lettura e diminuisce la User Experience. Vale anche per la modalità “infinite scroll”, lo scorrimento dei contenuti;
  • Redirect: è la soluzione agli errori 404 sui contenuti non più disponibili. Reindirizzare gli utenti verso contenuti autorevoli e sempre aggiornati, anziché permettere loro di vedere una pagina di errore 404, diventa un valore aggiuntivo;
  • Periodicità costante: scrivere articoli con una certa periodicità (ad esempio: 2 alla settimana) pone lo spider nelle condizioni di “fetching” costante. Sarà ben lieto di indicizzarli a dovere se siamo costanti nel nostro lavoro.

Conclusioni

In questo articolo abbiamo meglio focalizzato il concetto di indicizzazione di un sito web, espresso in termini più precisi e dettagliati.

Abbiamo introdotto le norme Google, fondamentali per l’esistenza di un sito web e dei suoi contenuti. Da intendersi non soltanto come vincolo, ma come norme di civiltà all’interno di uno spazio così immenso come internet.

Abbiamo, infine, descritto quelle pratiche per velocizzare l’indicizzazione di un sito web. Si tratta di semplici accorgimenti che piacciono agli spider Google e, chiaramente, agli utenti.

Nel prossimo articolo descriveremo i fattori che influenzano il posizionamento di un sito web.

Vuoi sfruttare tutte le potenzialità della SEO?

Previous Post Previous Post
Newer Post Newer Post

1 Comment

Leave a comment

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.