CMS, e-commerce e rimozione dei contenuti: un problema x l’ottimizzazione nei motori di ricerca.
E' passato un po' di tempo da quando ho scritto questo articolo.
Il mondo del digital è sempre in evoluzione e potresti trovare delle informazioni non più aggiornate.
Tutti coloro che lavorano nel web più o meno sanno che cos'è un CMS, sì insomma per farla breve è uno strumento grazie al quale si gestiscono i contenuti di un sito, un e-commerce, ecc.
Attraverso l'uso del CMS è possibile, tra le altre cose, eseguire almeno tre operazioni elementari: creare nuove pagine, modificarle o infine eliminarle.
Oggi vorrei affrontare una questione relativa all'eliminazione dei contenuti e alle problematiche che potrebbero crearsi per l'ottimizzazione nei motori di ricerca che a volte non vengono prese in considerazione durante il test, lo sviluppo o la personalizzazione di un CMS.
La problematica è abbastanza frequente in particolare negli e-commerce a causa della maggiore frequenza di aggiornamento dei prodotti e non è affatto da sottovalutare specialmente se si considera l'importanza della SEO su questi siti.
Il caso più classico è, ad esempio, il cambio dei cataloghi annuali quando vengono eliminati alcuni prodotti e quindi di conseguenza vengono eliminate sul sito le pagine che ospitano le schede informative dedicate.
Dal punto di vista della gestione del sito web a prima vista per non incappare in errori sarebbe sufficiente non rendere linkabili le pagine dei prodotti non più disponibili.
Tuttavia subito dopo la rimozione dei contenuti, il mancato raggiungimento della pagina dal sistema di navigazione del sito non è l'unica possibilità di accedere alle URL del contenuto rimosso. Se i motori di ricerca avevano indicizzato le pagine, infatti, essi contengono nell'indice le vecchie URL e quindi esse sono ancora accessibili sia dagli utenti dalle pagine dei risultati, sia dagli spider durante gli accessi periodici.
Criticità:
Le risposte alle richieste verso le pagine rimosse spesso donotano delle criticità per i motori riassumibili in due casi principali:
1. Errori 404: l'utente/spider che accede all'URL del contenuto rimosso riceve un errore 404.
Con le seguenti ripercussioni:
- perdita di eventuali posizionamenti raggiunti con la pagina eliminata;
- perdita degli utenti che ricevono l'errore (il numero dipende anche dalla bontà del design della pagina di errore 404);
- registrazione da parte di Google di errori 404 che se presenti in numero rilevante, potrebbero anche minare altri posizionamenti del sito web;
- perdita di link popularity se ci sono link che puntano le pagine rimosse (per approfondimenti leggere Free link to you site di Matt Cutts)
2. Contenuti di cortesia: l'utente/spider che accede all'URL riceve uno status code 200 (ok) con dei contenuti di cortesia al posto della scheda informativa (ad esempio: la tua ricerca ha fornito 0 risultati).
Le conseguenze di questa gestione potrebbero essere:
- perdita di eventuali posizionamenti raggiunti: non avendo più contenuto (e ottimizzazioni) attinente al tema/prodotto originale probabilmente viene perso anche il posizionamento;
- perdita di utenti (più o meno analoga alla 404 - dipende dal design della pagina)
- generazione di contenuto duplicato: la pagina di cortesia probabilmente avrà lo stesso contenuto per tutti i prodotti/pagine eliminate, quindi se nell'arco di un anno si ha l'eliminazione di 600 items, ci si ritroverà ad avere 600 contenuti identici (per approfondimenti vedere il post sul contenuto duplicato dal Google Blog per i webmaster) .
I rimedi
Sicuramente lo strumento delle redirezioni 301 è fondamentale ma lavorare su un file di configurazione per redirigere 200 prodotti 1 a 1 non è la soluzione ideale e potrebbe essere utile estendere le funzionalità del CMS per eliminare il problema specie se si adottano soluzioni custom o di prodotti open source. (altrimenti rivolgetevi a chi ha sviluppato il CMS)
L'idea è quella di personalizzare la gestione dei contenuti rimossi in modo che:
- all'azione della rimozione di un contenuto è possibile indicare anche un contenuto alternativo verso il quale redirigere gli utenti e lo spider;
- le richieste HTTP verso i contenuti rimossi vengono redirette lato server verso il contenuto più vicino indicato;
- viene mantenuto un archivio dei contenuti rimossi per poter gestire eventuali errori nell'impostazione del redirect o per l'eventuale reinserimento futuro (ad esempio per prodotti temporaneamente indisponibili);
Personalmente per la gestione dei contenuti rimossi tendo a distinguere due tipi di pagine:
- quelle con posizionamenti "interessanti" in quale è utile fare una redirezione verso una pagina molto simile in modo da limitare i danni nel posizionamento;
- quelle ininfluenti a livello di traffico da motore che si possono redirigere verso la pagina di categoria corrispondente;
Questa logica di redirezione può venire applicata anche su CMS: quando la pagina rimossa ha il contenuto corrispondente impostato si viene rediretti verso la nuova URL, in alternativa si viene rediretti alla pagina di categoria corrispondente.
I link contenuti nel post e altri approfondimenti:
- Gli status code HTTP e il SEO - qualche consiglio utile
- Webmaster Tools shows Crawl error sources
- La pagina di errore 404 - Qualche consiglio utile.
- Free link to you site
- Demystifying the "duplicate content penalty"
- Riscrittura delle URL con htaccess Apache: consigli e esempi pratici.
- Redirect 301 e piano migrazione URL: ecco perché farlo su tutte le pagine.