Feb 06

Uno dei principali fattori SEO on page per migliorare la qualità della SERP è la riscrittura delle URL delle pagine web.

Molto spesso ci si trova nella situazione di dover sfruttare qualche elemento della base dati per ottenere un’URL descrittva.

Nel caso di un sito web che pubblica notizie può essere interessante utilizzare il titolo della notizia.

Per l’articolo “Google vuole comprare Yahoo”, ad esempio, l’URL del documento potrebbe essere: www.mio-sito.it/google-vuole-comprare-yahoo.html.

Per un e-commerce il nome prodotto e la categoria mercologica, come ed esempio per il cellulare Nokia N70 si può associare www.mionegozioonline.it/cellulari/nokia-N-70.html.

Ma se nei dati che ho a mia disposizione trovo dei caratteri speciali per avere una qualità delle SERP ottimizzata al massimo occorre prevedere qualche accorgimento tecnico.

In un mio post nel Blog TSW, in merito qualche tempo suggerivo la personalizzazione della routine sanitize_title_with_dashes() di Wordpress contenuta nel file wp-includes/formatting.php. (Potete scaricarne il codice qui!)

Questa tecnica permette di fare la riscrittura corretta delle URL per tutte le stringhe che contenevano caratteri quali ü, ö, ä sfruttando la corrispondenza ü=ue, ö=oe, ä=ae.

Da un commento di Johnnie si poteva notare come però questo tipo di tecnica in alcuni casi non funzionasse a dovere.

Il metodo di conversione della stringa causa una riscrittura approssimativa: ad esempio le lettere con gli accenti vengono convertite nella versione non accentata (come è=e, ò=o).
Continua a leggere > >

 
Jan 19

Che cos’è?

La pagina di errore 404, è una pagina speciale che viene mostrata all’utente qualora la risorsa all’URL indicata non sia disponibile.

Cause.

La cause per cui viene visualizzazta una pagina di errore 404 sono principalmente le seguenti:

  • un URL digitato male;
  • un segnalibro/bookmark datato;
  • un collegamento datato proveniente da un motore di ricerca;
  • un link interno interotto sfuggito al webmaster.

Perchè è utile?

Questa pagina è molto utile a diversi scopi:

  • SEO: permette di indicare allo spider che non è più presente la risorsa all’URL indicata. In questo modo dopo qualche richiesta non andata a buon fine, la pagina verrà rimossa dall’indice poichè viene considerata obsoleta ;
  • Usabilità: permette di dare istruzioni e messaggi utili all’utente nel caso in cui si trovasse nei casi presentati in precedenza, guidandone la navigazione e fornendo degli strumenti adatti a trovare ciò che cerca nel sito.
  • Webmaster: può essere utile, con qualche piccolo tecnicismo, per reperire eventuali link corrotti all’interno del sito web che potrebbero essere sfuggiti durante l’implementazione.

Qualche dritta.

Il design della pagina dev’essere essenziale, ma non troppo. Il suo scopo, infatti, non è di colpire l’utente attraverso grafiche gradevoli, ma è quello di permettere all’utente di riprendere la navigazione.

I testi ed i messaggi presenti in pagina, quindi, devono essere chiari e facilmente leggibili, meglio con un font di grandi dimensioni. Inoltre il messaggio presente non deve accusare l’utente di aver fatto un’azione sbagliata, ma dev’essere “possibilista” e dare all’utente le istruzioni guiste per non abbandonare il sito e trovare quello che cerca.

Oltre al testo, saranno necessari dei tool utili al reperimento delle risorse nel sito web. E’ consigliabile, quindi, l’inserimento di:

  • un box di ricerca interna al sito;
  • un link all’homepage;
  • un link alla mappa del sito;
  • link alle pagine di primo livello del sito.

Se utilizzate Google Analytics potrebbe essere utile modificare lo script di tracciamento, in modo tale da poter visualizzare direttamente dalle vostre statistiche del sito quali siano le URL andate in errore 404.

<script src="http://www.google-analytics.com/urchin.js" type="text/javascript"></script>
<script type="text/javascript">
_uacct = "UA-712514-1";
urchinTracker("/404.html?page=" + _udl.pathname + _udl.search);
</script>

Per chi ha effettuato migrazioni di dominio o riorganizzazioni delle URL, potrebbe essere utile creare un piccolo archivio delle richieste non andate a buon fine memorizzando in un database l’URL richiesta andata in errore ed il referral, in modo tale da permettere al webmaster ed al SEO di compredere le cause di queste richieste errate, magari creando dei reindirizzamenti 301 adeguati.

Propongo per chi usa Apache e PHP questo piccolo script:

<?php
$db = mysql_connect("host","user","pwd");
if ($db == FALSE)
die ("Errore nella connessione. Parametri errati.");
mysql_select_db("database",$db) or die ("Errore nella selezione del database. Verificare i parametri nel file config.inc.php");
if(isset($_SERVER['HTTP_REFERER']))
{ //404 con referrer
$query="INSERT INTO errori_404 (referrer,destinazione) VALUES ('".$_SERVER['HTTP_REFERER']."','".$_SERVER['REQUEST_URI']."')";}
else{
//404 da traffico diretto/senza referrer
$query="INSERT INTO errori_404 (referrer,destinazione) VALUES ('diretto','".$_SERVER['REQUEST_URI']."')";
}
mysql_query($query,$db) or die ("Errore nella query:" . mysql_error());
?>

Voi avete per caso sperimentato altri tool o strumenti da inserire nelle vostre pagine 404?

Consigli per la lettura:

 
Jan 09

L’utilizzo corretto degli status code HTTP, è un aspetto molto importante per la gestione di un sito internet, in particolare se si desidera tenere in considerazione anche gli aspetti legati al SEO.

L’indicazione di un codice HTTP esatto delle pagine Web, infatti, è necessario per far capire allo spider quale sia il reale stato di una data risorsa.

Ci sono diversi status code che possono essere restituiti a seconda dei casi, poichè non è sempre detto che una pagina web sia disponibile.

Qui sotto potete trovare un elenco dei principali stati delle risorse e i casi in cui possono essere utilizzati per il SEO.

  • 200 (OK) serve per indicare al richiedente che la pagina è presente e ne restituisce successvamente il contenuto;
  • 204 (No Content) indica che la richiesta è stata processata ma non è stato reperito alcun contenuto da inviare;
  • 301 (Moved Permanently) indica che il file specificato è stato permanentemente spostato in un’altra locazione (è necessario specificare la nuova locazione permanente). Da utilizzare ai fini SEO nelle migrazioni di dominio o spostamento di URL permanentemente.
  • 403 (Forbidden) indica che la richiesta non è autorizzata, spesso causata dal settaggio dei permessi sul web server o dall’accesso non consentito ad un area coperta da user name e password;
  • 404 (Not Found) serve ad indicare che la risorsa all’URL richiesta non è stata trovata. Da utilizzare ai fini SEO e di usabilità, impostando nel web server un Error Document con destinazione una pagina HTML con un messaggio di errore per l’utente;
  • 500 (Internal Server Error) indica che il server è incorso in un errore inaspettato che non ha permesso di completare la richiesta;
  • 503 (Service Unavailable) consente al bot di capire che il sito è temporaneamente fuori servizio. Importante utilizzare lo status 503 qualora il sito web non sia disponibile per un periodo superiore alle 5 ore per motivi tecnici.

Per impostare gli status code corretti si possono utilizzare diversi strumenti sia a livello di configurazione dei web server, che a livello di programmazione web.

Propongo questi post per chi volesse avere informazioni in più su:

 
preload preload preload