Tag: correlazione

Statistiche SEO

Le statistiche sono una cosa seria: anche nella SEO

Negli ultimi mesi stiamo assistendo a una vera e propria esplosione di statistiche, analisi e correlazioni di ogni tipo, anche in ambito SEO. In questo breve post cerco di dare la mia visione su questo argomento che, secondo me, sta diventando sempre più un argomento da bar piuttosto che una vera scienza.

La statistica non è solo la massa di “noiosi” documenti dell’ISTAT o il metodo per pubblicizzare un determinato evento, prodotto, sondaggio politico, e via dicendo. La statistica è una vera e propria materia scientifica: una scienza al pari di tutte le altre. Se consideriamo che le origini storiche della statistica sono abbondantemente precedenti rispetto, ad esempio, al Cristianesimo, possiamo immaginare che essa  non rappresenti un semplice “divertimento moderno”.

Premessa

Una quantità sempre maggiore di siti e blog SEO hanno incominciato a affiancare le proprie teorie e supposizioni, a grafici e rilevazioni statistiche di “supporto” in grado, secondo loro, di certificare matematicamente e sopra ogni ragionevole dubbio le loro teorie. Il fatto di “modellare” e “sfruttare forzatamente” i dati statistici per portare valore alle proprie argomentazioni è diventata, purtroppo, una pratica sempre più frequente (sopratutto in ambito commerciale e politico). L’idea di fondo è che un’analisi statistica può portare a una teoria, e non il contrario. Non è la teoria che deve cercare disperatamente una statistica da utilizzare come argomentazione. Dopo questa breve introduzione, faccio due premesse:

1) L’idea di questo articolo nasce da un post simpatico su G+ di un certo Eivind Savio, che ha postato la seguente immagine titolata Causation Vs Correlation:

L’immagine sembra rappresentare un mix di due grafici per dimostrare una correlazione statistica tra il market share di Internet Explorer e il numero di omicidi negli Stati Uniti. Visivamente, e appunto “statisticamente”, sembra esserci una correlazione numerica tra la quota di mercato di IE e gli omicidi negli Stati Uniti. All’abbassarsi della quota di mercato di IE calano gli omicidi.. Poi, basta accendere il cervello due secondi, per capire che è uno scherzo grafico ironico organizzato da Savio, che voleva ovviamente prendere in giro le altre correlazioni statistiche sparse per la rete.

2) La seconda idea che mi spinge a fare questo post deriva dalle considerazioni che ha fatto Emanuele, e che io condivido al 101%, riguardo un post di SearchMetrics che ha fatto il giro del web. Qualche mese fa la nota software house ha fatto uno studio statistico nel quale verrebbero riuniti i “Ranking Factors” di Google, ossia i fattori per posizionarsi su Google. L’immagine riassuntiva dello studio è la seguente:

Grafico Ranking Factors Search MetricsLa prima cosa che salta subito all’occhio è che, secondo Search Metrics (che gestisce un index enorme, al pari di SEOmoz e degli altri tools), il fattore in assoluto più importante per il posizionamento (ranking) sono le condivisioni su Facebook, anche più del numero di backlink. Al terzo, quarto, quinto e sesto posto c’è sempre un social di mezzo: lo avreste mai detto? Avreste mai detto che uno share su facebook vale quasi 9 volte più della key nell’url?

Dopo aver brevemente esposto le cause che mi hanno spinto a fare il post passiamo agli esempi!


Definizione e esempi di correlazione statistica

La definizione che Wikipedia ci fornisce di “correlazione statistica” è:

In statistica per correlazione si intende una relazione tra due variabili casuali tale che a ciascun valore della prima variabile corrisponda con una certa regolarità un valore della seconda.

Secondo questa descrizione, quindi, lo studio di Search Metrics è a tutti gli effetti una vera e propria correlazione statistica. Da un punto di vista tecnico e formale, senza applicare nessun conseguente ragionamento e studio interpretativo, Search Metrics ha eseguito una correlazione statistica assolutamente perfetta.

Ok, dopo aver rispolverato i grafici di Excel, vi propongo anche io tre correlazioni statistiche tecnicamente ineccepibili:

Rapporto tra utenti Facebook e lavoratori

L’immagine di cui sopra dimostra statisticamente la correlazione numerica inversa tra il numero di milioni di utenti di Facebook e la percentuale di occupati giovani tra i 15 e i 24 anni, nel periodo storico tra il 2005 e il 2010. E’ evidente a tutti che, statisticamente, quando aumenta il numero di registrati su Facebook, diminuisce il numero di lavoratori giovani.

Rapporto pensioni e quota internet explorer

In quest’altro studio, è possibile notare una nuova correlazione inversa. Quando la quota di mercato di Internet Explorer scende, le pensioni medie degli italiani salgono: statisticamente, è così.

Rapporto produzione automobili e risoluzione dello schermo

Stavolta vi offro una correlazione diretta di indiscussa validità scientifica. Studi scientifici dimostrano che quando le persone usano la risoluzione 1024*768 la produzione mondiale di automobili aumenta della stessa misura, viceversa quando gli utenti scelgono risoluzioni diverse dalla 1024, il mercato globale di auto risponde con un calo di produzione istantaneo. Marchionne, questo è un business plan! 😀

 


Correlation is not Causation

Dopo queste tre divertenti statistiche che non hanno assolutamente nessuna “vera” correlazione, tutti avrete capito che il problema, quando si parla di statistiche, è il cosidetto errore di correlazione. In questo bell’articolo, ad esempio, ci viene spiegato che l’errore di correlazione consiste nello “scambiare una correlazione per una relazione di causa-effetto“. Per le spiegazioni tecniche di stampo statistico vi rimando allo stesso articolo linkato poco fa, ma vorrei copiare una delle ultime frasi: 

la correlazione fra due variabili è condizione necessaria, ma non sufficiente al nesso causale

 

Se appliciamo questi nuovi concetti allo studio di Search Metrics possiamo fare alcune considerazioni:

– Il titolo “Ranking Factors” è una totale cavolata volutamente inserita dai creatori per aumentare lo “share appeal” dello studio

– Un ranking factor è un fattore che determina il posizionamento. Prendere dei siti che sono già posizionati e estrapolarne le caratteristiche credendo che queste siano influenti al posizionamento stesso è un errore particolarmente grave. (che insulta l’intelligenza dei lettori del blog..) Durante il SEO Contest 2012, per fare un esempio semplice, mi sono divertito a modificare la mia homepage inserendo una serie di fotografie senza senso e codice html totalmente rovinato. Pur rimanendo primo (per alcuni giorni), tutti sappiamo che quelle azioni non sono assolutamente dei “ranking factors” ma, se fosse passato il crawler di SearchMetrics in quel periodo, avrebbe rilevato il mio codice distrutto come “fattore di ranking” per la key stellissimo: assurdo!

– Search Metrics ci dice, sostanzialmente, quali caratteristiche possiedono i siti che si sono già posizionati. Il fatto dei segnali sociali in cima alla classifica è facilmente spiegabile: se io sono in terza pagina avrò ZERO visibilità, ma se sono primo su tutte le keyword del mio business è logico aspettarsi un naturale e fisiologico boost delle metriche social (likes, share, tweet ecc) che, in questo caso, diventano una conseguenza del ranking, e non una causa.

 – Lo studio di Search Metrics non solo è totalmente sbagliato, ma è anche dannoso. Chi non si è posto il dubbio della correlazione-causalità dei fattori, potrebbe prendere alla lettera lo studio di SM e interpretare i risultati come dei veri ranking factor. Incredibile ma vero, il fattore più dannoso per il ranking secondo SM è la lunghezza del content: una rivoluzione! Niente più content marketing, testi di qualità: dobbiamo creare contenuti striminziti di un paio di righe e keyword stuffing a gogo!

– Oltre a fare dei contenuti minuscoli, lo studio di SearchMetrics ci consiglia anche di evitare l’uso della keyword nell’H1 e anche nel title! ( sono addirittura considerati fattori negativi di ranking! ). E ora su, tutti a fare queste modifiche! Poi ci vediamo tutti in tribunale quando tutti i clienti spariscono day/night dalle SERP e ci chiedono i danni 😀


In conclusione

La statistica è una materia interessante (e molto più complessa di quanto si crede) ma, essendo una scienza, deve essere fatta da persone capaci e competenti: non basta aggregare un pò di cifre e dare un titolo “interpretativo” dal forte sex-appeal, per costruire un’analisi seria (tralaltro di uno degli argomenti più importanti dell’intera SEO).

Ne io, ne Emanuele, ne nessun’altro in ufficio, è esperto di statistica. Proprio per questo noi, al massimo, ci divertiamo a pubblicare test, casi studio e simili, ma non abbiamo e non avremo mai la presunzione di pubblicare correlazioni scientifiche indiscutibili, per lo più sulla SEO, in cui basta un errore per distruggere un business in una notte.

Come avrete capito, questo post è sostanzialmente un piccolo appunto per chiarire la differenza tra correlazione e causalità, e per ribadire l’importanza di serietà e metodo in una materia scientifica sempre più abusata.

Due ultime cose: riguardo al caso specifico di Search Metrics lascio rispondere a Emanuele agli eventuali commenti (che tralaltro per qualche mese ha usato proprio Search Metrics a pagamento come tool SEO, quindi ne sa più di tutti :D). Sempre riguardo al caso SM, vorrei precisare che numerosi colleghi e blog SEO avevano già affrontato i fattori nel dettaglio, evidenziando già la differenza tra causalità e correlazione ( Enrico Altavilla, blog SEO GT e Forum GT, ilbloggatore, tagliaerbe e tanti altri).

correlazione, statistica

Cookie Policy - Privacy Policy

Esperto SEO Srl - Viale Cesare Battisti, 179, 05100 Terni TR - C/F P.Iva 01512540558 - Tel.: +39 0744.409703 - Fax: +39 0744.429985