SEO: Come funzionano i motori di ricerca

Eugenio Tommasi

In un mondo dove i dati e le informazioni a disposizione sono sempre di più, il ruolo dei motori di ricerca diventa ogni giorno più fondamentale. Ed ecco che il lavoro seo prende forma in un’ottica non soltanto di esperienza utente e esperienza di ricerca, ma anche di schematizzazione ed organizzazione delle risorse, al fine di rendere internet se non un web più bello, almeno un web più ordinato!

Riuscire a schematizzare ed organizzare le informazioni presenti online sul web è importante per riuscire a trovare in poco tempo le informazioni più rilevanti di cui abbiamo bisogno. Ora quando gestiamo un sito web come webmaster è importante capire come funzionano i motori di ricerca, al fine di migliorare la gestione del sito e la maniera attraverso la quale comunichiamo con il motore di ricerca per dare e ricevere informazioni utili sullo stato del nostro sito web e della sua ottimizzazione per i motori di ricerca.

La seo e l’ottimizzazione per i motori di ricerca è importante. Comunicare le proprie risorse (sito web) al motore di ricerca è tanto importante quanto ottimizzare il sito perché sia più facilmente scansionabile, autorevole e di qualità e fruibile al motore di ricerca, al fine di mostrare il sito web tra i risultati della prima pagina (SERP). Ma questo non basta: anzi questo viene dopo. Prima di tutto è importante a mio parere capire come funziona la ricerca in generale. Che cos’è la ricerca e come si sviluppa nel tempo

Chi utilizza un motore di ricerca deve capire che esso è soltanto uno strumento che può facilitare il reperimento di informazioni, ma che va sfruttato nella maniera corretta, e che i risultati vanno filtrati in base alle proprie conoscenze e a quello che si vuole davvero trovare.

E’ l’utente infatti che dovrà poi filtrare ancora di più i risultati, rispetto a quanto riuscirebbe a farlo una macchina, e che dovrebbe cercare tra i diversi risultati quelli che davvero possono portare valore aggiunto alla sua ricerca. Ora, il motore di ricerca offre tra i diversi strumenti molti che permettono di raffinare la ricerca in base alle esigenze di ogni singolo utente. Ad esempio utilizzando i search operator del motore di ricerca, che permettono di escludere risultati, definire parole, filtrare per keywords, ed effettuare tantissime altre operazioni.

Ma ora la domanda reale e topic centrale di questo articolo è: come funzionano davvero i motori di ricerca?

Come funzionano i motori di ricerca

I motori di ricerca funzionano attraverso complessi algoritmi matematici e attraverso l’analisi statistica dei dati, e cercano di dare risultati il più rilevanti possibile alla query (ricerca) dell’utente. Per farlo i motori di ricerca analizzano moltissimi fattori, sia fattori di qualità e pertinenza della pagina rispetto alla query, ovvero fattori relativi sia alla qualità delle diverse risorse (pagine web) che verranno mostrate all’utente, sia alla loro pertinenza rispetto alla query dell’utente, sia fattori contestuali, come ad esempio quali ricerche ha effettuato l’utente prima (cronologia delle ricerche), qual è la posizione geografica dell’utente, e altri fattori relativi al contesto in cui l’utente effettua una ricerca.

Per analizzare il funzionamento di un motore di ricerca prenderemo in considerazione Google, che sembra (al momento) essere il migliore motore di ricerca disponibile, ovvero quello che continua ad offrire i risultati più attendibili e rilevanti possibile rispetto alle ricerche.

Google cerca di dare delle risposte agli utenti che effettuano una ricerca, passando attraverso complessi algoritmi che stabiliscono quali risorse presenti sul web rispondono meglio alla query (domanda) che l’utente fa al motore di ricerca.

Innanzitutto il motore di ricerca effettua due operazioni, chiamate crawling (scansione) e indexing (indicizzazione) di tutti i contenuti che vengono pubblicati online. Esistono (fonte Google) oltre 60 trilioni di pagine sul web, ed il numero è in costante aumento.

Se volete più informazioni su come funziona un motore di ricerca, potete dare un’occhiata a how search works di Google, o qui oppure guardare questo video dal caro Matt Cutts.

In poche parole, i motori di ricerca funzionano come dei piccoli ragni (spider, o bot) che seguono linkscansionano i contenuti presenti sul web, scansionando tutto il web alla ricerca di nuove informazioni.

Di solito, poco dopo che si pubblica una pagina sul web questa viene trovata e spesso mandata in indice da Google, se non vengono date particolari regole ai robots oppure non si restituisce un 403 forbidden per gli spider dei motori di ricerca (es. Googlebot e Bingbot).

Per il resto i motori di ricerca seguono i link presenti sul web, facendo passare il loro crawler a scansionare tutte le pagine che ricevono questi link. Non si conoscono gli algoritmi di Google che stabiliscono quale peso il motore di ricerca da ad una pagina rispetto ad un’altra quando viene fornito un set di risultati per la query intenzionale dell’utente, ma è molto importante l’ottimizzazione seo, sia quella onsite che quella offsite, per far capire al motore di ricerca che la risorsa è di valore, e merita di essere mostrata all’utente.

Dagli algoritmi alle risposte: Scansione e Indicizzazione delle risorse

Il motore di ricerca vuole soddisfare il proprio cliente, l’utente che fruirà i contenuti. E per questo vuole che i risultati siano il più pertinenti possibile, senza fornire risorse “spam” agli utenti. In alcuni settori lo spam continua ad essere esposto in bella vista, ma sono attività border line, ad esempio lo streaming, e probabilmente il traffico da motori di ricerca “vale” anche meno in termini di monetizzazione, come ad esempio nei siti monetizzati con affiliazioni.

La ricerca inizia nel momento in cui il motore di ricerca naviga il web, scansionando le pagine (crawling). Per farlo i motori di ricerca seguono tutti i link presenti in ogni pagina web, ed è proprio seguendo i link (forward links e internal links) che riescono a trovare nuove pagine e a scansionare ognuna di esse. I webmaster e i proprietari dei siti possono scegliere se far scansionare o meno il proprio sito al motore di ricerca. Questo può essere fatto dando delle direttive al motore di ricerca, relative soltanto ad alcune aree del sito, a pagine specifiche oppure all’intero sito. Tali direttive possono essere i robots.txt (files inseriti nella root del sito), oppure tags chiamati meta robots (da inserire nell’head della pagina) oppure anche attributi rel=”canonical” oppure rel=”nofollow” (per i link).

Ora, una volta che il motore di ricerca ha scansionato un sito web, immagazzina i dati che ha trovato nei suoi server, dove questi dati vengono conservati e raccolti come in una grande biblioteca. I dati e le informazioni reperiti vengono conservati nell’Index (in inglese, in italiano indice), ovvero come in un grosso libro un indice contenente tutti i dati raccolti, divisi per categorie e sottocategorie (entità, argomenti, chiamati anche entity e topic, oltre che altre categorizzazioni ed associazioni di concetti ad altri concetti). L’index (o indice) include testi da milioni di libri provenienti da diverse librerie e biblioteche.

Le SERP (Search Engine Results Pages) possono includere anche informazioni relative al mondo reale (ad esempio con le mappe di street view di Google), o anche video e immagini, e anche informazioni del Knowledge Graph ovvero informazioni su diversi argomenti ed entità presi da fonti autorevoli quali Wikipedia oppure Freebase (ora di sola lettura, e che presto verrà tolto e sostituito).

Ovviamente in un mondo pieno di dati come quello in cui viviamo (dove ogni giorno vengono aggiunti nuovi dati a questo indice) è importante che la categorizzazione dei contenuti sia fatta molto bene (e qui è una delle chiavi di lettura del motore di ricerca), e quindi che le varie entità e i concetti siano associati nel miglior modo possibile. Per farlo è importante che le entità vengano anche associate ad elementi reali del nostro mondo, al fine di rendere i risultati il più rilevanti possibile per l’utente (reale) che cerca; in una simbiosi tra mondo reale e mondo virtuale che diventa sempre più labile, una linea sempre più sottile che divide realtà e finzione.

Things, not strings” sta ad indicare proprio questo, un web e un motore di ricerca che associa al mondo virtuale la realtà, alla vita quotidiana gli elementi presenti online in forma digitale, macchine sempre più “intelligenti” e vicine a noi e alla nostra vita reale.  Questa è uno degli obiettivi del web semantico, che cerca appunto di associare i concetti del mondo reale a concetti ed entità in un mondo virtuale.

Quando l’utente arriva sul motore di ricerca (ad esempio www.google.com) ed effettua una ricerca (ad esempio “consulente seo“) il motore di ricerca prova ad interpretare la query dell’utente in base a tantissimi parametri, come ad esempio: qual è l’intento reale dell’utente? questa query è ambigua oppure è esattamente quello che l’utente sta cercando? cosa ha cercato l’utente prima di effettuare questa ricerca ovvero possiamo dedurre l’itenteno dell’utente in base alle ricerche che ha effettuato prima di arrivare a questa?

In pratica l’utente che arriva sul motore di ricerca effettua delle “domande” alle quali cerca di trovare una risposta. Queste domande possono essere esplicite, tipo “che tempo farà domani?” oppure “quanto è alta la torre eiffel?“, ma allo stesso tempo potrebbe effettuare delle ricerche la cui esigenza è implicita, come ad esempio “film streaming gratuiti” che corrisponde ad un’esigenza e domande ben precisa, ovvero “dove posso trovare dei film in streaming gratuti da guardare?“.

Interpretare la richiesta dell’utente, e analizzare le risorse acquisite

In base alle supposizioni effettuate, il motore di ricerca prova a comprendere il bisogno dell’utente (la reale esigenza dell’utente che effettua una ricerca), e va a scartabellare tutti i suoi risultati al fine di trovare quelli che secondo il motore di ricerca sono i più rilevanti rispetto alla query (e all’esigenza) dell’utente. Gli algoritmi utilizzati dal motore di ricerca per selezionare le risorse più rilevanti sono tantissimi, molti dei quali non sono noti (altri sono noti ai seo che continuano a lavorare per cercare di comprendere come il motore di ricerca valuta i diversi siti presenti nel suo immenso database), e tutti questi algoritmi vengono aggiornati in continuazione, rendendo praticamente impossibile stabilire come il motore estrae le risorse più pertinenti, e in base a quali valori.

Alcuni di questi algoritmi cercano di estrapolare dati quali: la parola chiave di ricerca compare nel title del documento? E compare all’interno del body? E nei sottotitoli (headings)? Ci sono grassetti o corsivi che aiutano la comprensione del testo? Ci sono immagini significative? I contenuti sono originali ed unici oppure sono copiati da altri siti? Il contentuo della pagina risponde (o potrebbe rispondere) al meglio all’esigenza dell’utente e alla sua query?

Gli algoritmi sono un insieme di programmi e formule matematiche che permettono al motore di ricerca di presentare all’utente i migliori risultati possibili. Gli algoritmi dei motori di ricerca valutano le pagine web presenti nell’indice in base a diversi fattori.  Innanzitutto gli algoritmi vanno alla ricerca di informazioni per comprendere meglio quello che l’utente vuole dire con la sua ricerca (l’intento dell’utente).

Prendendo in esempio Google (che sembra essere il miglior motore di ricerca nella comprensione delle reali esigenze degli utenti che cercano), alcuni criteri utilizzati dal motore di ricerca per comprendere meglio la query dell’utente sono: Diversi metodi di ricerca (ad esempio la ricerca vocale, oppure quella attraverso immagini e video), Google Instant (che mostra subito i risultati all’utente senza che venga premuto il puslsante “Cerca”), Errori di battitura (ovvero Google cerca di correggere in automatico eventuali possibili errori di ortografia e di scrittura, mostrando risultati relativi a parole simili, e proponendo l’alternativa nel caso in cui non ci fosse stato alcun errore di battitura), Autocomplete o Google Suggest (che mostrano suggerimenti alle query utente mentre sta digitando, facilitando in questo modo la ricerca di informazioni), Sinonimi e Comprensione della query che ha cercato l’utente.

In base a questi ed altri fattori, il motore di ricerca effettua una ricerca all’interno del proprio indice (nel quale ha salvato tutte le pagine scansionate), andando a cercare all’interno di sezioni relative a diversi topic, all’interno delle quali sono raggruppati i contenuti e le risorse scansionati.

Posizionamento (seo) e ranking dei risultati

Una volta che all’interno dell’indice sono state selezionate tutte le risorse relative alla determinata query effettuata dall’utente, il motore di ricerca può posizionare i risultati (rankings) in una classifica che va dal risultato più a quello meno rilevante rispetto alla query.

Ma come fa il motore di ricerca a stabilire quale risorsa è più “rilevante” e di qualità rispetto ad un’altra? Lo fa attraverso gli algoritmi. Grazie ad algoritmi che prendono in considerazione ben oltre i 200 fattori (fattori di posizionamento) e riescono a posizionare le risorse in una classifica di risultati dal migliore in giù, al fine di soddisfare l’esigenza dell’utente. Tra questi fattori vengono presi in considerazione elementi quali:

La qualità del sito e della pagina, ovvero Google cerca di capire, basandosi su alcuni segnali quali ad esempio i link che riceve un sito oppure il pagerank, uno dei fondamenti che ha portato alla creazione di Google, che da un peso ai link che vengono mandati ad un sito in base all’autorevolezza del sito che invia un link, e non soltanto alla quantità dei link ricevuti da una pagina.

La freschezza dei contenuti del sito, ovvero quanto spesso il sito viene aggiornato, se la pagina riceve le attenzioni del pubblico e quindi viene modificata spesso (commenti, etc.), il sito offre contenuti aggiornati per mostrare le ultime news nel settore di riferimento, soprattutto e anche in relazione alle ricerche per specifiche date.

Il contesto di ricerca dell’utente (che diventa sempre più fondamentale per chiunque si occupa di Search Engine Optimization, seo, che sempre più diventa anche Search Experience Optimization), ovvero la locazione geografica dell’utente che fa la ricerca, la cronologia delle ricerche effettuate, piuttosto che altri fattori che vengono considerati nel momento in cui si mostrano dei risultati all’utente.

Lingua, geolocalizzazione e traduzioni, mostrando i risultati più pertinenti anche in base alla lingua parlata dall’utente ed alla sua area geografica (considerando anche lingua del browser, indirizzo IP etc.), mostrando quindi risultati rilevanti (esempio se sono a Milano e cerco pizzeria, mi mostrerà i risultati relativi a tutte le pizzerie nell’area di Milano).

Universal Search, ovvero l’unione di più risorse e di risorse di diverso tipo in un’unica SERP (che include immagini, video, news, risultati organici e a pagamento e altre tipologie e forme di risorse.

Inoltre il motore di ricerca penalizza i siti che applicano tecniche spam, evitando di mostrare risultati e pagine di siti web che hanno adottato tecniche poco “ortodosse” per posizionare i propri siti web (scambio di link, keyword stuffing, tecniche di inganno dell’utente, pop up fastidiosi ed altre tecniche che portano un ritorno a chi le mette in pratica a discapito delle vittime, che hanno una pessima esperienza di navigazione del sito, e fanno fare brutta figura al motore di ricerca che ha mostrato il risultato, con la possibilità di perdere un cliente.

…E tutto questo accade in molto meno di un secondo!

Approfondimento: cos’è la ricerca, la ricerca nel tempo

Fino a poco tempo fa tutti i dati, le informazioni e il sapere venivano raccolti nelle biblioteche, ed organizzati a seconda del settore di appartenenza. Il problema delle biblioteche è la loro deperibilità. E spesso i documenti venivano persi. Inoltre, man mano che le informazioni aumentano è difficile categorizzarle e raggrupparle al meglio.

Con internet tutto il sapere si è trasferito sul web (anche gran parte di quello che fino a poco tempo fa era offline) e i motori di ricerca, come grandi biblioteche, raccolgono tutti i dati e le informazioni inserite sul web (che aumentano in maniera quasi sproporzionata giorno dopo giorno) e le conservano nei loro server. Da qui cercano le informazioni in base alle query inserite dagli utenti durante la loro ricerca, e riescono (chi meglio chi peggio) a fornire all’utente i risultati più rilevanti per la sua query.

Da sempre l’essere umano si è posto dei criteri ed un metodo per condurre una ricerca. La ricerca è quella che porta l’uomo ad evolversi, a trovare delle risposte ai suoi problemi, e soprattutto a trovare delle risposte non ancora trovate da nessun altro, e in questo modo accresce le conoscenze non soltanto personali ma anche dei suoi simili. La ricerca è quella che spinge i pensatori e gli scenziati a riflettere sui perché e sulle cause per le quali avviene qualcosa, ad interrogarsi e a trovare delle risposte confutabili o meno che supportino le loro teorie e la loro voglia di conoscenza.

Vista la grande importanza che riveste per il genere umano, la ricerca (vista soprattutto come ricerca della conoscenza attraverso esperimenti e studio dei risultati) è stata fonte di studio da molti pensatori. Tra i principali esponenti che hanno parlato di ricerca vi è il filosofo e matematico Descartes. Per Cartesio (anche chiamato Descartes) e per il suo pensiero la ricerca deve avvenire secondo un metodo ben preciso: ovvero ogni teoria deve essere scartata come falsa se tale teoria o idea può essere revocata in dubbio. Questo suo metodo si basa sullo scetticismo metodologico, e principalmente sul dubbio metodico, ovvero l’esistenza di una molteplicità di modi dai quali è possibile dedurre verità (ovvero ciascuno ha un suo metodo per formare le proprie certezze).

Cartesio sostiene che ognuno può adottare il proprio metodo per condurre la propria ricerca, ma davanti a risultati soddisfacenti e dimostrabili bisognava adottare tale metodo. Il dubbio metodico nell’affrontare la ricerca sta quindi nel consiglio a qualunque individuo razionale di darsi un metodo e nella ricerca del metodo più adatto a sé stesso di passare necessariamente per una fase di crisi in cui dubita di tutto e esistenza stessa e del mondo che ha davanti

La ricerca vista da un punto di vista più scientifico (ricerca scentifica): Galileo Galilei vede la ricerca come una serie infinita di domande poiché ogni risposta fa nascere una nuova domanda. Galilei si chiede che cosa l’uomo nella sua ricerca vuole arrivare a conoscere.

«O noi vogliamo specolando tentar di penetrar l’essenza vera ed intrinseca delle sustanze naturali; o noi vogliamo contentarci di venir in notizia d’alcune loro affezioni.»

Chiunque effettua una ricerca si basa su metodi intersoggettivi, utilizzando metodologie proprie che permettono ad ognuno di arrivare a dei risultati tangibili, e che in un modo o nell’altro accrescono non soltanto l’esperienza e la cultura ma anche la propensione alla ricerca dell’individuo. Per questo motivo considero l’università importante, non per le materie che si studiano nè per le nozioni che insegna. Ma semplicemente per quella tesi che viene fatta alla fine del corso di laurea. Una tesi implicitamente insegna come ricercare le informazioni nel mondo di dati a disposizione.

Una metodologia, un processo di apprendimento e di ricerca basata su schemi, permette all’individuo di accrescere le proprie conoscenze.

Ma non solo: imparare a ricercare permette di migliorare le proprie capacità di trovare informazioni rilevanti nel momento giusto, e migliorare in questo modo se stesso e gli altri (ovviamente se le ricerche effettuate si propongono come obiettivo quello di trovare informazioni utili per tutti).

E’ qui che entra in gioco il motore di ricerca. Un search engine come possono esserlo Google o Bing semplifica (ovviamente se usati con metodo e nel modo giusto) il reperimento di informazioni. Attenzione, è importante comprendere come il motore di ricerca non sostituisce la metodologia di ricerca, che se non viene appresa nella maniera corretta da chi effettua una ricerca, non porterà probabilmente ai risultati desiderati. Ecco perché il motore di ricerca è soltanto uno strumento per reperire le informazioni, e non fornisce informazioni esso stesso.

Mettiamo ad esempio che voglio cercare, in biblioteca, informazioni per la mia tesi su Shakespeare. Da dove comincio? Se non ho una base di conoscenze che mi permetta di guidare me stesso nella ricerca di informazioni pertinenti, diventerà per me difficile trovare ciò di cui ho bisogno. Mettiamo però che l’argomento della mia tesi sarà sulle Metamorfosi in Shakespeare. Beh, in questo caso avrei un ottimo punto di partenza se sapessi che, ad esempio, in A Midsummer Night’s Dream si parla proprio di metamorfosi, e che alcuni autori e scolari famosi (che il mio bagaglio culturale dovrebbe permettermi di conoscere) hanno trattato proprio questo argomento. Ed ecco che proverei ad effettuare delle ricerche nella mia biblioteca in relazione a delle query di ricerca ben precise, come ad esempio “metamorfosi e teatro“, oppure “metamorfosi in shakespeare“, oppure “shakespeare e ovidio“, e così via. Se poi conosco già degli autori rilevanti ed autorevoli che parlano di argomenti simili, o che comunque affrontano Shakespeare nelle loro tesi e nei loro scritti, la mia ricerca è facilitata dal fatto che avrei già un ulteriore punto di partenza (autori autorevoli e con una certa reputazione) di fonti autorevoli da dove iniziare le mie ricerche.

Verrei quindi a conoscenza di René Girard, un grande studioso che ha scritto teorie sulle metamorfosi in Shakespeare, e su come il desiderio mimetico guidi i protagonisti di molte delle sue opere. Ecco, riuscirei quindi ad arrivare a dei risultati utili per la mia ricerca, grazie ad uno strumento che mi permette di cercare all’interno di una biblioteca, essendo in grado di scindere le risorse utili ed autorevoli da quelle inutili e poco credibili. Saprei quindi cosa può guidare effettivamente la mia ricerca e la mia tesi verso conclusioni il più possibile corrette e basate su fonti attendibili. Ecco come dovrebbe, a grandi linee, funzionare una ricerca.

Il motore di ricerca funziona proprio in maniera simile. Ecco perché da tanta importanza ad una fonte autorevole rispetto ad una sconosciuta. Perché sa che si può fidare di quella fonte, che un utente avrebbe una probabilità molto più alta di trovare informazioni pertinenti grazie ad un autore conosciuto ed autorevole piuttosto che da un perfetto sconosciuto. Usciamo qui da Shakespeare per entrare nel mondo degli algoritmi e delle probabilità statistiche 🙂

Lascia un commento