Semantic Search

La Search sta cambiando. E’ con questa frase che David Amerland inizia la prefazione del suo libro Google Semantic Search. Se sei su Internet da parecchio tempo, e da parecchio utilizzi i motori di ricerca, avrai notato come nel corso del tempo è cambiato il modo con cui ci si approccia alle informazioni, andando nella direzione della ricerca semantica, o semantic search. E’ quindi opportuno fermarci un attimo e domandarci: Perché abbiamo cambiato il modo con cui cerchiamo su Internet?

Nuovi Tipi di Query

L’ampia gamma di dispositivi con cui ci connettiamo alla Rete, rappresenta un fattore determinante. PC, portatili, smartphone, tablet, televisori, hanno ognuno un metodo diverso di input, che va dal digitare una parola ad effettuare una richiesta vocale (per esempio con Siri, Cortana o Google Now). Se una volta la query tipica era del tipo [ristoranti a Milano], oggi è diventata molto più specifica (e naturale), come [dove andare a mangiare cibo indiano a Milano], o [qual è il posto migliore per mangiare cibo indiano a Milano]. I motori di ricerca han capito che lavorare sulle singole parole chiave non era sufficiente; hanno invece bisogno di capire come i dati sono correlati, sia all’interno dello stesso sito che nell’intero web. E’ questo il cambiamento più importante all’interno della search: il passaggio da parole chiave ad entità. Le parole diventano concetti, e i motori di ricerca evolvono in macchine in grado di apprendere.

Cosa è la “Ricerca Semantica”?

Secondo Wikipedia,

La Semantic Search punta a migliorare l’accuratezza delle ricerche, attraverso la comprensione dell’intento dell’utente e il significato contestuale dei termini che appaiono nell’ambito della ricerca, sia sul Web che all’interno di un sistema chiuso, al fine di generare risultati più rilevanti.

Secondo Techopedia,

La Semantic Search è una tecnica di ricerca di dati dove una query si propone di trovare non solo le parole chiave, ma di determinare l’intento e il significato contestuale delle parole che la persona sta utilizzando per cercare.

Soffermiamoci su 2 concetti importanti: intento e contesto. L’intento parte dall’utente, il quale dichiara (più o meno) esplicitamente cosa sta cercando. E il contesto, che potrebbe essere inteso come tutto ciò che “circonda” una ricerca e la fa andare in una certa direzione, ovvero le dà un senso. Collegando intento e contesto, i motori di ricerca sono in grado di comprendere le diverse query, cosa le motiva, e cosa ci si aspetta da loro.

L’Arrivo di Hummingbird

A fine estate del 2013, Google ha annunciato un nuovo aggiornamento algoritmico: Hummingbird. A differenza di Panda o di Penguin, che possono essere visti come nuove parti meccaniche di un vecchio motore, Hummingbird è il motore nuovo di zecca, orientato a presentare i risultati in un modo completamente diverso rispetto al passato. Lo sforzo di Google è quello di concentrarsi sulla fase di comprensione delle ricerche. Ciò faciliterebbe le fasi successive, limitando il numero dei documenti indicizzati che vengono consultati per mostrare i migliori risultati possibili.

Search Phase

Questa maggior attenzione alla fase di comprensione significa anche una maggior attenzione al contesto della ricerca, a come i concetti appaiono nei documenti e a come sono in relazione fra loro. Abbiamo già visto che le parole non sono più un insieme di semplici lettere, ma si stanno tramutando in concetti (agli occhi di Google). Ciò significa che quello che una volta era una “singola unità”, ora ha una serie di connotazioni che gli danno un significato concreto. E questo viene fatto attraverso un processo di disambiguazione. Secondo Wikipedia,

Nella linguistica computazionale, la disambiguazione (in inglese Word Sense Disambiguation o WSD) è l’operazione con la quale si precisa il significato di una parola o di un insieme di parole (frase), che denotano significati diversi a seconda dei contesti e che quindi sono ambigue.

Disambiguare un termine è quindi distinguere chiaramente il suo significato, ovvero individuare i diversi contesti in cui può essere utilizzato.

Come funziona la “Ricerca Semantica”?

Se cerchiamo il termine [panda] su Google, senza specificare altro, ci si potrebbe riferire ad una specie di orso originario della Cina, a uno degli aggiornamenti algoritmici di Google, o anche ad un antivirus per PC.

Panda Query

In prima battuta Google mostra principalmente l’orso, e più in basso sulla pagina l’antivirus. In coda alla SERP, vengono però mostrate altre ricerche correlate in grado di affinare la query:

Panda Related Searches

Fra queste possiamo notare [panda express], una catena di ristoranti cinesi che viene proposta anche in Google Suggest:

Google Suggest Panda

Potremmo quindi affermare che, in caso di mancanza di contesto, Google fornisce varie opzioni molto diverse fra loro. Sta all’utente scegliere il tipo di [panda] che desidera approfondire. Se facciamo una nuova query digitando [panda diet], chiariamo perfettamente a Google cosa stiamo cercando: vogliamo sapere che cosa mangia il panda. E infatti otteniamo questa SERP:

Panda Diet Query

In questo caso Google mostra una card presa dalla sua Knowledge Base, utilizzando dati estratti dal sito dello Smithsonian National Zoological Park. Siamo quindi di fronte ad un passo oltre il Knowledge Graph, dove Google mostra una sorta di “scheda” sulla spalla di destra delle SERP attingendo da fonti come Wikipedia:

Panda Knowledge Graph

Possiamo anche notare che, dalle ricerche correlate poste in fondo alla SERP, Google sembra ora comprendere meglio la query effettuata dall’utente:

Panda Diet Related Searches

Stesso dicasi per Google Suggest, che offre suggerimenti più in linea con la ricerca che si sta digitando:

Google Suggest Panda Diet

Nella query iniziale, Google si è trovato davanti ad un termine che faceva riferimento a varie entità. Se andiamo in Freebase, una delle tante fonti utilizzate da Google per estrarre dati, possiamo notare che la ricerca [panda] restituisce 220 risultati. Nel secondo tentativo il termine risulta meglio definito aggiungendogli un contesto, al punto che possiamo chiamarlo entità. Non avrebbe senso per Google mostrare un antivirus nella SERP, se abbiamo aggiungo [diet] vicino a [panda].

Queries Entities

La “Search Entity”

Per trovare e mostrare risultati più rilevanti, Google chiede aiuto alle Search Entity. In pratica, come spiega Bill Slawski, è un processo mediante il quale le ricerche effettuate dagli utenti permettono di stabilire una relazione che aiuta ad identificare l’importanza di vari documenti, e di conseguenza influenza le informazioni visualizzate. Nello stabilire il contesto in cui si verifica una query, Google prende in considerazioni una serie di fattori fra qui:

  • La cronologia delle ricerche dell’utente
  • La posizione geografica dell’utente
  • Lo storico globale delle ricerche effettuate dall’utente
  • Le relazioni con una gran quantità di dati memorizzati in precedenza (termini o entità)
  • Le caratteristiche della query (ortografia, varianti, ect.)
  • I domini, sullo stesso tema, linkati dal documento
  • La co-occorrenza dei termini e la distanza fra questi

Perché Dovrei Prestare Attenzione alla “Ricerca Semantica”?

Questa frase è in testa ad una pagina di Google dedicata a spiegare gli obiettivi dell’azienda:

La missione di Google è organizzare le informazioni e renderle universalmente accessibili e fruibili.

Nel lavoro dell’organizzare le informazioni, è fondamentale trovare meccanismi che permettano di meglio comprendere i contenuti esistenti. I motori di ricerca stanno diventando delle vere e proprie learning machine, e pertanto dobbiamo cercare di rendere loro semplice il processo di comprensione. Ci sono diversi elementi utili a tale scopo, e probabilmente il principale è oggi l’uso del markup semantico. Google, Bing, Yahoo! e Yandex hanno deciso di unire le forze per sviluppare un “vocabolario” che possa permettere la marcatura semantica HTML delle pagine web. Il risultato è stato Schema.org, un sito nel quale puoi trovare tutto il necessario per marcare in modo appropriato i tuoi contenuti. Sul sito possiamo leggere:

La marcatura on-page permette ai motori di ricerca di meglio comprendere le informazioni presenti sulle pagine web e fornire risultati di ricerca più ricchi, al fine di rendere più semplice per gli utenti trovare informazioni rilevanti sul web.

Il markup semantico aiuta quindi i motori di ricerca a visualizzare risultati più rilevanti per l’utente, grazie ai famosissimi rich snippet.

Come Sfruttare Appieno la “Ricerca Semantica”?

Eccoti 7 consigli rapidi a far comprendere meglio ai motori di ricerca i contenuti delle tue pagine, aumentandone quindi la rilevanza.

1. Crea un Contesto

Quando crei un nuovo contenuto, chiediti “qual è il modo migliore per presentare le informazioni, in modo che sia facile per l’utente trovarle?” Quando l’utente comprende in modo semplice i nostri contenuti, è molto probabile che anche il motore di ricerca faccia lo stesso.

2. Co-Occorrenze

Quando leggiamo o parliamo di un termine specifico, solitamente lo accompagniamo ad una serie di altre parole che aiutano a contestualizzarne il significato. Seguendo l’esempio del [panda], è assai probabile che in un testo troveremo termini come [bamboo], [cina], [orso], etc. Se siamo in grado di identificare tutte queste parole, e includerle nella pagina, possiamo fornire importanti indizi sul tema del contenuto ai motori di ricerca.

3. Sinonimi e Varianti

Arricchire il testo rendendolo più leggibile, senza ripetere la stessa parola chiave più e più volte, aiuterà i motori di ricerca su 2 fronti:

  • da un lato, ad individuare una serie di termini direttamente legati al tema principale del contenuto
  • dall’altro, a costruire un contesto più ricco per il motore

4. Ricerca di Parole Chiave Semantiche

Le parole chiave sono ancora molto importanti, e quindi dobbiamo cercare quelle che portano maggiori benefici. Qui trovi 5 suggerimenti su come effettuare una ricerca di keyword semantiche.

5. Link a Fonti con gli Stessi Argomenti

Quando linki un sito esterno, fai in modo che il contenuto della pagina linkata sia di una qualità uguale o superiore alla tua. Rafforzerai le relazioni fra documenti, e fornirai valore ai tuoi lettori.

6. Condivisione sui Social

L’alta qualità dei contenuti è in grado di attrarre l’attenzione degli utenti, e di renderli più inclini a condividere. Per alcuni social, possiamo anche contrassegnare i contenuti con metadati che permettono di migliorarne la visualizzazione.

  • Facebook: OpenGraph
  • Twitter: Twitter Cards
  • Pinterest: Rich Pins

7. Strumenti Utili

Ci sono diversi tool che possono aiutarci ad aggiungere uno strato semantico ai nostri contenuti. Fra questi:

Trovi altri spunti interessanti in questo articolo sulla SEO On-Page, e in quest’altro sull’ottimizzazione di una pagina web.

Conclusione

Non vi è dubbio che il panorama della Search sta cambiando verso un linguaggio più naturale e spontaneo. Anche se rimangono importanti, le parole chiave non sono più quello che erano solo qualche anno fa. Oggi abbiamo bisogno di guardare oltre. Il linguaggio che utilizziamo tutti i giorni è cruciale per dare, ai motori di ricerca, le informazioni necessarie per trovare i contenuti che gli utenti cercano. Il “Semantic Web” è un nostro grande alleato: abbiamo a disposizione diversi strumenti per mettere in risalto i nostri contenuti. Possiamo permetterci di ignorare la cosa? Io credo di no. Liberamente tradotto da SEO 101: What is Semantic Search and Why Should I Care?, di Sergio Redondo.