Motori di RicercaQuando digitate un termine di ricerca nella casella di ricerca di Google o Yahoo o Live.com, il motore di ricerca potrebbe passare in rassegna i propri indici e cercare di trovare le pagine più rilevanti e importanti nei propri dati correlate alla parola o alla frase che voi state cercando.

Ma quei motori di ricerca potrebbero provare a migliorare i risultati da mostrarvi provando a capire l’intenzione che sta dietro alla vostra ricerca, piuttosto che fermarsi alla ricerca delle pagine che corrispondono alle parole chiave che avete digitato come query di ricerca.

I motori di ricerca e l’intenzione del ricercatore

Cosa rivelano i motori di ricerca sull’importanza di considerare l’intenzione che sta dietro una ricerca?

Google ci spiega in una delle pagine dell’aiuto alla ricerca che:

Una ricerca è raramente assoluta. I motori di ricerca usano un insieme di tecniche per imitare il modo in cui le persone pensano e per approssimare i loro comportamenti. Come risultato, molte regole hanno delle eccezioni. Per esempio, la query [for better or for worse] non sarà interpretata da Google come una query OR, ma come frase che corrisponde ad un fumetto molto popolare. Google mostrerà il calcolatore dei risultati per la query [ 34 * 87 ] piuttosto che usare l’operatore ‘Riempi gli spazi vuoti ‘. In entrambi i casi ha seguito l’intento implicito della query.

Yahoo menziona anche il fatto che cerca di considerare l’intento che sta dietro ad una ricerca in una delle pagine d’aiuto intitolata Come vengono classificati i documenti web:

I motori di ricerca non hanno la possibilità di porre delle domande, perciò si affidano ai termini visitati per interpretare e determinare l’intenzione della ricerca di ricerca.

Satya Nadella di Microsoft, vicepresidente della piattaforma del gruppo di ricerca, del portale e della piattaforma pubblicitaria, descrive come anche l’intento dell’utente giochi un ruolo nel risultato presentato agli utenti di live.com in una presentazione dell’agosto 2008:

Credo che questo concerto per il quale capire l’intenzione dell’utente ed essere in grado di analizzare (le query di ricerca) per trovare modelli di ricerca e usarli per modellare le udienze di ricerca sia una delle aree più importanti per noi.

Una serie di intenzioni dietro le ricerche è stato identificato in un documento 2002, Tassonomia di una ricerca web, che divide le ricerche in tre tipi: di informazione, transazionali, e di navigazione.

Le ricerche di informazione sono condotte da un ricercatore che voglia venire incontro a qualche ipotetico bisogno di informazione. Le ricerche di transazione vengono fatte per aiutare il ricercatore a portare a termine un compito sul web. Le ricerche di navigazione hanno lo scopo di aiutare il ricercatore a trovare una specifica pagina.

Identificare l’intento dietro una ricerca può essere un compito difficile, come il ricercatore Google Dan Russell ha sottolineato in diverse presentazioni, tra le quali una su ACM SIGCHI The San Francisco Bay Area Chapter of in 2006, dove ha descritto alcuni degli approcci che Google utilizza per saperne di più sulle intenzioni che stanno dietro alle ricerche. Uno di questi approcci coinvolge il guardare i file di log dei motori di ricerca, e vedere come le persone raffinano le ricerche che seguono durante la sessione di ricerca.

Un paio di nuove domande di brevetto Yahoo descrive come i motori di ricerca potrebbero guardare i file di log per identificare se alcune domande provino l’esistenza di intenzioni che può essere facile identificare guardando alla sola query di ricerca.

Intenzioni esplicite e implicite del ricercatore

L’intenzione che sta dietro ad alcune ricerche può essere più semplice da capire e da interpretare per un motore di ricerca che per altri, e può essere considerato avere un’intenzione esplicita dietro di essa.

IntenzionePer esempio, se state cercando un nuovo paio di scarpe o una videocamera, potreste includere alcune parole nella ricerca che dicano al motore di ricerca qualcosa sulle vostre intenzioni, come “scarpe sportive economiche” o “comprare una videocamera.” Un motore di ricerca può considerare l’uso della parola “economico” o “compra” come un’indicazione esplicita del fatto che volete fare un acquisto ondine.

Se la vostra ricerca include la parola “cliente,” può segnalare al motore di ricerca che desiderate delle pagine di informazione su quello specifico tipo di prodotti o servizi. La ricerca di un luogo o un tipo di posizione geografica può indicare al motore di ricerca che state effettuando una ricerca di luogo, e potrebbero esservi mostrati i risultati di ricerca di luogo quando digitate cose come “ biblioteca San Jose” in una casella di ricerca.

Altre ricerche possono non essere così chiare nei loro intenti. La richiesta di brevetto Yahoo ci fornisce un esempio di ricerca per il termine [Olimpiadi]. Il miglior risultato da mostrare ad un ricercatore potrebbe essere l’Olimpiade di un anno specifico, anche se la ricerca non include un anno.

Il motore di ricerca potrebbe cercare tra i log delle query di ricerca e scoprire che molte delle query che le persone hanno usato per trovare informazioni sulle Olimpiadi includono un anno all’interno della query, come nei casi:

  • 2004 Olimpiadi estive di Atene,
  • 2006 Olimpiadi invernali a Torino,
  • 2008 Olimpiadi estive in Cina,
  • 2010 Olimpiadi invernali a Vancouver, oppure;
  • 2012 Olimpiadi estive a Londra.

OlimpiadiMolti ricercatori sono “sensibili alla temporalità,” ed estraggono dai motori di ricerca i log per trovare un modello simile che possa aiutare il motore di ricerca a capire l’intenzione che si trova dietro alla ricerca e determinare il risultato da mostrare come risultato. È possibile che un motore di ricerca possa aumentare il posizionamento di pagine che mostrino le intenzioni di ricerca più popolari, o che si debbano riposizionare i risultati di ricerca per mostrare una gamma più ampia di intenzioni sottostanti ad una query che ha un’implicita intenzione dietro di sé.

Per esempio se molte delle persone che cercano la parola “Olimpiadi” tende a cliccare nelle pagine dalla ricerca le Olimpiadi 2010 o a raffinare la propria query per includere l’anno 2010, allora il motore di ricerca potrebbe aumentare il rank dei risultati di ricerca rilevanti per le Olimpiadi dell’anno 2010.

Un approccio alternativo potrebbe essere quello di cercare i log delle query e vedere la percentuale di persone che clicca sui risultati delle Olimpiadi associati con uno specifico anno, o che definisce i propri risultati per uno specifico anno e mostrare un diverso mix di risultati per ognuno degli anni.

Perciò, se il 50% dei ricercatori cerca “Olimpiadi” sembrerebbe star cercando le Olimpiadi dell’anno 2010, mentre il 30% sembrerebbe star cercando le Olimpiadi del 2012 e i ricercatori rimanenti del termine “Olimpiadi” sembrerebbero non star cercando una data correlata al termine, perciò nella top ten (o nei primi 100, o nei primi qualcos’altro) dei risultati di ricerca ci potrebbero essere la metà dei risultati sulle Olimpiadi del 2010, ci potrebbero essere risultati sulle Olimpiadi del 2012 per circa un terzo e ci potrebbero essere pagine generali sulle Olimpiadi senza necessariamente esserci pagine correlate a un anno specifico.

Le domande di brevetto depositate sono:
Estrarre gli intenti delle query dai log di query
Inventato da Priyank S. Garg, Kostas Tsioutsiouliklis, Bruce T. Smith, e Timothy M. Converse
Numero di brevetto USA 20090043749
Pubblicato il 12 febbraio 2009
Archiviato il 6 agosto 2007

Estratto

Vengono fornite delle tecniche per la memorizzazione delle query effettuate, ricevute da un motore di ricerca e presenti nei log di query.

Per un termine di ricerca particolare nella query, viene determinato quante ricerche nei log di query contengono quel particolare termine e un termine indicativo dell’intento,e determinato quante ricerche nei log di query di quel particolare termine di ricerca senza termine indicativo dell’intento.

Basandosi su una ratio tra il numero di ricerche nei log che contengono quel particolare termine di ricerca indicativo dell’intento e il numero di ricerche nei log che contengono il termine di ricerca senza il termine indicativo dell’intenzione, viene determinato se un particolare termine di ricerca è indicativo dell’intento di ricerca.

In risposta alla determinazione di un termine come qualificativo dell’intento di ricerca, vengono memorizzati dei dati in un computer-readable che identifica i termini di ricerca come qualificativi dell’intento della query.

Le query con intento implicito che contengono i termini di ricerca qualificativi dell’intento vengono elaborati su base, almeno in parte, dell’intento associato con il termine di ricerca.

Stima della rilevanza dei dati di una query dai file di log della query
Inventato da Farzin Maghoul e Kostas Tsioutsiouliklis
Domanda di brevetto USA 20090043748
Pubblicato il 12 febbraio 2009
Archiviato il 6 agosto 2007

Estratto

Vengono fornite delle tecniche per ottenere dati che indicano per una pluralità di termini di ricerca se la pluralità dei termini di ricerca sia qualificativa dei dati della ricerca.

Come viene ricevuta una ricerca, in risposta al ricevimento della query essa viene ispezionata per determinare se contenga un particolare termine qualificativo dei dati per i termini di ricerca.

Poi viene determinato quale particolare termine di ricerca determinato è stato associato con una pluralità di dati, ed è determinato che la pluralità di dati con cui il termine qualificativo si basa almeno in parte sulla frequenza con cui ogni particolare dato della pluralità di dati è stato associato con il particolare termine qualificativo dell’intento dal termine della query.

Conclusioni

La domanda di brevetto vuole fornire esempi ed identificare termini temporali e dati sensibili delle intenzioni della ricerca, ma i metodi che si descrivono possono essere usati per trovare altri intenti implicito che stanno dietro alle ricerche.

Noi non sappiamo se i metodi che stanno dietro queste ricerche e quanto questi metodi siano compresi nei risultati di ricerca Yahoo, ma sappiamo che l’intento dietro alcuni termini di ricerca in alcune ricerche possono influenzare i tipi di risultato che riceviamo dai maggiori siti di ricerca, come le ricerche di navigazione mostrano i risultati principali con i link, o una ricerca locale mostra una casella o dieci caselle con risultati con mappa.

Se eseguite una ricerca con Google o Yahoo o Live.com, ci sono possibilità che questi considerino le intenzioni che stanno dietro alla vostra ricerca, che possano mostrare risultati che sono influenzati da come un motore di ricerca interpreta quali possano essere state le vostre intenzioni al momento dell’esecuzione della ricerca.

Un posto nel quale un motore di ricerca può guardare sono i propri file di log delle query, pensando di poter ricavare un’intenzione implicita dietro i vostri termini di ricerca guardando ai risultati scelti dai precedenti navigatori che hanno effettuato quella ricerca o guardando a come alcuni ricercatori possono aver riscritto o ridefinito le loro query di ricerca.

Se cercate “Olimpiadi” senza includere un anno, i risultati di ricerca che prevede potrebbero focalizzarsi sull’anno 2010 e 2012 delle Olimpiadi, perché questo sembra essere un dato sensibile in base al tempo per quella ricerca.

Se siete proprietari di un sito o lavorate in un sito e state effettuando una ricerca con una parola chiave su una specifica fase di ricerca per le pagine di un sito, è importante considerare che i motori di ricerca potrebbero considerare qualcos’altro oltre il numero delle volte che la frase di ricerca viene mostrata nella pagina negli elementi title, o headings, or text, o nell’anchor text puntando a quelle pagine o al PageRank (o alla link popularity o alla qualità di pagina delle pagine) quando riporta i risultati a chi effettua la ricerca.

I motori di ricerca potrebbero tentare di capire le intenzioni dietro i termini di ricerca, mostrando ai ricercatori le pagine che essi credono corrispondano a quegli intenti.

Ringraziamenti

Si ringraziano:

Sara Radicia, webmaster di Firefox Blog e traduttrice per la traduzione del testo.
SeobytheSea per la stesura originale dell’articolo in lingua inglese e per la collaborazione data.

2 Responses

Leave a Reply

Your email address will not be published.