<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Seo Point - Posizionamento e SEO &#187; Yahoo</title>
	<atom:link href="http://www.seopoint.org/category/brevetti/yahoo-brevetti/feed" rel="self" type="application/rss+xml" />
	<link>http://www.seopoint.org</link>
	<description>Risorse, News, Guide ed Articoli sulla promozione dei siti Web.</description>
	<lastBuildDate>Fri, 25 Jun 2010 14:41:01 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>I Motori di Ricerca guardano le Keywords negli URL?</title>
		<link>http://www.seopoint.org/i-motori-di-ricerca-guardano-le-keywords-url.html</link>
		<comments>http://www.seopoint.org/i-motori-di-ricerca-guardano-le-keywords-url.html#comments</comments>
		<pubDate>Thu, 26 Mar 2009 16:04:06 +0000</pubDate>
		<dc:creator>Paolo Dello Vicario</dc:creator>
				<category><![CDATA[Yahoo]]></category>
		<category><![CDATA[Keywords]]></category>
		<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[URL]]></category>

		<guid isPermaLink="false">http://www.seopoint.org/?p=584</guid>
		<description><![CDATA[Esiste un valore aggiunto usando le keywords negli URL delle pagine? Un motore di ricerca guarda le keywords che inserite negli indirizzi delle pagine, e associa quelle keywords con il contenuto delle pagine stesse nei suoi indici?

Se è così,&#8230;]]></description>
			<content:encoded><![CDATA[<p>Esiste un valore aggiunto usando le keywords negli URL delle pagine? Un <a title="Motori di Ricerca" href="http://www.seopoint.org/lista-motori-di-ricerca.html" target="_blank"><strong>motore di ricerca</strong></a> guarda le keywords che inserite negli indirizzi delle pagine, e associa quelle keywords con il contenuto delle pagine stesse nei suoi indici?</p>
<p style="text-align: center;"><img class="size-medium wp-image-585 aligncenter" title="Keywords" src="http://www.seopoint.org/wp-content/uploads/keywords-300x137.jpg" alt="Keywords" width="300" height="137" /></p>
<p>Se è così, un motore di ricerca come dovrebbe andare a guardare gli URL delle pagine e &#8220;spezzettarli&#8221; in parti significative per identificare le keywords?</p>
<p>Dividere gli URL in parti potrebbe anche giocare un ruolo in come le pagine di un sito verrebbero visitate dallo spider di un motore di ricerca.</p>
<p>Un recente brevetto pubblicato da Yahoo ci da alcune idee di come potrebbe estrarre le keywords dagli URL delle pagine, classificarli, usando informazioni scoperte nel processo per determinare quali pagine visitare per prime con lo spider.</p>
<p><strong><a href="http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&amp;Sect2=HITOFF&amp;u=%2Fnetahtml%2FPTO%2Fsearch-adv.html&amp;r=1&amp;p=1&amp;f=G&amp;l=50&amp;d=PG01&amp;S1=20090083266.PGNR.&amp;OS=dn/20090083266&amp;RS=DN/20090083266" target="_blank">Tecniche per Contrassegnare gli URL</a></strong><br />
Inventato da Krishna Leela Poola e Arun Ramanujapuram<br />
Assegnato a Yahoo<br />
Numero di Brevetto USA  2000083266<br />
Pubblicato il 26 Marzo 2009<br />
Archiviato il 6 Novembre 2007</p>
<p>Un motore di ricerca guarderà molti differenti fattori per determinare a cosa si riferisci una pagina nel Web, e provare a classificare le pagine basandosi sulle keywords, che potrebbero essere un&#8217;indicazione dell&#8217;argomento importante , o sui contenuti di quelle pagine.</p>
<p>Molte di quelle keywords vengono estratte dai contenuti delle pagine stesse, ma un motore di ricerca può osservare altre informazioni associate alla pagina, come ad esempio l&#8217;indirizzo delle pagine.</p>
<p>Le <strong>Keywords possono anche essere estratte dagli URL delle pagine</strong>, usando un algoritmo che può dividere l&#8217;URL in componenti, capendo la struttura di quell&#8217;URL e rimuovendo alcune keywords dalle diverse parti trovate all&#8217;interno dell&#8217;URL.</p>
<h2>Parti degli URL</h2>
<p>Il brevetto fornisce una definizione alle differenti parti degli URL:</p>
<ul>
<li><strong><span style="color: #ffcc00;">Schema</span>: </strong>Questa parte di URL identifica il protocollo usato per accedere alla risorsa, come HTTP o FTP.</li>
<li><strong><span style="color: #3366ff;">Autorevolezza</span>: </strong>La parte di URL che identifica il server dove sono situati documenti e risorse, o più semplicemente il nome a dominio.</li>
<li><strong><span style="color: #ff9900;">Path</span>: </strong>Questa è l&#8217;informazione seguente allo slash dopo &#8220;l&#8217;autorevolezza&#8221;, o il nome a dominio, e identifica la specifica pagina o la risorsa.</li>
<li><strong><span style="color: #993366;">Argomenti della Query</span>: </strong>Una stringa che può apparire nella Path che può essere divisa in nome e coppie di valorim come ad esempio &#8220;categoria=magliette&#8221;.</li>
<li><strong><span style="color: #339966;">Frammenti</span>: </strong>Un frammento identifica una sottosezione all&#8217;interno di una pagina che potrebbe essere indicata nell&#8217;URL, di solito inizia con questo simbolo &#8220;#&#8221;.</li>
</ul>
<p>Un esempio di questi cinque differenti componenti dal deposito di brevetti(indicati con i cinque colori qua sopra):</p>
<blockquote><p><strong><span style="color: #ffcc00;">http://</span><span style="color: #3366ff;">www.yahoo.com:80</span><span style="color: #ff9900;">/shopping/search?</span><span style="color: #993366;">kw=blaupunkt</span><span style="color: #339966;">#desc</span></strong></p></blockquote>
<h2>Contrassegnare gli URL per Keywords e Scansione del Web</h2>
<p>Il brevetto descrive una modo per dividere gli URL in parti, o componenti, per estrarre le keywords dagli URL. Quelle keywords potrebbero essere usate per dividere in categorie le pagine per le ricerche nel web, e per capire di cosa parlano le pagine quando vengono provviste pubblicità per quelle pagine.</p>
<p>Questa divisione degli URL in componenti, e in più piccole parti è trattata come &#8220;Contrassegnamento degli URL&#8221;. Oltre ad aiutare un motore di ricerca per trovare le parole chiave negli URL, può avere un impatto sulla indicizzazione delle pagine di un sito web:</p>
<blockquote><p><span style="color: #000000;">I segni generati dal contrassegnamento degli URL possono anche essere determinati con caratteristiche del documento web per affinare l&#8217;efficienza di una ricerca. Contrassegnare gli URL è inoltre il </span>primo passo raggruppando gli URL di un sito web. Raggruppare gli URL consente l&#8217;identificazione di porzioni di un documento che mantiene più rilevanza. Quindi quando un sito web viene scansionato da un motore di ricerca, alcune porzioni di documenti potrebbero essere inserite in una &#8220;white list&#8221; ed essere scansionate, mentre altre porzioni potrebbero essere inserite in una &#8220;black list&#8221; e non venire scansionate. Ciò guida una scansione del web più efficiente.</p></blockquote>
<h2>Conclusioni</h2>
<p>Yahoo fornisce un giusto livello di dettagli nel brevetto su come gli URL possono essere divisi in componenti, e su come le keywords possono essere estratte da quei componenti, fornendo diverse classificazioni. Se siete interessati a come gli URL di un sito potrebbero essere trattate da questo processo, è importante spendere qualche tempo con il deposito brevetti stesso per comprendere al meglio i dettagli tecnici. Tenete a mente che i processi di questo brevetto possono non essere gli unici che Yahoo stia utilizzando in questo momento.</p>
<h3>Una nota precauzionale</h3>
<p>Cambiare gli URL delle tue pagine, specialmente se quegli URL sono stati Online per qualche tempo e sono stati indicizzati dai motori di ricerca, è una procedura che non deve essere avviata senza un attento esame, e senza l&#8217;uso di un approccio prudente che mantiene il rischio di questo cambiamento al minimo.</p>
<p>Un approccio di questo tipo può prevedere l&#8217;uso di <strong>corretti redirects(Redirect 301)</strong> per ogni nuovo URL per i links esterni che puntano alle pagine del sito e di altre tecniche che possono aiutare a far mantenere invariato il posizionamento nei motori di ricerca.</p>
<p>Come un motore di ricerca potrebbe reagire alle modifiche di un URL può cambiare da un motore di ricerca all&#8217;altro e il traffico verso le pagine di un sito <strong>può essere influenzato negativamente da un tale cambiamento</strong>, per un determinato periodo di tempo, indipendentemente da quanto attentamente è stato fatto tale cambiamento.</p>
<p style="text-align: right;"><em><strong>Fonte</strong>: <a href="http://www.seobythesea.com/?p=1258" target="_blank">SeobytheSea</a></em></p>
<div class="tweetmeme_button" style="float: left; margin-right: 10px;">
			<a href="http://api.tweetmeme.com/share?url=http%3A%2F%2Fwww.seopoint.org%2Fi-motori-di-ricerca-guardano-le-keywords-url.html"><br />
				<img src="http://api.tweetmeme.com/imagebutton.gif?url=http%3A%2F%2Fwww.seopoint.org%2Fi-motori-di-ricerca-guardano-le-keywords-url.html&amp;source=pdellov&amp;style=compact&amp;service=bit.ly" height="61" width="50" /><br />
			</a>
		</div>
<h4  class="related_post_title">Articoli Correlati</h4><ul class="related_post"><li><a href="http://www.seopoint.org/ebook-seo-joomla.html" title="SEO: Joomla meglio di Wordpress, non ci credi?">SEO: Joomla meglio di Wordpress, non ci credi?</a><br /><small>Ho sempre utilizzato wordpress per realizzare i miei siti e non ho mai provato altri cms per il semplice motivo che mi venivano sconsigliati in quanto "non SEO"...</small></li><li><a href="http://www.seopoint.org/la-funzione-eventi-in-rich-snippets-e-answer-highlighting.html" title="La funzione eventi in Rich Snippets e Answer Highlighting">La funzione eventi in Rich Snippets e Answer Highlighting</a><br /><small>Google ha annunciato la nascita di due nuove tecnologie per affiancare e migliorare i risultati di ricerca. La funzione Answer Highlighting per Google Squared e...</small></li><li><a href="http://www.seopoint.org/lista-motori-di-ricerca.html" title="Motori di Ricerca? Non c&#8217;è solo Google!">Motori di Ricerca? Non c&#8217;è solo Google!</a><br /><small>Probabilmente i motori di ricerca di cui la maggior parte degli internauti è a conoscenza si limita ai big quali Google, Yahoo, MSN e Ask se non a volte ancora ...</small></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.seopoint.org/i-motori-di-ricerca-guardano-le-keywords-url.html/feed</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Come Yahoo potrebbe automatizzare la SEO</title>
		<link>http://www.seopoint.org/come-yahoo-potrebbe-automatizzare-la-seo.html</link>
		<comments>http://www.seopoint.org/come-yahoo-potrebbe-automatizzare-la-seo.html#comments</comments>
		<pubDate>Tue, 17 Feb 2009 15:27:40 +0000</pubDate>
		<dc:creator>Paolo Dello Vicario</dc:creator>
				<category><![CDATA[Yahoo]]></category>
		<category><![CDATA[SEO]]></category>

		<guid isPermaLink="false">http://www.seopoint.org/?p=401</guid>
		<description><![CDATA[E’ un po&#8217; strano vedere un documento di un motore di ricerca che parla di SEO.
È un fatto ancora più strano vederne uno che fornisce dettagli su come il motore di ricerca potrebbe realmente ottimizzare i siti web per&#8230;]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft" style="border: 1px solid black; margin-right: 10px;" title="Yahoo" src="http://www.seopoint.org/wp-content/uploads/yahoo_.jpg" alt="Yahoo" width="112" height="112" />E’ un po&#8217; strano vedere un documento di un motore di ricerca che parla di <strong><a title="Seo" href="http://www.seopoint.org/" target="_blank">SEO</a></strong>.<br />
È un fatto ancora più strano vederne uno che fornisce dettagli su come <strong>il motore di ricerca potrebbe realmente ottimizzare i siti web per i motori di ricerca</strong>.</p>
<p>Un documento di brevetto Yahoo, pubblicato all&#8217;inizio di gennaio, ci fornisce dettagli su come il motore di ricerca potrebbe automatizzare la SEO per i motori.<br />
Il processo descritto coinvolge la ricerca delle query eseguite dai ricercatori nel motore e dei file di log e possibilmente anche l&#8217;attenzione per le attività di navigazione di quei stessi ricercatori.</p>
<p>Potrebbe anche coinvolgere l&#8217;attenzione per le informazioni che gli utenti hanno compilato su come le <strong>parole dovrebbero essere correlate semanticamente</strong> l&#8217;un l&#8217;altra come concetti o come argomenti (o per usare le loro parole, come unità), e la popolarità o la tendenza di quei termini o unità.<br />
Le parti delle pagine, come i titoli e le testate e gli URL per le pagine e gli alt text per le immagini potrebbero essere riscritte automaticamente sulle pagine web, nel tentativo di ottimizzarle per i termini più popolari.</p>
<p>Nella sezione background della domanda di brevetto, viene data una definizione di ottimizzazione per i motori di ricerca:</p>
<blockquote><p><strong>L’ottimizzazione per i motori di ricerca (Search Engine Optimization o, SEO) si riferisce ad azioni che un sito web esegue per migliorare la sua presenza e il suo posizionamento per query di ricerca rilevanti.</strong><br />
I motori di ricerca più popolari, tra i quali Yahoo!.RTM., Google.RTM., e Microsoft Live.RTM., possono utilizzare tecniche similari per determinare la rilevanza dei risultati di ricerca, e la SEO potrebbe includere i tentativi di un sito di apparire in modo più accurato in quei risultati di ricerca.</p>
<p>La SEO può essere effettuata migliorando le etichette, i tag e le informazioni su un sito. Di conseguenza, è opportuno migliorare la SEO delle pagine, così che quelle pagine appaiano nei risultati di ricerca per query correlate al contenuto delle pagine stesse.</p></blockquote>
<p>La domanda di brevetto è la seguente:</p>
<p><a href="http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&amp;Sect2=HITOFF&amp;u=%2Fnetahtml%2FPTO%2Fsearch-adv.html&amp;r=1&amp;p=1&amp;f=G&amp;l=50&amp;d=PG01&amp;S1=20090006311.PGNR.&amp;OS=dn/20090006311&amp;RS=DN/20090006311" target="_blank"><strong>Sistema automatizzato per migliorare la SEO nelle pagine</strong></a><br />
Inventato da Chyr-Chong (Giuseppe) e Adam Ting Hyder<br />
Assegnato a Yahoo<br />
Numero di brevetto USA 20090006311<br />
Pubblicato il 1 ° gennaio 2009<br />
Archiviato 28 giugno 2007</p>
<blockquote><p><strong>Estratto</strong>:<br />
Viene fornito un sistema e un metodo per l&#8217;ottimizzazione per motori di ricerca (SEO). La SEO automatizzata potrebbe analizzare i logs delle query di ricerca, o i database dei log di ricerca per determinare i concetti/ unità popolari che potrebbero essere utilizzati per ottimizzare automaticamente un sito o una pagina per i risultati del motore di ricerca.</p>
<p>Il sito o la pagina viene modificato basandosi sul SEO automatizzato. In particolare, il database dei log può fornire una lista della frequenza delle unità che rifletta la popolarità delle varie unità. Le unità più popolari che sono correlate al contenuto della pagina possono essere usate nel SEO automatizzata della pagina.</p>
<p>La lista della frequenza delle unità può essere comparata con le unità esistenti sulla pagina, così che le parole più popolari e i concetti più popolari all&#8217;interno della pagina possano essere enfatizzati.</p></blockquote>
<p>La domanda di brevetto fornisce un numero di esempi su come il loro sistema di SEO automatizzata potrebbe aggiornare i titoli delle pagine, gli URL delle pagine, le meta description e le meta keyword, gli attributi alt delle immagini, e le testate delle pagine. Per esempio, ecco una discussione sui titoli delle pagine:</p>
<blockquote><p>In un esempio, se avete un blog sulle squadre sportive di Chicago, il vostro titolo potrebbe essere generico, come ad esempio &#8220;Chicago sport blog.&#8221; Tuttavia, dopo aver comparato la lista delle unità frequenti e la lista delle unità della pagina, potrebbe essere stabilito che attualmente i termini Chicago Cubs.RTM. sono i più popolari.</p>
<p>Di conseguenza, l&#8217;ottimizzatore per motori di ricerca seleziona quella unità che modifica il titolo a &#8220;Chicago Cubs blog.&#8221; La popolarità dell&#8217;unità Chicago Cubs.RTM. può fornire dei risultati di ricerca migliori rispetto al titolo &#8220;Chicago sport blog.&#8221;</p></blockquote>
<p>Ho qualche dubbio riguardo a quest&#8217;approccio.<br />
Non posso fare a meno di chiedermi se il titolo per il blog che viene descritto possa essere cambiato in “Chicago Bulls Blog” durante la stagione di basket, o in “Chicago Bears Blog” nei weekend durante la stagione di football. È probabile che questi siano i termini più popolari durante quei periodi di tempo.</p>
<p>I siti che cambieranno regolarmente il proprio focus basandosi sulla popolarità dei termini di ricerca sacrificheranno le proprie identità per afferrare i termini di ricerca più popolari?<br />
<strong>Ci sono anche altri aspetti della SEO che la domanda di brevetto non prende in considerazione, come le decisioni mirate a target di termini meno popolari piuttosto che quelle mirate ai più popolari.</strong><br />
Questo potrebbe accadere quando le persone che stanno dietro un sito riconoscono di non poter competere con i siti che al momento si trovano in classifica per quei termini, ma che allo stesso tempo riconoscono che quei siti non vengono ottimizzati per query di ricerca meno popolari, e credono che il loro audience sia formato da utenti alla ricerca dei termini meno popolari.<br />
Oppure quando il proprietario di un sito riconosce che esista una nicchia di mercato o informativa non adeguatamente coperta nel web.</p>
<h2>Conclusioni</h2>
<p>La SEO non riguarda il tentativo di raggiungere più traffico possibile su un sito per i termini più popolari possibili.</p>
<p style="text-align: center;"><img class="size-full wp-image-403 aligncenter" style="border: 1px solid black;" title="Seo Yahoo" src="http://www.seopoint.org/wp-content/uploads/seo-yahoo.jpg" alt="Seo Yahoo" width="389" height="136" /></p>
<p>Invece, si tratta di capire l&#8217;obiettivo di un sito, e sapere abbastanza del pubblico che potrebbe essere interessato in quello che il sito offre, per aiutare i ricercatori e quei siti a trovarsi l&#8217;un l&#8217;altro. Questo può riguardare trovare le parole giuste da usare nelle pagine di un sito piuttosto che le parole più popolari.<br />
La SEO riguarda anche conoscere abbastanza il modo in cui funzionano i motori di ricerca così che sia più facile per tali motori indicizzare le pagine di un sito, e capire cosa quelle pagine trattano quando le indicizzano.</p>
<p><strong>La domanda di brevetto Yahoo entra nei dettagli delle basi dell&#8217;ottimizzazione di una pagina individuale per i motori di ricerca, ma ignora molti dei dettagli tecnici coinvolti nella costruzione dei siti e delle pagine search engine friendly.</strong></p>
<p>La domanda di brevetto Yahoo evita anche di discutere l&#8217;argomento della difficoltà che può comportare a volte ottimizzare pagine per termini di ricerca molto popolari e competitivi.<br />
Il proprietario di un sito potrebbe volere targetizzare termini di ricerca meno popolari in pagine che si trovano a livelli di directory abbastanza profonde nei loro siti e che hanno un buon rank per le ricerche che il proprio pubblico condurrà su quelle pagine piuttosto che targetizzare termini più popolari per quelle pagine, ed avere un rank molto basso.<br />
Un&#8217;altra questione che dovrebbe essere sollevata è il potenziale di conflitto di interessi del motore di ricerca che esegue anche l&#8217;ottimizzazione per motori di ricerca.</p>
<h2>Ringraziamenti e Note</h2>
<p><strong>Si ringraziano:</strong><br />
Sara Radicia, webmaster di <a href="http://www.firefox-blog.it/" target="_blank">Firefox Blog</a> e traduttrice per la traduzione del testo.<br />
<a href="http://www.seobythesea.com/" target="_blank">SeobytheSea</a> per la stesura originale dell’articolo in lingua inglese e per la collaborazione data.
<div class="tweetmeme_button" style="float: left; margin-right: 10px;">
			<a href="http://api.tweetmeme.com/share?url=http%3A%2F%2Fwww.seopoint.org%2Fcome-yahoo-potrebbe-automatizzare-la-seo.html"><br />
				<img src="http://api.tweetmeme.com/imagebutton.gif?url=http%3A%2F%2Fwww.seopoint.org%2Fcome-yahoo-potrebbe-automatizzare-la-seo.html&amp;source=pdellov&amp;style=compact&amp;service=bit.ly" height="61" width="50" /><br />
			</a>
		</div>
<h4  class="related_post_title">Articoli Correlati</h4><ul class="related_post"><li><a href="http://www.seopoint.org/cosa-ho-imparato-dai-video-di-matt-cutts.html" title="Cosa ho Imparato dai Video di Matt Cutts">Cosa ho Imparato dai Video di Matt Cutts</a><br /><small>Matt Cutts, il più visibile ingegnere del team anti-spam di Google, porta avanti dall'inizio del 2009 una serie di video in auto dei webmaster, pubblicati su yo...</small></li><li><a href="http://www.seopoint.org/validazione-w3c-seo.html" title="Validazione W3C &#038; SEO">Validazione W3C &#038; SEO</a><br /><small>Capita spesso di sentirsi chiedere se la validazione W3C è veramente importante per la SEO: un sito che passerà il test W3C senza errori sarà avvantaggiato nel ...</small></li><li><a href="http://www.seopoint.org/spam-spam-spam.html" title="Spam, spam, spam">Spam, spam, spam</a><br /><small>

Di solito quando vado a scrivere un articolo lo programmo, ci studio sopra, oppure riporto qualcosa preso oltreoceano, tradotto e rielaborato: questa volta ...</small></li><li><a href="http://www.seopoint.org/bad-links-dichiarazioni-da-google.html" title="Bad Links: Dichiarazioni da Google">Bad Links: Dichiarazioni da Google</a><br /><small>

I link in entrata sono il più delle volte degli elementi positivi per il posizionamento nei motori di ricerca. Di norma i links dovrebbero però essere stret...</small></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.seopoint.org/come-yahoo-potrebbe-automatizzare-la-seo.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Un passo al di là delle Sitemap XML: Crawler assistiti dall&#8217;utente?</title>
		<link>http://www.seopoint.org/un-passo-al-di-la-delle-sitemap-xml-crawler-assistiti-dallutente.html</link>
		<comments>http://www.seopoint.org/un-passo-al-di-la-delle-sitemap-xml-crawler-assistiti-dallutente.html#comments</comments>
		<pubDate>Thu, 12 Feb 2009 08:56:29 +0000</pubDate>
		<dc:creator>Paolo Dello Vicario</dc:creator>
				<category><![CDATA[Yahoo]]></category>
		<category><![CDATA[Sitemap XML]]></category>
		<category><![CDATA[Spider]]></category>

		<guid isPermaLink="false">http://www.seopoint.org/?p=384</guid>
		<description><![CDATA[Immaginate un motore di ricerca che possa permettere alle 	persone di insegnare ad un programma di web crawling come navigare all&#8217;interno delle pagine di un sito pieno di link java script e altre pagine di solito accessibili solo attraverso selezioni&#8230;]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft size-full wp-image-385" style="margin-right: 10px;" title="Sitemap" src="http://www.seopoint.org/wp-content/uploads/sitemap-thumb1.jpg" alt="Sitemap" width="112" height="112" />Immaginate un motore di ricerca che possa permettere alle 	persone di insegnare ad un programma di web crawling come navigare all&#8217;interno delle pagine di un sito pieno di link java script e altre pagine di solito accessibili solo attraverso selezioni o input di testo in form.</p>
<p>Perché un motore di ricerca dovrebbe spingere un utente ad assistere un programma di crawling ad esplorare il contenuto di pagine normalmente nascoste alla maggior parte di programmi di crawling?</p>
<h3>Utenti che insegnano ai web Crawlers.</h3>
<p>Qui abbiamo tre esempi di persone che potrebbero aiutare un crawler a scansionare un sito:</p>
<p><em><strong>Webmaster</strong></em> – I motori di ricerca possono avere difficoltà a scansionare le pagine a causa dei link java script, dei link inclusi come opzioni nei form dei menu a tendina, e altre pagine che sono accessibili solamente attraverso form.<br />
Mentre i motori di ricerca ci forniscono degli strumenti per provare a rendere più facile ai webmaster avere le pagine dei propri siti indicizzati, come quelle che si trovano su <a href="http://www.google.com/webmasters/tools/">Google 	Webmaster Tools</a>, <a href="http://siteexplorer.search.yahoo.com/">Yahoo 	Site Explorer</a>, e <a href="http://webmaster.live.com/">Webmaster 	Center &#8211; Live Search</a>, nessuno di questi strumenti offerti si rivolge veramente al problema.</p>
<p>Per un webmaster che vuole avere modi alternativi di raggiungere le pagine dietro i java script o i form, può essere difficile fare in modo che un motore di ricerca indicizzi queste pagine. E se ci fosse un metodo per fare in modo che uno webmaster possa allenare un crawler ad accedere a pagine che si trovano dietro i forms e i java script incluso negli strumenti per webmaster forniti dal motore di ricerca?<br />
Un webmaster potrebbe aiutare ad insegnare al programma di web crawling qual&#8217;è il modo più efficace di scansionare il suo sito web, a navigare nelle pagine del sito in un certo ordine, a riempire i form nel sito, e a interagire con le pagine del sito nel modo in cui vuole lo webmaster.</p>
<p>Queste interazioni possono essere catturate per creare regole di 	scansione del sito mediante le operazioni di apprendimento. Le regole poi potrebbero essere usate successivamente da un web crawler per scansionare il sito.</p>
<p><em><strong>Recensori manuali</strong></em> – Qualcuno che 	recensisce manualmente il contenuto della struttura delle pagine web per vedere se i motori di ricerca possono effettivamente migliorare il modo in cui quelle pagine vengono indicizzate dal motore di ricerca potrebbe creare delle regole per il programma di  crawling per far seguire i link in una maniera logica o per riempire il form di ricerca per trovare meglio le pagine più 	rilevanti nei siti.</p>
<p><em><strong>Sottoscrittori di contenuto</strong></em> – Programmi 	come i feed RSS e gli strumenti mashup possono portare il contenuto di un sito a qualcuno interessato a vederlo, senza che quella 	persona debba visitare pagine multiple.<br />
Se le persone interessate a quel contenuto potessero allenare il 	programma a scansionare attraverso i form che si trovano in luoghi 	come i siti per trovare lavoro o delle agenzia di viaggi, o altri 	siti che hanno il proprio contenuto al di là di form, potrebbe aiutarli ad intercettare il contenuto del sito e a 	consegnarlo direttamente a loro.</p>
<h3>Problemi con il Crawling focalizzato</h3>
<p>Qui abbiamo due tipi comuni di web crawling.</p>
<p><em><strong>Free crawling</strong></em> – quando un programma di scansione trova una pagina, immagazzina la pagina e l&#8217;indirizzo o l&#8217; URL, esegue tutti link che si possono trovare in quella pagina per localizzare altre pagine web.</p>
<p><em><strong>Crawling</strong></em> <strong><em>Focalizzato</em></strong>- un programma di scansione prova a scansionare solo le pagine che contengono un 	tipo specifico di contenuto, o le pagine “rilevanti”.<br />
Ci sono diversi differenti approcci per il crawling focalizzato, ma un programma di scansione può finire per scansionare pagine irrilevanti o mancare pagine rilevanti per differenti ragioni:</p>
<p><em><strong>Diversità di Design and Struttura</strong></em> – C&#8217;è molta diversificazione e variazione tra il design e la struttura delle pagine web, e se il crawler segue una singola regola logica o poche regole logiche quando passa tra le pagine, potrebbe non essere accurato nel determinare la rilevanza delle 	pagine quando si trova ad affrontare un largo spettro di pagine 	diverse.</p>
<p><em><strong>Pagine irrilevanti in una catena di link-</strong></em> Ipotizziamo che molti crawlers focalizzati seguano quelle pagine 	che contengono uno specifico tipo di contenuto che si linkano 	spesso l&#8217;un l&#8217;altra. Questo può essere fuorviante – se 	un crawler non segue un link ad una pagina che sembra non contenere 	uno specifico tipo di contenuto che si sta ricercando, e ci sono 	pagine che sono rilevanti oltre a quella catena di link che 	includono quella pagina, allora il contributo rilevante può 	essere tralasciato.</p>
<p><em><strong>Pagine accessibili solamente attraverso Form</strong></em> – A volte è necessario riempire dei form, come ad esempio dei form di ricerca per l&#8217;assunzione di lavoro, per accedere al 	contenuto web rilevante, come le assunzioni di lavoro e le descrizioni. I moduli differiscono molto da un sito all&#8217;altro, e anche all&#8217;interno dello stesso sito, così che il contenuto rilevante può essere facilmente tralasciato se un crawler non capisce come riempire i diversi tipi di modulo.</p>
<p><em><strong>Mancanza di accesso a contenuto limitato </strong></em> &#8211; Un proprietario di un sito potrebbe non volere che alcune pagine siano indicizzate, le quali però sono rilevanti per la 	focalizzazione della scansione.</p>
<h3>Le cose che un web Crawler può imparare dall&#8217;osservare qualcuno che naviga attraverso un sito:</h3>
<p>Qui ci sono alcune delle cose che un web crawler può imparare da un utente:</p>
<ul>
<li> Quali sono le pagine che hanno più probabilità di essere rilevanti</li>
<li> Quali pagine hanno meno probabilità di essere rilevanti</li>
<li> Come riempire al meglio i moduli per accedere al contenuto dinamico</li>
<li> Come fare e perché cliccare in particolari parti di una pagina che sono state navigate come ad esempio gli URL o i bottoni o le schede</li>
<li>Come selezionare i valori da un menu a tendina</li>
</ul>
<p>Una domanda di brevetto di Yahoo esplora in profondità i modi in cui una persona può aiutare le scansioni di una pagina web :</p>
<p style="text-align: center;"><img class="aligncenter" style="border: 1px solid black;" title="Yahoo" src="http://www.seopoint.org/wp-content/uploads/yahoo.jpg" alt="Yahoo" width="324" height="72" /></p>
<p><a href="http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&amp;Sect2=HITOFF&amp;u=%2Fnetahtml%2FPTO%2Fsearch-adv.html&amp;r=1&amp;p=1&amp;f=G&amp;l=50&amp;d=PG01&amp;S1=20090019354.PGNR.&amp;OS=dn/20090019354&amp;RS=DN/20090019354">Cattura 	automatica del contenuto web con l&#8217;assistenza dell&#8217;utente </a><br />
Inventato da Amit Jaiswal, Arup Malakar e Binu Raj<br />
Assegnato a Yahoo<br />
Domanda di brevetto USA 20090019354<br />
Pubblicato il 15 gennaio 2009<br />
Archiviato l&#8217;11 settembre 2007</p>
<p>Estratto</p>
<blockquote><p>Viene divulgato un metodo per l&#8217;esecuzione delle attività su un sito. Le attività di navigazione di un utente su un sito web vengono catturate. Le attività di browsing comprendono l&#8217;apposizione di etichette alle pagine web e il riempimento dei moduli. Le attività catturate vengono analizzate per la formulazione di modelli.</p>
<p>Le regole per l&#8217;esecuzione di attività su un sito web sono basate sulla generazione di modelli. Vengono eseguiti ulteriori attività su un sito secondo le regole ed il 	contenuto del sito viene attratto. Il contenuto catturato viene usato in tali servizi e applicazioni web, inclusi i crawlers.</p></blockquote>
<p>Le regole che un programma di scansione web può imparare guardando qualcuno usare un particolare sito possono essere espanse dal programma per svolgere altre attività in quelle pagine 	che l&#8217;utente può non avere eseguito.</p>
<p><strong>Esempio:</strong><br />
Un sito web con molti link è diviso in tre categorie, elenchi di posti di lavoro, sezioni non correlate al lavoro, e link alla homepage del sito.<br />
Qualcuno può aver visitato alcune delle pagine con gli elenchi dei lavori, ma non tutte.<br />
Il programma di scansione può imparare delle regole dalle visite delle pagine delle liste dei lavori, per capire come visitare tutte le pagine delle inserzioni di lavoro.</p>
<h3>Conclusioni</h3>
<p>Il brevetto <em>Cattura Automatica</em> ci fornisce molti dettagli su come l&#8217;interazione tra sito e utente può essere usata per aiutare il programma di crawling dei motori di ricerca ad indirizzare i tre tipi di attività che ho menzionato all&#8217;inizio di questo post:</p>
<ul>
<li>Un webmaster che allena un crawler a trovare pagine che dovrebbero essere indicizzate sui 	suoi siti,</li>
<li> Un revisore manuale che impara ad un crawler come trovare le pagine, e;</li>
<li>Un sottoscrittore normale che mostra al programma i tipi di informazioni che dovrebbero sottoscrivere e a cui dovrebbero essere spediti gli aggiornamenti.</li>
</ul>
<p>Ci sono anche un paio di vecchie domande di brevetto Yahoo che potrebbero essere utilizzate con i metodi di questo presente a cui vale la pena dare un&#8217;occhiata per saperne di più su come Yahoo potrebbe provare ad indicizzare il contenuto del web e che si riferiscono ad alcuni di problemi che il crawling focalizzato spesso si trova ad affrontare:</p>
<ul>
<li> <a href="http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&amp;Sect2=HITOFF&amp;u=%2Fnetahtml%2FPTO%2Fsearch-adv.html&amp;r=1&amp;p=1&amp;f=G&amp;l=50&amp;d=PG01&amp;S1=20080235567.PGNR.&amp;OS=dn/20080235567&amp;RS=DN/20080235567">Compilazione 	intelligente dei moduli</a></li>
<li><a href="http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&amp;Sect2=HITOFF&amp;u=%2Fnetahtml%2FPTO%2Fsearch-adv.html&amp;r=1&amp;p=1&amp;f=G&amp;l=50&amp;d=PG01&amp;S1=20080120257.PGNR.&amp;OS=dn/20080120257&amp;RS=DN/20080120257">Modulo Online di riempimento automatico che utilizza l&#8217;interferenza semantica</a></li>
</ul>
<p>Ho visto una quantità di persone dire in posti diversi del web che un motore di ricerca potrebbe imparare ad indicizzare dalle nuove pagine usando toolbars e altri strumenti per trovare nuove pagine che non ha ancora indicizzato.</p>
<p>La domanda di brevetto Yahoo che si occupa delle attività 	dell&#8217;utente per trovare nuovo contenuto da indicizzare nel web ipotizza l&#8217;uso di una toolbar per trovare pagine che si trovano ad un livello ulteriore, mostrando come un motore di ricerca possa imparare ai programmi di crawling come indicizzare più pagine e come creare delle regole site-specific sull&#8217;indicizzazione delle pagine prestando attenzione a come le persone navigano il web, interagiscono con le pagine, e riempiono i moduli.<br />
Permettere agli webmaster e alle persone che vogliono sottoscrivere del contenuto di insegnare esplicitamente ai 	programmi di crawling come si navigano le pagine potrebbe alleviare il lavoro dei motori di ricerca e spostarlo sulle persone che potrebbero utilizzare i servizi che quei motori di ricerca 	potrebbero fornire.</p>
<p>Questo è sicuramente un passo al di là delle <a href="http://www.sitemaps.org/">Sitemap XML</a>.</p>
<h3>Ringraziamenti</h3>
<p>Si ringraziano:</p>
<p>Sara Radicia, webmaster di <a href="http://www.firefox-blog.it/" target="_blank">Firefox Blog</a> e traduttrice per la traduzione del testo.<br />
<a href="http://www.seobythesea.com/" target="_blank">SeobytheSea</a> per la stesura originale dell’articolo in lingua inglese e per la collaborazione data.
<div class="tweetmeme_button" style="float: left; margin-right: 10px;">
			<a href="http://api.tweetmeme.com/share?url=http%3A%2F%2Fwww.seopoint.org%2Fun-passo-al-di-la-delle-sitemap-xml-crawler-assistiti-dallutente.html"><br />
				<img src="http://api.tweetmeme.com/imagebutton.gif?url=http%3A%2F%2Fwww.seopoint.org%2Fun-passo-al-di-la-delle-sitemap-xml-crawler-assistiti-dallutente.html&amp;source=pdellov&amp;style=compact&amp;service=bit.ly" height="61" width="50" /><br />
			</a>
		</div>
<h4  class="related_post_title">Articoli Correlati</h4><ul class="related_post"><li><a href="http://www.seopoint.org/sitemap-xml-aiuta-indicizzazione.html" title="L&#8217;uso della Sitemap XML aiuta a velocizzare l&#8217;indicizzazione di contenuti">L&#8217;uso della Sitemap XML aiuta a velocizzare l&#8217;indicizzazione di contenuti</a><br /><small>I motori di ricerca usano dei programmi per scansionare il web, e identificare nuove pagine e pagine aggiornate da inserire nei propri indici. Si parla di Spide...</small></li><li><a href="http://www.seopoint.org/google-xml-sitemap-plugin-per-wordpress.html" title="Google XML Sitemap: Plugin per Wordpress">Google XML Sitemap: Plugin per Wordpress</a><br /><small>Wordpress è uno dei CMS più utilizzati in assoluto nel web, sia per la gestione di semplici blog che per la creazione di siti web professionali, album di foto o...</small></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.seopoint.org/un-passo-al-di-la-delle-sitemap-xml-crawler-assistiti-dallutente.html/feed</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>Scambi Links: cosa ne pensano i Motori di Ricerca?</title>
		<link>http://www.seopoint.org/scambi-links-cosa-ne-pensano-motori.html</link>
		<comments>http://www.seopoint.org/scambi-links-cosa-ne-pensano-motori.html#comments</comments>
		<pubDate>Mon, 19 Jan 2009 20:40:20 +0000</pubDate>
		<dc:creator>Paolo Dello Vicario</dc:creator>
				<category><![CDATA[Yahoo]]></category>
		<category><![CDATA[Brevetti]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Penalizzazioni]]></category>
		<category><![CDATA[Scambi di Links]]></category>

		<guid isPermaLink="false">http://www.seopoint.org/?p=322</guid>
		<description><![CDATA[Quando i siti web si linkano l&#8217;uno l&#8217;altro, direttamente o indirettamente attraverso una serie di pagine differenti, un motore di ricerca può considerare quei link link reciproci. Se avete familiarità con alcune delle storie mitologiche e folkloristiche che circondano l&#8217;ottimizzazione&#8230;]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft size-full wp-image-328" style="border: 1px solid black; margin-right: 10px;" title="Scambio Links" src="http://www.seopoint.org/wp-content/uploads/scambiolinksthumb.jpg" alt="Scambio Links" width="112" height="112" />Quando i siti web si linkano l&#8217;uno l&#8217;altro, direttamente o indirettamente attraverso una serie di pagine differenti, un motore di ricerca può considerare quei link link reciproci. Se avete familiarità con alcune delle storie mitologiche e folkloristiche che circondano l&#8217;ottimizzazione dei motori di ricerca, potreste aver letto o sentito dire che i link reciproci sono un male, e che non piacciono ai motori di ricerca.</p>
<p>La verità è più complessa di così.</p>
<p>Cosa dire dei blog che si linkano l&#8217;un l&#8217;altro su ogni pagina dei loro blogroll? O di link tra siti dello stesso proprietario che possono essere considerati ragionevoli, come ad esempio il link di un negozio su un dominio ad un blog in un dominio differente o un altro sotto dominio associato al sito, o di link all&#8217;interno di un gruppo di siti della stessa compagnia o organizzazione che si concentrano su differenti argomenti?<br />
Cosa dire di siti che coprono argomenti simili o beni e servizi complementari e che trovano sia utile linkarsi l&#8217;un l&#8217;altro per favorire i loro visitatori?</p>
<p>Cosa pensano i motori di ricerca delle pagine risorse, dove i siti includono pagine di link e descrizioni di altri siti che essi ritengono possano essere utili per i i loro visitatori? Cosa succede se alcuni di questi siti li linkano a loro volta? Fa differenza se tali pagine di risorse includono una dichiarazione in cui affermano che metteranno il vostro sito sulle loro pagine in cambio di uno scambio di link?</p>
<h3>Avvertenze dei motori di ricerca sul link tra pagine</h3>
<p style="text-align: left;"><img class="size-full wp-image-325 aligncenter" title="PageRank" src="http://www.seopoint.org/wp-content/uploads/pagerank1.png" alt="PageRank" width="400" height="180" /><br />
I principali motori di ricerca commerciali forniscono alcune informazioni circa i loro orientamenti sui link:</p>
<p>Le pagine di Google sugli <a href="http://www.google.com/support/webmasters/bin/answer.py?answer=66356">schemi di link</a> mettono in guardia i proprietari di siti che alcuni tipi di linkaggio potrebbero influire negativamente sul rating dei loro siti, tra cui:</p>
<blockquote>
<ul>
<li>link destinati a manipolare il Pagerank</li>
<li>link verso spammer o cattivi vicini di web</li>
<li>link reciproci eccessivi o eccessivo scambio di link (&#8220;linkate me e io linko voi&#8221;)</li>
<li>l&#8217;acquisto o la vendita di link che trasferiscono Pagerank</li>
</ul>
</blockquote>
<p>Yahoo nelle sue<a href="http://help.yahoo.com/l/us/yahoo/search/basics/basics-18.html"> linee guida sulla qualità dei contenuti di ricerca</a>, fornisce esempi di contenuti che non desidera includere nei propri motori di ricerca, come ad esempio:</p>
<blockquote>
<ul>
<li>siti eccessivamente cross-linked con altri siti per gonfiare apparentemente la popolarità di un sito (schemi di link)</li>
</ul>
</blockquote>
<p>La Guida di Windows Live, nelle sue pagine sugli <a href="http://help.live.com/Help.aspx?market=en-US&amp;project=WL_Webmasters&amp;querytype=topic&amp;query=WL_WEBMASTERS_REF_GuidelinesforSuccessfulIndexing.htm">orientamenti per una indicizzazione di successo</a>, include nelle sue liste delle &#8220;tecniche che potrebbero impedire al vostro sito di venire visualizzato nei risultati Live Search&#8221; la seguente:</p>
<blockquote>
<ul>
<li>utilizzare tecniche, come il link farm, per aumentare artificialmente il numero di link al vostro sito.</li>
</ul>
</blockquote>
<p>Come possono essere utili queste linee guida alla maggior parte degli utenti, o ad uno webmaster o blogger?</p>
<p>È probabile che una certa percentuale delle persone che usa Google, o che hanno i propri siti indicizzati dal motore di ricerca abbiano familiarità con il <a href="http://www.seopoint.org/aggiornamento-del-pagerank-del-31-dicembre-2008.html">PageRank</a>, ma potrebbero non sapere cosa si intende nelle linee guida per &#8220;schemi di link&#8221; e &#8220;link farm&#8221;.</p>
<p>Perché i motori di ricerca sono così preoccupati dei link tra le pagine?</p>
<h3>Classificazioni secondo segnali di rank di ricerca</h3>
<p>Quando eseguite una ricerca su un motore di ricerca, le pagine che avete in risposta alla vostra query vengono visualizzate in ordine di graduatoria e i motori di ricerca si basano su un gran numero di segnali per cercare di fornire le pagine che potrebbero avere una migliore corrispondenza con quello che intendete trovare sul web.</p>
<p>Questo tipo di classificazione è una sfida per i motori di ricerca perché spesso ci possono essere molte migliaia di milioni di pagine che possono contenere le parole che avete usato per eseguire la ricerca. Essi vogliono provare a fornire le migliori pagine possibili in cima ai risultati, o almeno pagine migliori di quelli che mostrano gli altri motori di ricerca.</p>
<p>Questi diversi segnali che un motore di ricerca può usare per determinare l&#8217;ordine delle pagine nei risultati di ricerca può essere classificato in modi diversi.</p>
<p><em><strong>Segnali Rank Content Based, Link Based e User Behavior Based</strong></em><br />
La serie delle classificazioni si basa su questi segnali in tre differenti modi: su base dei contenuti, su base dei link e sulla base del comportamento degli utenti.</p>
<p>I segnali basati sul contenuto esaminano il contenuto che appare sulle pagine di un sito. I segnali basati sui link guardano alle connessioni tra il vostro sito e agli altri siti sul web. I segnali sull&#8217;utente guardano ai dati che indicano come la gente reagisce alle pagine del vostro sito, sia che si tratti di visualizzare il sito direttamente, sia che si tratto di vederlo nei risultati di ricerca di un motore di ricerca.</p>
<p><em><strong>Segnali di Ranking dipendenti ed indipendenti dalle Query</strong></em></p>
<p>Un altro modo in cui motori di ricerca possono classificare i segnali da utilizzare per il rank delle pagine può dipendere dal fatto se questi segnali siano correlati ad una ricerca che potreste utilizzare per cercare. Questo modo di classificare i segnali individua due diversi raggruppamenti &#8211; quanto si possa considerare importante una pagina, e quanto una pagina possa essere corrispondente per uno specifico termine di ricerca o frase.</p>
<p>I segnali che guardano all&#8217;importanza, o alla &#8220;qualità&#8221; di una pagina potrebbero considerare la qualità del contenuto della pagina, o l&#8217;importanza percepita dei link a quella pagina, o come le persone usano quella pagina, ad esempio se la mettono nei segnalibri, se trascorrono del tempo su di essa, se ne prendono nota in qualche modo, o se la usano in qualche modo che non è collegato ad una query specifica. Questi tipi di segnali per il ranking di una pagina sono spesso riferiti dai motori di ricerca come indipendenti dalla query, perché non si basano sulla ricerca che avrebbe potuto essere usata per trovare quella pagina.</p>
<p>I segnali che guardano all&#8217;importanza della pagina possono considerare quanto rilevante quella pagina possa essere per una specifica query per parola o frase, o quali parole possono apparire nei link che puntano alla frase e nelle parole che circondano il link e che sono associate con esse, e il modo in cui le persone possono usare la pagina in un modo che sia associato con una specifica query per parola o frase come ad esempio cliccare sul link della pagina quando appare nei risultati di ricerca per una specifica query per un determinato termine o frase, o se trascorrono una certa quantità di tempo su quella pagina dopo che una ricerca le ha portate ad essa. Questo tipo di segnali per il ranking di una pagina sono spesso riferiti dai motori di ricerca come dipendenti dalle query perché si basano su una query specifica usata per trovare la pagina.</p>
<p><em><strong>Segnali di miscelazione e riordinamento del rank delle Pagine</strong></em><br />
Un motore di ricerca può usare la miscelazione di un buon numero di segnali per determinare in quale ordine mostrare le pagine agli utenti che effettuano ricerche. Potrebbe anche prendere quei risultati ordinati e riordinarli prima di presentarli agli utenti della ricerca e basarsi su altri fattori che riguardano tali pagine, come ad esempio il paese che è stato indicato dall&#8217;utente che ha eseguito la ricerca, quale linguaggio preferire per la visualizzazione dei risultati, e molti altri.</p>
<p>Ho scritto sul come e perché un motore di ricerca può riordinare i risultati di ricerca un certo numero di volte, incluso nei seguenti due post:</p>
<ul>
<li><a href="http://www.seobythesea.com/?p=334">20 Ways Search Engines May Rerank Search Results</a></li>
<li><a href="http://www.seobythesea.com/?p=826">20 More Ways that Search Engines May Rerank Search Results</a></li>
</ul>
<h3>Collegamenti tra le pagine come segnale di ranking</h3>
<p>Mentre ci sono molti tipi differenti di segnali che un motore di ricerca può usare per classificare le pagine web in risposta ad una ricerca, una delle più importanti differenze tra le pagine web e le pagine che potreste trovare in una collezione di documenti o all&#8217;interno di un&#8217;intranet è che le pagine web possono linkarsi l&#8217;un l&#8217;altra con degli hyperlinks. Questi link possono aiutare i motori di ricerca ad identificare quali pagine possono essere le più importanti.</p>
<p>Quando qualcuno scrive in un giornale accademico che può essere esaminato da altri accademici, questi spesso includono una lista di citazioni ad altri giornali accademici come fonti o referenze sulle quali si basano le loro carte. Si potrebbe supporre che un giornale accademico che sia riferito frequentemente da altri giornali accademici sia importante. Si potrebbe anche assumere che giornali che si riferiscono essere importanti siano importanti lo stesso anche se non sono menzionati da molte altre pubblicazioni accademiche.</p>
<p>Quest&#8217;ipotesi sulle citazioni nei giornali accademici è una delle influenze che stanno dietro al PageRank, il quale si avvantaggia degli hyperlink tra pagine sul web per determinare quali pagine siano le più importanti.</p>
<blockquote><p>Il sistema delle citazioni nella letteratura accademica è stato applicato al web, in gran parte nel conteggio delle citazioni o dei backlink ad una pagina data. Questo dà approssimativamente l&#8217;idea dell&#8217;importanza di una pagina o della sua qualità. Il PageRank estende questa idea non ritenendo uguali tutti link da tutte le pagine, e normalizzando il numero di link ad una pagina.</p>
<p style="text-align: right;">- <a href="http://infolab.stanford.edu/~backrub/google.html">Anatomia di un grande motore di ricerca ipertestuale</a>-</p>
</blockquote>
<p>Mentre i link tra pagine sul web possono essere utili, i motori di ricerca si preoccupano e sono allo stesso tempo sospettosi dei link tra le pagine.</p>
<p>Ci sono siti che hanno lavorato per avvantaggiarsi dei collegamenti tra pagine per far apparire le loro pagine più importanti di quello che veramente sono. Il loro focus primario non è stato condividere link per fornire valore alle persone che visitavano i loro siti, o connettersi trasparentemente ad altri siti che potessero essere sotto la loro proprietà o il loro controllo, o linkare pagine il cui valore si basava sul contenuto delle stesse. Invece, si collegavano solamente per manipolare i segnali di ranking per provare a spostare i propri siti più in alto nei risultati di ricerca.</p>
<h3>Domanda di brevetto Yahoo sui link reciproci eccessivi</h3>
<p style="text-align: left;"><img class="size-full wp-image-326 aligncenter" title="Yahoo" src="http://www.seopoint.org/wp-content/uploads/yahoo.jpg" alt="Yahoo" width="324" height="72" /></p>
<p style="text-align: left;">Una nuova domanda di brevetto pubblicata da Yahoo discute come si potrebbero considerare i collegamenti tra pagine con link reciproci, e tenta di determinare se questi link siano stati creati per manipolare i risultati di ricerca. Il deposito di brevetto è il seguente:</p>
<p><a href="http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&amp;Sect2=HITOFF&amp;u=%2Fnetahtml%2FPTO%2Fsearch-adv.html&amp;r=1&amp;p=1&amp;f=G&amp;l=50&amp;d=PG01&amp;S1=20090013033.PGNR.&amp;OS=dn/20090013033&amp;RS=DN/20090013033">Identificare i link reciproci eccessivi tra enti web</a></p>
<p>Inventato da Timothy M. Converse, Priyank Shankar Garg, e Konstantinos Tsioutsiouliklis</p>
<p>Assegnato a Yahoo</p>
<p>Domanda di brevetto USA 20090013033</p>
<p>Pubblicato 8 Gennaio 2009</p>
<p>Archiviato 6 luglio 2007</p>
<p><strong>Estratto</strong></p>
<blockquote><p>Viene fornito un metodo per identificare i link reciproci. In un particolare host, la serie di host che linkano quel particolare host e la serie di host a cui quel particolare host è linkato sono determinati. L&#8217;intersezione tra l&#8217;unione dei due insiemi di host è determinata allo stesso modo, e le dimensioni dell&#8217;intersezione dell&#8217;unione sono calcolate.</p>
<p>La concentrazione di link reciproci in un particolare host viene calcolata basandosi sulla dimensione dell&#8217;intersezione e dell&#8217;unione. Una ratio della dimensione dell&#8217;intersezione con la dimensione dell&#8217;unione viene usata per determinare la concentrazione di link reciproci. Il particolare rank dell&#8217;host in una lista di risultati di ricerca classificati può venire cambiato per risultato dell&#8217;identificazione di un&#8217;alta concentrazione di link reciproci.</p></blockquote>
<h3>Brevetto correlato Yahoo sui link coinvolti</h3>
<p>Questo deposito di brevetto su link reciproci eccessivi osserva che esso è connesso ad un altro paio di domande brevetto Yahoo.</p>
<p>Uno di questi è <a href="http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&amp;Sect2=HITOFF&amp;u=%2Fnetahtml%2FPTO%2Fsearch-adv.html&amp;r=1&amp;p=1&amp;f=G&amp;l=50&amp;d=PG01&amp;S1=20070198603.PGNR.&amp;OS=dn/20070198603&amp;RS=DN/20070198603">Using Exceptional Changes in Webgraph Snapshots Over Time For Internet Entity Marking.</a></p>
<p>Un metodo che i motori di ricerca possono usare per controllare chi sta linkando chi può essere la creazione di qualcosa conosciuto come grafico dei link o grafico web. Un grafico dei link è una rappresentazione visuale del web che vede la rete come un nodo, e i link tra le pagine come spigoli, o nodi tra quelle linee. La domanda di brevetto per “I Cambiamenti Eccezionali delle Istantanee Webgraph” guarda ai cambiamenti del grafico di link attraverso il tempo per provare ad identificare delle attività sospette. L&#8217;estratto della domanda di brevetto ci dice:</p>
<blockquote><p>Vengono fornite delle tecniche attraverso le quali le pagine web &#8220;sospette&#8221; possono essere identificate automaticamente. Una pagina web &#8220;sospetta&#8221; possiede delle caratteristiche che indicano qualche manipolazione allo scopo di gonfiare artificialmente la posizione della pagina web all&#8217;interno dei risultati di ricerca.</p>
<p>Le pagine web possono essere rappresentate come nodi all&#8217;interno di un grafico. I collegamenti tra le pagine web possono essere rappresentati come spigoli diretti tra i nodi. Delle &#8220;istantanee&#8221; dello stato corrente di un network di pagine interrelate possono essere generate automaticamente in differenti momenti. Nel tempo che intercorre tra le istantanee, lo stato del network può cambiare.</p>
<p>Comparando un&#8217;istantanea precedente ad una successiva, possono essere identificati questi cambiamenti. I cambiamenti estremi, che sono considerati variare significativamente rispetto alla normale gamma di cambiamenti previsti, possono essere rilevati automaticamente. Le pagine web relative a questi cambiamenti estremi possono essere etichettate come pagine web sospette che meritano un&#8217;ulteriore identificazione o azione.</p></blockquote>
<p>L&#8217;altro brevetto depositato presta attenzione ai link da siti che sono già stati identificati come &#8220;sospetti&#8221;, “<a href="http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&amp;Sect2=HITOFF&amp;d=PG01&amp;p=1&amp;u=%2Fnetahtml%2FPTO%2Fsrchnum.html&amp;r=1&amp;f=G&amp;l=50&amp;s1=%2220060095416%22.PGNR.&amp;OS=DN/20060095416&amp;RS=DN/20060095416">Individuazione dello spam link-based</a>”. Un frammento di questo:</p>
<blockquote><p>In questa sezione, sono descritti i concetti di spam farm, di classificazione della pagina inlink (comunemente denominata come &#8220;PageRank&#8221;), e di trust-ranking.</p>
<p>Una spam farm è un insieme di pagine create artificialmente che punta a una pagina di destinazione spam per promuovere la sua posizione. La scala &#8220;TrustRank&#8221; è una forma di PageRank con una speciale trasferibilità ad un sottoinsieme di pagine di alta qualità.</p>
<p>Usando le tecniche descritte in questo documento, un motore di ricerca può automaticamente trovare le pagine sospette (le pagine web spam) e più specificatamente, trovare quelle pagine web spam create per gonfiare la propria rilevanza senza la creazione di spam farms artificiali (raccolte di pagine di differenziamento). Nello specifico, vengono portati avanti un processo di PageRank con movimento uniforme e un processo di Trust ranking, e i risultati vengono comparati come parte di un test riguardo alla &#8220;spam-evolezza&#8221; di una pagina o di un insieme di pagine.</p></blockquote>
<p>Mentre queste altre due domande di brevetto si basano sui link tra le pagine, non considerano quanto le pagine o i domini possano linkarsi eccessivamente tra di loro direttamente, o indirettamente tramite un numero di pagine o di domini come considera invece questa nuova domanda di brevetto recentemente pubblicata.</p>
<p>E&#8217; del tutto possibile che i processi descritti in tutti i tre questi brevetti depositati, come pure in una serie di altri, possano essere utilizzati insieme per cercare di mantenere l&#8217;uso dei link come segnale di ranking al di fuori della categoria degli abusi.</p>
<h3>Il link reciproci e le &#8220;entità sospette&#8221;</h3>
<p style="text-align: center;"><img class="size-full wp-image-327 aligncenter" title="Penalizzazioni" src="http://www.seopoint.org/wp-content/uploads/penalizzazioni.jpg" alt="Penalizzazioni" width="398" height="130" /></p>
<p>Come mensionato sopra, potreste aver letto o sentito dire che i link reciproci non sono una buona cosa, e che la verità della questione è complicata di così.</p>
<p>Il brevetto depositato Yahoo ci dà la definizione di un legame di reciprocità:</p>
<blockquote><p>Una pagina web è contenente &#8220;link reciproci&#8221;, quando uno dei suoi &#8220;outlink&#8221; è anche uno dei suoi &#8220;inlink&#8221;. Ovvero, un link reciproco esiste quando una pagina web linka un&#8217;altra pagina web, che effettua un linkback a quella pagina.</p></blockquote>
<p>Quindi un link reciproco esiste quando due siti si linkano l&#8217;un l&#8217;altro.</p>
<p>Il brevetto ci dice anche che considera i link circolari come link reciproci. Ad esempio, una pagina del sito A punta al sito B, una pagina del sito di punta al sito C, e una pagina del sito C punta al sito A.</p>
<p>Se i link tra le pagine (o i domini o gli host) sono una piccola percentuale dei link su ogni pagina, o dominio, o host, il processo descritto in questo brevetto potrebbe non avere partire. Dico &#8220;partire&#8221; perché il tutto è un processo automatico, piuttosto che un processo di revisione manuale, a questo punto.</p>
<p>Se la percentuale di link è più grande di così, un numero di eventuali provvedimenti possono essere presi dal motore di ricerca.</p>
<p>Il sito può essere rivisto manualmente da &#8220;investigatori manuali&#8221; o potrebbe essere esaminato da un programma del motore di ricerca che era stato allenato ad accorgersi dei segnali di attività sospetta.</p>
<p>La domanda di brevetto ci dice che le pagine o i domini o gli host possono avere un&#8217;alta percentuale di link reciproci per ragioni legittime:</p>
<blockquote><p>Ad esempio, una particolare pagina web può avere molti link reciproci con un gruppo di pagine web perché quelle pagine discutono dello stesso argomento principale in un modo complementare e gli autori delle pagine possono aver trovato un sistema per quelle pagine per fare riferimento l&#8217;un l&#8217;altra.</p>
<p>In un altro esempio, due gruppi di pagine un web si riferiscono l&#8217;un l&#8217;altra reciprocamente perché i gruppi appartengono a due siti web di compagnie che sono parte dello stesso conglomerato.</p></blockquote>
<p>Una revisione di queste pagine potrebbe condurre alla determinazione che esse sono &#8220;sospette&#8221;, il che potrebbe portare ad un abbassamento automatico di quelle pagine, o domini, o host nei risultati di ricerca.</p>
<p>Alcune pagine potrebbero essere incluse in una &#8220;lista bianca&#8221; di pagine web , (o host o domini) come automaticamente escluse dall&#8217;essere identificate come sospette. Ci sono siti che sono conosciuti per essere &#8220;popolari&#8221; e &#8220;legittimi&#8221;. E non è sorprendente che la domanda di brevetto usi Yahoo.com come esempio <img src='http://www.seopoint.org/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> .</p>
<p>In un approccio alternativo, le pagine o i domini che sono stati identificati come &#8220;entità sospette&#8221; potrebbero non essere escluse automaticamente o abbassate nei risultati di ricerca, ma potrebbero essere ulteriormente riviste basandosi sul loro contenuto. Per esempio, la pagina potrebbe essere esplorata per vedere se contiene parole correlate alla pornografia o alla prescrizione di droghe.</p>
<h3>Conclusioni</h3>
<p>L&#8217;uso di link per i motori di ricerca come segnale per determinare come classificare una pagina nei risultati di ricerca e solo uno dei tanti segnali di posizionamento che i motori di ricerca possono utilizzare, ed è possibile che i proprietari dei siti possano aver tentato di ottenere il link alle proprie pagine al solo scopo di salire nei risultati di ricerca.</p>
<p>Le tre domande di brevetto di cui ho parlato in questo post sono solo alcuni dei modi che un motore di ricerca potrebbe utilizzare per identificare quando le persone stanno tentando di accrescere artificialmente i loro rank attraverso i link con il solo scopo di manipolare la loro posizione nella classifica.</p>
<p>Ci sono possibilità che se i link sul vostro blog o sito sono trasparenti e ragionevoli (piuttosto che eccessivi), se forniscono valore ai vostri visitatori, e coprono ragionevolmente argomenti similari o argomenti complementari, puntando siti che possono linkarvi indietro, il motore di ricerca possa trovarli legittimi. Se includete delle indicazioni sulle vostre pagine web in cui dite che linkerete altri se linkeranno voi per spingervi in alto nei risultati di ricerca, potreste avere delle ragioni per preoccuparvi. Se vi impegnate in link farm, o schemi di link o programmi di link reciproci, il motore di ricerca potrebbe trovare le vostre pagine &#8220;sospette&#8221;, e potrebbe dargli un&#8217;occhiata più da vicino.</p>
<p>Se volete approfondire questo argomento, qui ci sono alcune pagine dei ricercatori di Yahoo sull&#8217;identificazione delle pagine spam guardando il link:</p>
<ul>
<li><a href="http://www.vldb.org/conf/2004/RS15P3.PDF">Combating web Spam with Trustrank</a> (pdf)</li>
<li><a href="http://ilpubs.stanford.edu:8090/773/">Link Spam Alliances</a></li>
<li><a href="http://infolab.stanford.edu/~zoltan/publications/gyongyi2006link.pdf">Link Spam Detection Based on Mass Estimation</a> (pdf)</li>
<li><a href="http://airweb.cse.lehigh.edu/2006/becchetti.pdf">Link Based Characterization and Detection of web Spam</a> (pdf)</li>
<li><a href="http://grupoweb.upf.es/workshop/slides/fws_castillo.pdf">Using rank propagation and probabilistic counting for link-based spam detection</a> Slides (pdf)</li>
<li><a href="http://airweb.cse.lehigh.edu/2006/talks/Baeza-Yates.pdf">Link Based Spam Detection</a> Slides (pdf)</li>
<li><a href="http://www.chato.cl/papers/cdgms_2006_know_your_neighbors.pdf">Know your Neighbors: web Spam Detection using the web Topology</a> (pdf) <a href="http://www.chato.cl/papers/cdgms_2006_know_your_neighbors.pdf">slides</a>(ppt)</li>
<li><a href="http://www.chato.cl/papers/becchetti_2007_link_analysis_web_spam_detection.pdf">Link Analysis for web Spam Detection</a> (pdf)</li>
<li><a href="http://www.chato.cl/papers/becchetti_2008_link_spam_techniques.pdf">Web Spam Detection: link-based and content-based techniques</a> (pdf)</li>
<li><a href="http://research.yahoo.com/files/2008-001_abernethy.pdf">Technical Report YR-2008-001 &#8211; Witch: A New Approach to web Spam Detection</a> (pdf) (video)</li>
<li><a href="http://airweb.cse.lehigh.edu/2008/submissions/abernethy_2008_witch_content_links.pdf">Web spam Identification Through Content and Hyperlinks</a> (pdf)</li>
</ul>
<p>Ho parlato sopra del fatto che i segnali di ranking nei motori di ricerca possono essere classificati come a basati sul contenuto, basati sui link e basati sul comportamento de visitatore. Un altro recente approccio di Yahoo guarda al comportamento del visitatore e ai log di query per trovare le pagine spam:</p>
<ul>
<li><a href="http://airweb.cse.lehigh.edu/2008/submissions/castillo_2008_query_log_detection_spam.pdf">Query-log mining for detecting spam</a></li>
</ul>
<p>Aggiornamento: David Harry ha scritto su questa domanda di brevetto e sui link reciproci in un post molto interessante intitolato: <a href="http://www.huomah.com/Search-Engines/Algorithm-Matters/This-just-in-reciprocal-links-are-pointless.html">This just in; the reciprocal links are pointless</a></p>
<h3>Ringraziamenti</h3>
<p>Si ringraziano:</p>
<p>Sara Radicia, webmaster di <a href="http://www.firefox-blog.it/" target="_blank">Firefox Blog</a> e traduttrice per la traduzione del testo.<br />
<a href="http://www.seobythesea.com/" target="_blank">SeobytheSea</a> per la stesura originale dell’articolo in lingua inglese e per la collaborazione data.
<div class="tweetmeme_button" style="float: left; margin-right: 10px;">
			<a href="http://api.tweetmeme.com/share?url=http%3A%2F%2Fwww.seopoint.org%2Fscambi-links-cosa-ne-pensano-motori.html"><br />
				<img src="http://api.tweetmeme.com/imagebutton.gif?url=http%3A%2F%2Fwww.seopoint.org%2Fscambi-links-cosa-ne-pensano-motori.html&amp;source=pdellov&amp;style=compact&amp;service=bit.ly" height="61" width="50" /><br />
			</a>
		</div>
<h4  class="related_post_title">Articoli Correlati</h4><ul class="related_post"><li><a href="http://www.seopoint.org/due-query-sono-meglio-di-una-per-targetizzare-la-pubblicita.html" title="Due query sono meglio di una per targetizzare la pubblicità?">Due query sono meglio di una per targetizzare la pubblicità?</a><br /><small>Quando si esegue una ricerca su Google, spesso vedete i "link sponsorizzati" in alto e a destra dei vostri risultati di ricerca. Gli inserzionisti possono fare ...</small></li><li><a href="http://www.seopoint.org/immagini-nei-risultati-nei-motori-di-ricerca.html" title="Immagini nei risultati nei Motori di Ricerca">Immagini nei risultati nei Motori di Ricerca</a><br /><small>Quando un motore di ricerca presenta i risultati di una ricerca che avete fatto, spesso vi mostra il titolo di una pagina, un breve snippet della pagina o una m...</small></li><li><a href="http://www.seopoint.org/brevetto-google-gears-applicazioni-online-ora-offline.html" title="Brevetto Google Gears: Applicazioni Online ora Offline">Brevetto Google Gears: Applicazioni Online ora Offline</a><br /><small>Una domanda di brevetto per Google Gears è stata recentemente pubblicata all'ufficio US Patent and Trademark  Office.

Google ha rilasciato Google Gears nel  ...</small></li><li><a href="http://www.seopoint.org/linguaggio-siti-web-server-ip.html" title="Google determina la nazionalità dei siti">Google determina la nazionalità dei siti</a><br /><small>Molte volte ci si chiede quanto incida sul posizionamento la località del server, il TDL del dominio e altri fattori legati al paese in cui è hostato materialme...</small></li></ul>]]></content:encoded>
			<wfw:commentRss>http://www.seopoint.org/scambi-links-cosa-ne-pensano-motori.html/feed</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
	</channel>
</rss>
