Oggi, i tre grandi motori di ricerca: Google, Yahoo Search! e Msn Search hanno annunciato di aver aderito agli standard (specificati su sitemap.org) per la costruzione delle sitemap dei siti web. E’ una grande notizia, sintomo di ‘accordo’ tra i tre grandi competitors sul mercato delle ricerche e information retrieval. E’ una buona notizia soprattutto [...]
Lo spider dei motori di ricerca si è evoluto riuscendo a leggere e percorrere i collegamenti nei file flash? Ho fatto un piccolo esperimento, e la risposta è SI. Come ben si sa, il SEO é scienza molto empirica. E’ la sua bellezza da un certo punto di vista. L’altra, a mio modo di vedere, [...]
Yahoo! Slurp, lo spider di Yahoo! si evolve e diventa più amico del file robots.txt, imparando a gestire nel modo corretto le ‘wildcards’ ovvero quei caratteri come ‘*’ e ‘$, caratteri che permettono di gestire numerosi e variabili parametri delle url delle pagine web. Il file robots.txt è un file di fondamentale importanza per [...]
14 Sep, 2006
Posted by: NR In: spider
Dalle parti di Google è appena stata comunicata una importante specifica riguardo alla versione cache di una determinata pagina. La precisazione effettuata da Vanessa Fox sul blog ufficiale di Google riguardo al comportamento dello spider di Google, Googlebot, è stata ripresa anche da matt cutts che ne parla nel suo noto blog.
Matt Cutts è tornato in maniera decisamente precisa sul tema dei problemi di indicizzazione e dei risultati che appaiono utilizzando il comando site:domain. di Google. Sul tema si son espressi in tantissimi, e se l’opinione ricorrente e più diffusa (ma anche la più strana) era quella di un problema di spazio fisico nei server di [...]
Su molti forum e blog SEO si denuncia un diffuso problema: il calo delle pagine indicizzate in Google. Scoprire le pagine indicizzate sul motore di ricerca di Google è molto semplice, basta digitare la ricerca site:dominio.it e si potranno vedere tutte le pagine indicizzate da Google. V’è da dire che tale informazione non è cosi [...]
Come Google gestisce la cache dei siti che spiderizza è un elemento che è stato ultimamente oggetto di importanti modifiche. Per chi è veramente attento al comportamento degli spider di google e quali pagine vengon rappresentati nei risultati delle ricerche, la novità sarà balzata presto agli occhi.
Ne parla in modo molto dettagliato Matt Cutts nel [...]
19 Mar, 2006
Posted by: NR In: spider
Matt Cutts dal suo blog fa una lunga dissertazione, svelando anche divertenti particolari, di come sono le diverse e tante opzioni per controllare che lo spider di Google non spiderizzi alcune pagine. E’ un bisogno necessario di moltissimi webmaster anche se non sempre attiene il posizionamento del sito sui motori di ricerca.
Le annotazioni di Cutts [...]
Che nel posizionamento su Google vi sia un vantaggio ad avere un dominio vecchio rispetto ad uno fresco fresco è indubbio, e sicuramente il famoso filtro Sandbox ne è una testimonianza, ma ora, vi è una teoria più radicale, che potrebbe anche modificare le strategie dietro alla costruzione dei backlink. Secondo Linkbuildingblog Google ama i domini più vecchi e premia quellia registrati prima del 2003.
Patrick Gavin ha svolto un test che egli stesso definisce non scientifico, ma dal quale emerge un dato significativo. Osservando 2 query competitive di tipo commerciale che guarda con frequenza ha notato che i top 10 risultati di una e dell’altra riguardano domini creati mediamente nel 1998 e 1999 e il dominio più recente tra i risultati era solo del 2003!.
Per scoprire come Google, MSN e Yahho recepiscono il nostro lavoro di posizionamento di siti sui motori di ricerca esistono diversi siti e strumenti, ma sicuramente uno dei più validi, completi e interessanti è quello fornito da Cached.it.
Basta inserire il proprio dominio e interrogare il sito per avere un risultato riepilogativo delle pagine indicizzate su Google, Yahoo e MSN. Con l’aiuto di Alexa, Cached offre anche un commento e alcuni grafici riepilogativi della situazione. Lo stesso servizio comunica anche il PageRank del sito esaminato. Altro utile strumento è quello di yourcache.com che riepiloga, solo per Google, le pagine indicizzate per ogni datacenter.