La Web Invisible y GoogleBot
Existe una gran cantidad de información en Internet que solo es visible una vez se ha lanzado una consulta a través de un formulario html y que no es accesible para las arañas (crawlers), esta información valiosísima configura lo que Google denomina la Invisible Web (Web invisible).
Google ha anunciado en su blog oficial de Webmasters Central que va a indexar los resultados obtenidos tras lanzar consultas a formularios html ( Crawling through html forms).
Resalta que lleva algun tiempo haciendo pruebas y que su idea es “seguir” (follow) unicamente los formularios de web que considere de alta calidad y que no esten “prohibidas” a traves del robots.txt, nofollow o noindex.
En su post cuenta también que “seguirá” formularios que utilicen protocolos GET y que no incluyan campos de contraseña o campos de caracter personal.
Es curioso también, como especificamente menciona la NO perdida de PageRank de otras paginas del sitio, explicitamente dándole una vez mas relevancia a la técnica de “Link Sculpting”
Tags: formularios, Google, googlebot
April 15th, 2008 at 9:55 pm
Lo del link sculpting hay que tomarlo con pinzas, no termino de verlo claro, si es obvio que una buena arquitectura del sitio favorece a Google y al usuario, pero lo del nofollow dentro de los enlaces, hice un experimento y no sali muy convencido, pero necesito investigar un poco más…
Lo que si viene a decir esto, es algo importante, Google es capaz de hacer más cosas de la que parece que hace pero solo para determinados sitios, por eso me sorprenden mucho las afirmaciones Google No lee el flash, Google no lee el javascript, o como acabo de leer en Xeoweb Google no lee el alt de las imágenes y los enlaces parace que no cuentan si son imágenes…
Saludos!
April 16th, 2008 at 12:48 pm
Bueno, respecto a que no lee el flash y no lee el javascript, si lees el post oficial de Google sobre The Invisible Web, veras que confirman que si leen flash y que si leen javascript. Y lo del texto alt de las imágenes, creo que esta también muy claro que si lo lee, de ahí su gran buscador de imágenes.
Lo que no esta tan claro, es el valor que le da para posicionamiento, al lo que encuentra en los archivos flash, los archivos js y el texto alt de las imágenes, pero leerlo, si lo lee, e indexarlo, también lo indexa.
April 16th, 2008 at 1:39 pm
Si lo indexa y lo toma como contenido algun valor tiene que tener… de hecho puedes aparecer para palabras unicamente contenidas en el alt.
Saludos