Ahora estamos en LinkedIn: para obtener noticias y recursos de la Búsqueda de Google sobre cómo hacer que tu sitio sea visible,
síguenos en LinkedIn.
Nuestro nuevo sistema de indexación web: Caffeine
jueves, 24 de junio de 2010
Os anunciamos que ha finalizado el desarrollo de Caffeine, nuestro nuevo sistema de indexación web. Este sistema, que genera resultados de búsqueda un 50 por ciento más recientes que los de nuestro índice anterior, ofrece el mayor conjunto de contenido web que hemos proporcionado hasta el momento. Ahora podrás acceder a enlaces del contenido que te interese mucho más rápido que antes, independientemente de lo que estés buscando, ya sea una noticia, un blog o una publicación en un foro.
Los usuarios que no os ganéis la vida desarrollando motores de búsqueda como nosotros debéis saber que, al realizar una búsqueda en Google, no se explora la Web al completo, sino el índice que Google hace de la Web. Este índice se puede comparar con la lista que aparece al final de un libro y que nos permite localizar exactamente la información que necesitamos. (Si quieres saber cómo funciona, consulta
esta explicación
en inglés).
Te preguntarás por qué hemos desarrollado un nuevo sistema de indexación de búsqueda. El contenido de la Web no deja de aumentar. De hecho, no solo se incrementan el tamaño y la cantidad del contenido, sino también la riqueza y la complejidad medias de las páginas web gracias a la introducción de vídeos, de imágenes, de noticias y de actualizaciones en tiempo real. Además, ahora los usuarios esperan obtener mejores resultados que antes al realizar una búsqueda. El objetivo de los usuarios es encontrar el contenido relevante más reciente, mientras que los editores desean aparecer en los resultados de búsqueda inmediatamente después de haber publicado su contenido.
Hemos desarrollado Caffeine para mantener el ritmo de evolución de la Web y para satisfacer las crecientes expectativas de los usuarios. En la imagen que aparece a continuación puedes ver las diferencias de funcionamiento entre nuestro antiguo sistema de indexación y Caffeine:
El antiguo índice estaba formado por varias capas, algunas de las cuales se actualizaban más rápido que otras. La capa principal se actualizaba cada dos semanas. Para actualizar una capa del antiguo índice era necesario analizar toda la Web. Por este motivo, transcurría un tiempo considerable desde que encontrábamos una página hasta que el usuario podía acceder a ella.
Caffeine nos permite analizar la Web en pequeñas partes y actualizar el índice de búsqueda de forma continua y global. Podemos añadir al índice páginas nuevas o información nueva publicada en páginas existentes tan pronto como las encontramos. Esto permite encontrar información mucho más reciente, independientemente del momento y del lugar en que se haya publicado.
Caffeine nos permite indexar páginas a grandísima escala. De hecho, este sistema procesa cientos de miles de páginas de forma simultánea cada segundo. Si apilásemos estas páginas como hojas de papel, la montaña aumentaría en una proporción superior a 5.000 metros por segundo. En cada base de datos de Caffeine se almacenan casi 100 millones de gigabytes de datos, y la información aumenta a un ritmo de cientos de miles de gigabytes al día. Se necesitarían 625.000 iPods de gran capacidad para almacenar esta cantidad de información, tantos que, si se colocaran en fila unos al lado de otros, se cubriría una distancia superior a 64 kilómetros.
Hemos desarrollado Caffeine pensando en el futuro. Además de ser un sistema más actual, proporciona una base más sólida para la creación de un motor de búsqueda aún más rápido y exhaustivo que se adapte al aumento de la información disponible online y que genere resultados de búsqueda mucho más relevantes para el usuario. Mantente atento a las nuevas mejoras que aparecerán en los próximos meses.
Publicado por Carrie Grimes, Software Engineer.
Traducido por Xavier, equipo de Calidad de búsqueda.
A menos que se indique lo contrario, el contenido de esta página está sujeto a la licencia Reconocimiento 4.0 de Creative Commons y las muestras de código están sujetas a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio web de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2010-06-01 (UTC).
[null,null,["Última actualización: 2010-06-01 (UTC)."],[[["Google launched a new web indexing system called Caffeine that delivers 50% fresher search results and encompasses a significantly larger collection of web content."],["Caffeine enables Google to index the web continuously, providing access to the latest content like news, blogs, and forum posts much sooner after publication."],["This new system processes hundreds of thousands of pages per second, handling massive amounts of data and offering a more scalable and robust platform for future search enhancements."],["Caffeine replaces Google's old layered indexing system, which experienced delays in refreshing and struggled to keep up with the increasing volume and complexity of web content."],["Google developed Caffeine to meet the evolving demands of users who expect to find the most recent and relevant information quickly, as well as the needs of publishers who want their content discovered instantly."]]],["Google launched Caffeine, a new web indexing system, providing 50% fresher search results and the largest collection of web content to date. Unlike the old system, Caffeine continuously analyzes and updates the index in small portions, enabling quicker indexing of new or updated web pages. This system processes hundreds of thousands of pages per second, using nearly 100 million gigabytes of storage and adding vast amounts of information daily, and was built to provide faster and more comprehensive search engine results.\n"]]