Recherche
Vous êtes ici >> Accueil/Les Dossiers/Actualité/Internet/Caffeine, le nouveau moteur d'indexation de Google
Bouton Newsletter Bouton RSS Ces icônes vous permettent de partager des pages articles du site sur les marque-pages sociaux (Social bookmarking).

Caffeine, le nouveau moteur d'indexation de Google

Publié par achtungbaby dans la catégorie Actualité/Internet le 09/06/2010
Lu 3110 fois - 0 commentaire
Actualité Internet Google, c'est avant tout un moteur de recherche. C'est même LE moteur de recherche le plus utilisé au monde. Depuis quelques mois, on constate que Google se disperse entre les systèmes d'exploitations ou autres services, à se demander si la recherche sur le web n'était pas devenu secondaire. Et bien non, Google vient de modifier son système d'indexation des sites web. Celui-ci s'appelle Caffeine et laisse penser que ça va indexer dur...
Pour tout indexer le web, il va falloir passer des nuits blanches. Pour cela, rien de tel qu'un bon café serré. C'est peut-être ce qu'on pensé les concepteurs de Google en nommant le nouveau moteur d'indexation Caffeine. Celui-ci est sensé indexer plus vite les nouveaux contenus, 50% de résultats en plus par rapport à l'ancien système selon Google. Google veut tout indexer, que ce soit les sites, les news, les blogs, les sujets de forums.
 
La croissance exponentielle des contenus sur le web a nécessité une remise en question du mode d'indexation du moteur de recherche. Aujourd'hui, on trouve de tout sur internet, des textes, des videos, des images. Les contenus sont de plus en plus nombreux. Autre élément important, les utilisateurs veulent de plus en plus du contenu frais. Caffeine veut répondre à ces nouveaux usages. 

L'ancien moteur d'indexation de Google fonctionnait sous la forme de plusieurs couches. Mais Google avoue bien volontier que certaines couches sont mises à jour plus régulièrement que d'autres. Par exemple l'index des images connait une fréquence de mise à jour moins rapide que les articles. Le système par couche oblige le moteur a faire une analyse complète du web, ce qui va générer un écart entre le moment de la publication d'une information et son indexation.
 
Caffeine utilise un principe différent. Le web est analysé par morceau, et la mise à jour de l'index se fait en temps réel (tout du moins en continu). De fait, le moteur de recherche va retourner plus d'information plus récentes qu'auparavant. Google propose un schéma explicatif de l'ancien et du nouveau moteur d'indexation :
caffeine google
 
Caffeine va permettre de réaliser une indexation en parallèle de centaine de milliers de pages en même temps, ceci occupant quelques 100 millions de Go de stockage, une base qui ajoute de nouvelles informations équivalentes à des centaines de milliers de giga-octets par jour. Google prend comme exemple l'iPod et estime qu'il faudrait 625.000 iPod pour stocker autant d'informations.  
« Dossier suivant
Google Maps Navigation, le GPS gratuit
Dossier précédent »
Orange change ses forfaits Clé 3G