Derniers journaux de gcottenc :
- [03/09@11:20] backdoor dans des machines a voter US ?
- [16/07@07:52] Leakez la mémoire du système avec Win32
- [01/07@11:58] Microsoft mauvais, Google bon ?
- [18/05@13:57] Subpixel hinting buggé ?
- [06/05@07:19] Jeunesse, rotozoom pixelisés et musique 4-canaux
- [12/12@15:57] Mandrake recrute un dével Perl expert
- [14/10@16:12] Frozen bubble rules
Journal : Google fait enfin péter la limite des 32-bit
Posté par gc (page perso, ) le 16 novembre 2004©2004 Google - Searching 8,058,044,651 web pages
Cela faisait pourtant très longtemps que le compteur était bloqué un peu au-dessus de 4 milliards, très certainement parce que PageRank utilisait un ID unique pour chaque page sur 32-bit.
Comment ont-ils doublé ? Est-ce limité à 33 bits, 8 milliards, pour l'instant, ce qui paraîtrait bizarre mais bon. Cela va-t-il augmenter ?
En tous cas la recherche du mot "and" fait apparaître 7 milliards de résultats (il n'y aurait qu'un milliard de page pas en anglais indexées ? étrange..).
Ce serait bien si quelqu'un avait loggé cette valeur chaque jour (ou semaine) depuis les débuts de Google... Un employé de Google pouvant se permettre d'être viré est-il à l'écoute ? :)
> Lire le journal (11 commentaires, moyenne: 2,4).
Quelques stats
Sur ce lien, quelques stats, et la jolie histoire de la guerre des moteurs de recherche. Le document est vieux, mais il met des chiffres sur la taille des bases de données des principaux moteurs de recherche.
http://searchenginewatch.com/reports/article.php/2156481(...)
4 000 000 000 de zeze
-
[^]Re: 4 000 000 000 de zeze
Posté par LLG () le 16/11/2004 à 11:12. (lien). Évalué à 3.mais on peut pas en voir plus de 996!
http://www.google.fr/search?q=the&hl=fr&lr=&start=990&a(...)
Voir aussi
http://www.zorgloob.com/2004/11/8-058-044-651-pages-indexes-par-goo(...)
-
[+] [^]Re: 4 000 000 000 de zeze
Posté par Antonio Da Silva (page perso, ) le 16/11/2004 à 12:40. (lien). Évalué à -1.and fait 7 milliards
the fait 8 milliards
donc "the and" devrait faire 7 milliards (environ)
pourtant :
http://www.google.fr/search?hl=fr&client=firefox-a&rls=org.(...)-
[^]Re: 4 000 000 000 de zeze
Posté par Hardy Damien (page perso, ) le 16/11/2004 à 12:44. (lien). Évalué à 4.Révises ta téhorie des ensembles ...
l'ensemble des "and" n'est pas forcement inclue dans l'ensemble des "the" tu viens de donner la cardinalité de l'intersection des deux ensemble ...
Dam-
[^]Re: 4 000 000 000 de zeze
Posté par Antonio Da Silva (page perso, ) le 16/11/2004 à 12:51. (lien). Évalué à 1.>l'ensemble des "and" n'est pas forcement inclue dans l'ensemble des "the"
Tu n'as pas tenu compte de la taille de l'ensemble de départ :
8,058 milliards de pages indéxées = 8 milliards de pages qui contient the + delta
-
-
-
[^]Re: 4 000 000 000 de zeze
Vu sur Google blog
http://www.google.com/googleblog/2004/11/googles-index-nearly-doubl(...)
-
[^]Re: Vu sur Google blog
Posté par rangzen (page perso, ) le 16/11/2004 à 13:16. (lien). Évalué à 2.Je pense plutôt à ça ...
http://www.essentielpc.com/s/breve468.html(...)
Google et MSN search
Je sais plus ou j'ai lu ca, mais il semble que MSN search est ete lance avec presque 5 miliards de pages references.
Et Google a augmente son nombre a 8 miliards juste apres cette annonce ...
Le journal dans lequel j'ai lu cette nouvelle disait que le cache de google avait peut-etre ete reutilise par microsoft pour referencer msn search. Mais cela reste un eventualite, rien n'est sur.
-
[^]Re: Google et MSN search
Posté par cozon (page perso, ) le 16/11/2004 à 22:08. (lien). Évalué à 1.> Je sais plus ou j'ai lu ca...
Probablement sur l'excellent http://standblog.org(...)
Les journaux sont destinés à des informations qui ne sont pas suffisamment intéressantes
pour être validées en dépêche (sinon n'hésitez pas à proposer votre information en
dépêche), qui sont sans rapport avec Linux ou le libre, ou simplement pour donner votre
avis. Si vous désirez poser une question, merci d'utiliser 

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.
Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.