Googleの把握しているウェブの規模が“1兆ページ”を突破!マイクロソフトが「コンピュータ」→「コンピューター」に表記ルールを変更!
Googleの把握しているウェブの規模が“1兆ページ”を突破!
毎日膨大な数のウェブページが作成されて、そのウェブページをGoogleやYahoo!、Microsoftの検索エンジンロボットが収集してインデックスしています。検索エンジンの精度や有用性、利便性は『インデックスされているウェブページの量』と『検索キーワードに対応して表示される検索結果の質』によって規定されますので、最新の情報を反映させるという意味でも『インデックスのスピードと総数』が重要になってきます。今までGoogleやYahoo!の検索エンジンには数百億のウェブページがインデックスされているといわれてきましたが、Googleに限って言えば実際にはその規模を大きく上回るインデックスを作成していたようです。
米GoogleのWeb Search Infrastructureチームに所属するJesse Alpert氏とNissan Hajaj氏によると、同社のシステムが把握しているWebの規模は独立したURL数で、1兆(1,000,000,000,000)の大台を突破しているということです。インターネットには重複したコンテンツやプログラムで機械的に生成された無意味な言葉の羅列のウェブページも多いですが、そういった情報価値の乏しいページをできるだけ排除した独立したURLの数で1兆を突破したそうです。実際にGoogleがインデックスしている数は1兆よりもかなり少ないということですが、『ウェブ全体の規模』が大まかに分かるというのはなかなかスリリングですね。
今現在も一日に数十億ページのスピードでウェブは拡大しているそうなので、ウェブ世界が天文学的な数字のページ数にまで広がっていくのは時間の問題ですが、21世紀の後半にはいったいどれくらい広大なウェブ世界が出来上がっているのかを考えると『ウェブ世界の増殖のスピード』には圧倒されますね。