ďťż
Misja Tereski
Bilion adresów stron zindeksowanych przez Google
Stale rośnie ilość publikowanych w Internecie informacji. Jak wynika z pierwszego przygotowanego przez Google, w 1998 roku, ilość witryn oscylowała wówczas w graniach 26 milionów. Na przestrzeni ostatnich ośmiu lat widywaliśmy już wiele dużych liczb. Bilion jest ogromną liczbą niepowtarzalnych adresów URL, a tyle właśnie, jak twierdzi Google, zindeksowanych zostało w ich wyszukiwarce. Czy jednak tak duża ilość zindeksowanych dokumentów faktycznie oznacza ich istnienie i jaka jest liczba stron na całym świecie? Google z uśmiechem odpowiada, że nie wie, gdyż nie ma czasu spojrzeć na nie wszystkie. Ściślej mówiąc, ich liczba jest tak naprawdę nieskończona. Przykładowo miejsca zawierające tzw. automatycznie generowaną treść, jak kalendarze internetowe, w których obecne są linki do następnych dni, mogłyby być traktowane za każdym razem jako nowa strona. Tak się jednak nie dzieje, ponieważ nie wynikają z tego żadne korzyści. Przykład ten pokazuje także, że nie ma jednej definicji określającej co jest użyteczną witryną, a co nie, aczkolwiek korporacja jest dumna z posiadania największego indeksu ze wszystkich wyszukiwarek, a jej celem jest zindeksowanie wszystkich danych świata. Dwaj inżynierowie Google, Jesse Alpert i Nissan Hajajlm, wspominają natomiast same początki, kiedy Sieć nie była jeszcze tak duża i nie każdy miał do niej swobodny dostęp, co też wyraźnie przekładało się na ilość publikowanych informacji. Wówczas bowiem jedna stacja robocza była w stanie obliczyć wykres Page Rank na 26 milionów na przestrzeni kilku godzin, a następnie wykorzystaniu tak przygotowanego zbioru przez określoną ilość czasu. Dzisiaj, wyszukiwarka giganta z Mountain View, na bieżąco indeksuje zasoby sieci, gromadząc i aktualizując informacje o stronach, przetwarzając grafy połączeń wiele razy w ciągu dnia. Zdaniem korporacji, wykres biliona adresów idealnie oddaje porównanie z mapą przedstawiającą identyczną ilość skrzyżowań. Zatem, aby przedstawić ogrom pracy wykonywanej przez klastry obliczeniowe, Google za przykład podaje, iż każdorazowe obliczenie wykresu jest równoważne z określeniem na mapie miasta skrzyżowania, które są obecne na każdej drodze w Stanach Zjednoczonych, z tą różnicą, że mapa ta jest blisko 50 tysięcy razy większa od rzeczywistej mapy USA z 50 tysiącami razy większą liczbą dróg i skrzyżowań. Niewątplwie wynik Google przyprawia zwykłego zjadacza chleba o lekki ból głowy. Pozostaje mieć nadzieję, że firma nie spocznie na laurach, wkraczając na coraz to nowsze rynki internetowego biznesu, świadcząc nowatorskie usługi, cenione przez użytkowników na całym świecie, pokroju Gmaila, świetnie realizującego model SaaS. |