De pagina’s die google in hun index hebben worden opgezocht door “spiders”. Deze programma’s gaan het internet op en zoeken naar pagina’s die ze opslaan in zijn index. In deze pagina’s zoekt de spider weer links en zo gaat het steeds veder. Er zijn verschillende indexen. De grootste index heeft een omvang van 5.7 PetaByte (5700 TeraByte, 5700.000 GigaByte).
De gebruiker vraagt de informatie aan bij de webserver. De webserver zoekt in de index naar pagina’s die iets te maken hebben met het zoekwoord, en bouwt er een zoekresultaat van. Hieronder is een fictief voorbeeld van het verkeer van google:
(in het echt zijn er honderden, soms zelfs duizenden indexen, spiders en webservers).

Hoe worden de resultaten bepaald?
De resultaten worden bepaald door een paar dingen: Hoe vaak de het keyword (het woord waar naar gezocht is) in de pagina voorkomt, of het woord in de titel staat of gewoon in de tekst, of het woord op de homepage staat of een zijpagina en of de tekst relevant is. Maar wat ook heel zwaar meeweegt is de PageRank van de pagina:
PageRank is een systeem dat telt hoeveel links er komen naar een site. Hoe meer links, hoe hoger de PageRank. Zo komt de meest relevante en populaire informatie boven, de wat minder relevante onder.
De manier hoe de resultaten berekend worden, heet een algoritme. Een soort taak of rekensom van de computer zodat alle resultaten hetzelfde worden berekend.