Hoe berekend google hoe hoog de resultaten moeten komen?

2 03 2009

De pagina’s die google in hun index hebben worden opgezocht door “spiders”. Deze programma’s gaan het internet op en zoeken naar pagina’s die ze opslaan in zijn index. In deze pagina’s zoekt de spider weer links en zo gaat het steeds veder. Er zijn verschillende indexen. De grootste index heeft een omvang van 5.7 PetaByte (5700 TeraByte, 5700.000 GigaByte).

De gebruiker vraagt de informatie aan bij de webserver. De webserver zoekt in de index naar pagina’s die iets te maken hebben met het zoekwoord, en bouwt er een zoekresultaat van. Hieronder is een fictief voorbeeld van het verkeer van google:

(in het echt zijn er honderden, soms zelfs duizenden indexen, spiders en webservers).

schema

Hoe worden de resultaten bepaald?

De resultaten worden bepaald door een paar dingen: Hoe vaak de het keyword (het woord waar naar gezocht is) in de pagina voorkomt, of het woord in de titel staat of gewoon in de tekst, of het woord op de homepage staat of een zijpagina en of de tekst relevant is. Maar wat ook heel zwaar meeweegt is de PageRank van de pagina:

PageRank is een systeem dat telt hoeveel links er komen naar een site. Hoe meer links, hoe hoger de PageRank. Zo komt de meest relevante en populaire informatie boven, de wat minder relevante onder.

De manier hoe de resultaten berekend worden, heet een algoritme. Een soort taak of rekensom van de computer zodat alle resultaten hetzelfde worden berekend.


Acties

Informatie

Geef een reactie

Fill in your details below or click an icon to log in:

WordPress.com logo

Je reageert onder je WordPress.com account. Log Out / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log Out / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log Out / Bijwerken )

Verbinden met %s




Follow

Get every new post delivered to your Inbox.