Van het weblog

Gratis informatienummers bestaan niet

Nederland juicht over het voornemen van minister Verhagen om aparte minuuttarieven voor 0900-nummers te verbieden. Maar is dat wel terecht?

Hoe werkt een zoekmachine?

Dit artikel is onderdeel van het dossier: Zoekmachines

Zoekmachines zijn al jarenlang een middel om informatie te vinden op het internet. Ze wijzen ons de weg op internet met de 'kennis' die ze beschikken over het volledige web. Een goede vergelijking is die met een telefoonboek; als we het telefoonnummer van een bepaalde persoon of bedrijf al kennen, hebben we het niet nodig, maar is dit niet het geval dan biedt opzoeken uitkomst.

Een zoekmachine probeert je, net als het telefoonboek, te helpen aan de juiste gegevens, alleen dan op het internet. Op het moment da je de zoekmachine een zoekopdracht geeft, wordt deze naast een grote database gelegd waarover elke zoekmachine beschikt. In deze index is met merendeel van alle websites het internet opgeslagen. De zoekmachine selecteert uit de index de sites die overeenkomen met je zoekopdracht en plaatst deze op de resultaatpagina's.

De selectiecriteria van zoekmachines

Hoe weet een zoekmachine nu welke link voor jou waardevol is en welke niet? Vroeger was dit vrij eenvoudig; webmasters konden met behulp van zogemaande meta-tags onder meer omschrijvingen en keywords toevoegen aan hun pagina's. Zoekmachines keken simpelweg welke meta-tags overeenkwamen met de zoekopdracht.

Helaas werkt het tegenwoordig lang niet zo eenvoudig meer. Het systeem van meta-tags vroeg er namelijk om misbruikt te worden. Doordat informatie kan worden toegevoegd die voor de bezoeker niet zichtbaar is, is het een peuleschil om allerhande populaire keywords toe te voegen die feitelijk niets met de website te maken hebben. Zoekmachines beoordelen eigenlijk alleen nog de content die de bezoeker daadwerkelijk te zien krijgt. Keywords worden voornamelijk uit de teksten en titels gehaald.

Maar hoe kom ik bovenaan in Google?

Zoekmachines vergelijken bij het samenstellen van resultaatpagina's dus de zoekopdracht met de informatie die ze hebben over miljoenen pagina's. Voor het bepalen van de volgorde waarin de resultaten worden getoond wordt in de eerste plaats gekeken naar de inhoud; als wordt vastgesteld dat een bepaalde tekst 'meer' over het gezochte onderwerp gaat, zal deze hoger scoren. Het is dus bij het schrijven van teksten belangrijk om na te denken over termen waarop internetters de betreffende pagina zullen moeten kunnen vinden.

Andere zaken die een belangrijke rol spelen bij de waardering:

  1. Aantal externe links naar de site
  2. Waarde van de externe links naar de site
  3. Verhouding tussen opmaakcode en inhoud in de website
  4. Aantal pagina's van de website in verhouding tot het gevraagde onderwerp
  5. Regelmaat waarmee je de internetsite vernieuwt
  6. Leeftijd van de website
  7. Opbouw van de navigatie (denk aan bestandsnamen en linktitels)
  8. Snelheid van de website
  9. Eventuele zaken die worden bestraft met penalties, zoals gedupliceerde content, overmatig plaatsen van zoekwoorden in teksten of het inzetten van technische trucs die tot een hogere score kunnen leiden.

Hierbij weegt het aantal links naar de site en de kwaliteit hiervan het zwaarst. Google en collega's als MSN Search en Ilse beredeneren namelijk dat de waarde van een site kan worden gewogen aan de hand van het aantal andere sites dat naar de internetpagina linkt. Aan de hand van een formule wordt met deze links de PageRank berekend, de link-autoriteit uitgedrukt in een cijfer van 0 tot 10. Belangrijk om te weten is dat een link van een website met een hoge pagerank het meeste oplevert.

In een later dossier zal apart aandacht aan worden besteed aan het verbeteren van je positie in zoekmachines.

Spider: spin in het web

Vaak wordt gesproken over het aanmelden bij zoekmachines. Dat is bij de huidige generatie zoekmachines niet meer nodig. Aangezien de zoekmachines voor de notering van een website kijken naar zaken als links, worden nieuwe websites vanzelf opgemerkt wanneer voor het eerst een link naar de site wordt aangetroffen.

De data die zich in de index bevindt, wordt bij de meeste zoekmachines continu ververst. Daarvoor zwerven speciaal geprogrammeerde spiders over het internet. Ze verzamelen de inhoud van websites die ze hierbij tegenkomen en slaan links op. Deze spiders spelen ook een belangrijke rol bij het bepalen van de pagerank van een website, omdat ze het aantal links naar een bepaalde website bijhouden.

Spiders gedragen zich zo veel mogelijk als echte internetgebruikers. Dat betekent dat ze hyperlinks volgen en pagina's 'lezen'. Op deze manier brengen ze dag in dag uit de structuur van het internet in kaart. Je kunt begrijpen dat zoekmachines als Google hiervoor over enorme hoeveelheden opslagcapaciteit moeten beschikken, om nog maar te zwijgen over de rekenkracht om deze informatie te kunnen verwerken!

Constante evolutie

Een nummer 1-positie in Google kan een merk maken of breken op het internet. Hoewel een zoekmachine zo veel mogelijk de werkelijke waarde van een website probeert in te schatten, zoeken webmasters vaak de grenzen op om te proberen hun positie in Google te verbeteren. Ze maken hierbij misbruik van de algoritmes van de spiders en de wijze waarop pagerank wordt bepaald. Bijvoorbeeld door de zoekmachine een andere pagina te tonen dan echte bezoekers, of door extra zoekwoorden te verstoppen in de documenten.

Daarom wordt de zoektechnologie bij de meeste zoekmachines voortdurend verbeterd, om de resultaatpagina's zo zuiver mogelijk te houden. Er is een continue strijd gaande tussen spammers die trucs aanwenden om hun notering te verbeteren en de zoekmachines die er belang bij hebben dat alleen de beste websites bovenaan verschijnen.

Meer over de techniek achter de grootste zoekmachine ter wereld is op de website van Google zelf te vinden.

Zoekmachines