Van het weblog

Nieuw telefoonnummer voor Smeding Concepts

Wil je bellen met Smeding Concepts, kies dan vanaf nu ons nieuwe telefoonnummer.

Eén loket voor webdesign, cms en online marketing

Hoe om te gaan met bestanden in zoekresultaten?

Afbeelding bij Hoe om te gaan met bestanden in zoekresultaten?

Dikwijls bevatten websites PDF-bestanden of Word-documenten. Google slaagt er steeds beter in de informatie in deze documenten te interpreteren en we zien ze steeds vaker terug in zoekresultaten. Is dit wel altijd wenselijk?

Geplaatst op woensdag 4 mei 2011

Het opnemen van documenten in formaten als .pdf en .doc kan in veel gevallen handig zijn. Het voordeel van een .pdf-document is dat veel mensen dit documentformaat kunnen openen, de opmaak er altijd zo uit ziet als bedoeld en het document niet kan worden bewerkt. De meeste organisaties werken met Word-documenten en ook deze documenten zien we veel op websites terug. Het aanbieden van algemene voorwaarden of het digitaal aanbieden van eerdere publicaties zijn twee concrete voorbeelden waarbij een website dergelijke bestanden kan bevatten.

Deze documenten kunnen, net als webpagina's die in HTML zijn opgemaakt, informatie bevatten die waardevol is voor gebruikers van zoekmachines. Daarom worden zoekmachines zoals Google er steeds beter in om de inhoud van deze documenten te lezen en te interpreteren. Met als gevolg dat het regelmatig voorkomt dat je niet alleen webpagina's maar ook directe links naar PDF-bestanden en Word-documenten in zoekresultaten ziet verschijnen.

Voordeel: Extra content

Deze bestanden bevatten vaak veel informatie die waardevol kan zijn voor gebruikers van zoekmachines. Ze verschijnen in resultaten wanneer er woorden in voorkomen die aansluiten bij een zoekopdracht. Vaak bevatten dergelijke documenten informatie en potentiële zoekwoorden die op de website niet genoemd worden. De extra informatie die zo aan de website wordt toegevoegd kan zorgen voor extra verkeer.

Stelregel is dat wanneer je de tekst kunt selecteren bij het openen van een document, deze tekst ook kan worden gelezen door de spiders van zoekmachines als Google.

Nadeel 1: Geen link met website

Het is mooi dat zoekmachines de informatie in .doc en .pdf-bestanden steeds beter kunnen lezen en steeds vaker gebruiken, zeker wanneer dit voor extra verkeer zorgt. Een groot nadeel van een zoekmachine die een bezoeker direct naar zo'n document verwijst is echter dat men enkel dat document krijgt te zien en niet de volledige website.

Door het ontbreken van navigatiemiddelen om verder door de website te klikken, is de kans aanwezig dat de bezoeker na het inzien van het document een andere site bezoekt. Sowieso zal de bezoeker zelf op het idee moeten komen dat achter het document ook een website zit, die bezocht kan worden door de URL in de adresbalk van de browser aan te passen.

Dit probleem kan voor een deel worden opgelost door links naar de website op te nemen in de documenten, maar wanneer de bestanden ook voor andere doeleinden worden gebruikt dan publicatie op de website is dit niet altijd mogelijk of gewenst; bij een uitgeprinte versie van een document kan een link niet worden aangeklikt.

Nadeel 2: Soms is vindbaarheid ongewenst

Behalve de potentieel waardevolle informatie in een document, kunnen er ook zoekwoorden in staan waarbij vindbaarheid minder gewenst is. Denk aan verslagen of artikelen in kranten of tijdschriften waarin namen worden genoemd. Hierbij kan de relevantie na verloop van tijd verdwijnen. Het effect kan zijn dat een bepaald artikel of een bepaalde uitspraak iemand via een online PDF-bestand nog jaren blijft achtervolgen in zoekmachines.

Het kan ook zijn dat de website een pagina bevat waar dezelfde informatie staat als in het document, of een gedeelte hiervan. In dit geval wil je liever dat Google de bezoeker verwijst naar deze webpagina in plaats van het bestand. Hiervoor hebben we al gezegd dat een webpagina in tegenstelling tot een document wel de mogelijkheid biedt om door te klikken naar andere pagina's van de website.

Kiezen voor verwijderen of laten staan?

De directe aanleiding van het schrijven van dit artikel is dat in korte tijd bij een tweetal van onze klanten de discussie ontstond of het wel wenselijk was om PDF-bestanden op de website te vermelden. In het eerste geval kostte het ontbreken van de website-navigatie het bedrijf duidelijk klanten, in het andere geval ging het om de vindbaarheid van namen van personen.

Als eerste optie zou je denken aan het verwijderen van de bestanden van de website wanneer de vindbaarheid van deze documenten op bepaalde zoekwoorden als onwenselijk wordt beschouwd. Dit betekent echter ook dat de informatie niet langer beschikbaar is voor bezoekers van de website of mensen die op andere, wel relevante zoekwoorden zoeken.

Wanneer er zowel argumenten vóór als tegen het online plaatsen van PDF'jes en Word-bestanden bestaan, is een derde optie naast verwijderen en laten staan het onvindbaar maken van deze documenten.

PDF-bestanden en Word-documenten onvindbaar maken

Het is technisch mogelijk om bestanden online beschikbaar te maken zonder dat ze vindbaar zijn in zoekmachines. Zo kunnen we op de website blijven linken naar deze bestanden, maar zullen ze niet opduiken in zoekresultaten.

Door het 'onvindbaar' maken van PDF-documenten hebben we er bij de ene opdrachtgever van de bovenstaande voorbeelden voor gezorgd dat Google in plaats van de link naar PDF-bestanden nu verwijderd naar pagina's binnen de website. Bij de andere klant zorgde dit ervoor dat het zoeken op namen die werden gebruikt in artikelen niet langer hits opleverden.

Hoe hebben we dit gedaan?

Er zijn verschillende manieren om zoekmachines te vertellen dat ze geen PDF-bestanden en Word-documenten mogen indexeren. Dit vereist meestal een aanpassing door de bouwer van de website.

Wij gebruiken voor het onvindbaar maken van PDF'jes en DOC-bestanden de volgende regels in een .htaccess-bestand:

<IfModule mod_headers.c>
<FilesMatch "\.(doc|pdf)$">
Header set X-Robots-Tag "noindex"
</FilesMatch>
</IfModule>

Deze code zorgt ervoor dat bij het opvragen van alle bestanden met de extensie .pdf en .doc een regel wordt meegestuurd in de headers die zoekmachines vertelt dat ze de informatie niet mogen indexeren. Deze oplossing werkt in alle grote zoekmachines, waaronder Google, Bing en Yahoo.

We geloven niet dat elke website er voor zou moeten kiezen om PDF- en Word-documenten niet op te laten nemen in zoekmachines. Toch is het goed om eens stil te staan bij de voor- en nadelen van het laten indexeren van dit soort bestanden. Het onvindbaar maken van deze documenten kan een goed alternatief zijn voor het gevonden worden van deze bestanden, of het verwijderen ervan.

Tags: SEO, webdesign en zoekmachine.

Lees ook deze gerelateerde artikelen

Reacties bij dit artikel

t Nicky op donderdag 12 mei 2011 om 14:52
PDF's zijn inderdaad een probleem op gebied van navigatie naar de website maar dit is vaak op te lossen door in de footer op iedere pagina de gegevens van de firma te zetten met link. Zelf vind ik het vaak wel leuk als ik in een pdf kan bladeren ipv surfen.
t Jan-Willem Bobbink op dinsdag 20 september 2011 om 11:57
Helaas nemen niet alle zoekmachines no-index tags serieus. De beste optie is de zoekmachine robots te redirecten naar een andere pagina zodat voor hen de PDF überhaupt niet bestaat.

Plaats je reactie bij dit artikel

Omdat dit artikel meer dan een jaar oud is, is het niet meer mogelijk om te reageren.