Het grote indexatie probleem van Google eenvoudig uitgelegd

Indexatie is van cruciaal belang voor het floreren van je website. Zonder indexatie ben je namelijk onvindbaar op het web. Maar wist je dat een groot deel van alle websites en webpagina’s gewoon niet geïndexeerd wordt? Misschien heb je dat zelf al ondervonden. Welnu, hoe komt dat precies? En wat kan je eraan doen?

Wat is indexatie door Google?

Weet je niet goed wat indexatie precies inhoudt? Wij leggen het je graag uit!

Het belang van indexatie door Google

Wanneer Google de pagina’s van je website indexeert, registreert ze deze in haar database. Zoekmachines vormen zo in feite enorme bibliotheken bestaande uit websites en webpagina’s. Wanneer een bepaalde pagina of website in zijn geheel niet geïndexeerd is door Google, zal die pagina of website nooit opduiken in de resultatenlijsten. De indexatie van je pagina’s door Google is dus van uitermate groot belang wanneer je graag vele bezoekers wil laten kennismaken met je website.

Hoe werkt indexatie? Via crawling

Google indexeert pagina’s door te crawlen. Crawlers zijn zoekmachinesoftware die webpagina’s doorzoeken en zo trachten te achterhalen waarover de pagina’s gaan. Na crawling kan de zoekmachine de pagina’s indexeren.

Doordat het web almaar groter wordt en iedere dag blijft groeien, kan Google tegenwoordig onmogelijk alle bestaande pagina’s doorzoeken. In plaats daarvan crawlt Google slechts een beperkt aantal pagina’s, waarvan ze vervolgens slechts een bepaald percentage indexeert.

Waarom indexeert Google mijn pagina’s niet?

Door de onoverzichtelijke hoeveelheid websites slaagt de Googlebot er niet langer in om iedere individuele pagina te crawlen. Veel webpagina’s worden daardoor nooit geïndexeerd. Maar ook gecrawlde pagina’s worden soms niet geïndexeerd. De redenen waarom Google sommige pagina’s niet indexeert, kunnen dan ook erg uiteenlopend zijn. Wij sommen de belangrijkste oorzaken voor je op en bieden meteen enkele oplossingsstrategieën aan!

1. Content van lage kwaliteit

Wanneer de Googlebot tijdens het crawlen ontdekt dat bepaalde pagina’s niet over kwaliteitsvolle content beschikken, zal hij besluiten deze pagina’s niet te indexeren. Google is namelijk voortdurend op zoek naar artikels die voor de lezers een grote meerwaarde bieden. Ontwerp daarom pagina’s met unieke, interessante en diepgaande inhoud. Vermijd zowel duplicate content als thin content. Zijn bepaalde delen van je website van lagere kwaliteit en wil je niet dat Google deze doorzoekt en/of indexeert? Blokkeer deze pagina’s dan door gebruik te maken van het robots.txt bestand of de noindex tag.

2. Duplicate content

Wanneer je website duplicate content bevat, zal Google de originele pagina niet indexeren. Je kan dergelijke problemen verhelpen door gebruik te maken van 301 redirects of canonical tags. Een canonical tag vertelt Google welke pagina’s qua inhoud met elkaar overeen komen of kopies van elkaar zijn en welke pagina nu de orginele URL bevat. Zo weet Google welke pagina ze precies moet indexeren. Ook hier is het opnieuw van belang om voldoende aandacht te spenderen aan waardevolle content van kwaliteit. Neem geen bestaande beschrijvingen van producten over, maar wees uniek. Biedt bijvoorbeeld een uitgebreide FAQ aan!

3. Beperkt crawl budget

Omdat Google onmogelijk alle pagina’s kan doorzoeken, krijgt iedere website een bepaald crawl budget. Dit budget is de hoeveelheid tijd die Google wil spenderen aan de crawling van een bepaalde site. Het crawl budget is afhankelijk van de websitepopulariteit en de mate waarin pagina’s over nieuwe content beschikken. Wanneer je website heel veel pagina’s bevat, kunnen deze terechtkomen in een lange wachtrij en kan het ontzettend lang duren voordat ze doorzocht en geïndexeerd worden. Onderzoek daarom welke pagina’s op je website van lage kwaliteit zijn. Door Google duidelijk te maken dat deze pagina’s beter niet geïndexeerd worden, maken je waardevolle pagina’s meer kans om wel geïndexeerd te worden. Zo optimaliseer je jouw crawl budget.

4. Pagina’s zonder interne links

Pagina’s die niet over interne links beschikken, noemt men ook wel orphan pages. Het zijn pagina’s zonder relatie. Wanneer er geen pad voorhanden is dat naar een bepaalde pagina op je website leidt, dan zal de Googlebot die pagina met grotere waarschijnlijkheid niet vinden. Om het probleem op te lossen, kan je orphan pages eventueel manueel toevoegen aan je sitemap. We raden je echter aan om alle pagina’s van je website te voorzien van voldoende interne links. Ook dat is namelijk een indicatie voor Google om te weten welke pagina’s de moeite waard zijn om geïndexeerd te worden.

Hoe los ik het indexatie probleem op? Een overzicht

Wanneer je pagina’s niet geïndexeerd worden door Google, kunnen mensen je niet vinden. Wil je snel ontdekken of Google jouw website al indexeerde? Ga dan naar Google en zoek op ‘site:www.voorbeeld.be’ of ‘site:www.voorbeeld.be/pagina’. Je kan dus zowel voor je website in zijn geheel als voor specifieke pagina’s nagaan of Google deze al indexeerde. Ook in de Google Search Console kan je vinden hoeveel pagina’s reeds geïndexeerd zijn. Werden er nog geen of onvoldoende pagina’s geïndexeerd? Dan is het hoog tijd om daar wat aan te doen.

Hieronder vind je een overzichtje met enkele handige strategieën die je kunnen helpen om je website sneller te laten indexeren door Google:

Ga op zoek naar een patroon: welke pagina’s indexeert Google niet?
Produceer steeds unieke en waardevolle content. Verwijder zowel duplicate content als thin content en blokkeer dergelijke pagina’s eventueel via de noindex tag of het robots.txt bestand.
Voorzie nieuwe pagina’s van voldoende interne links en zorg ook voor externe links.
Zet alle pagina’s die geïndexeerd moeten worden in je sitemap.
Denk aan je crawl budget en laat Google alleen waardevolle pagina’s crawlen en indexeren.

Contacteer ons gerust bij vragen of schrijf je in voor één van onze seo-opleidingen! Wij wensen je alvast veel succes.