fbpx Menu

Hoe het algoritme van Google werkt

Onze SEO specialisten zijn dagelijks bezig om de websites van klanten hoger in Google te krijgen. Ontdek in deze blog hoe zoekmachines werken zodat je je ranking kan verbeteren en je meer verkeer naar je pagina kan trekken. Lees verder om er meer over te leren.

Hoe een zoekmachine zoals Google content vindt

In deze video wordt uitgelegd hoe de basis van Google werkt. We gaan iets meer in detail dan de video doet, maar het is een geweldige basis voor de content.

Zoals in de video wordt uitgelegd crawlt Google het web door een soort code te gebruiken die een ‘spider’ heet. Dit is een klein programma dat links van de ene naar de andere pagina volgt en iedere pagina waarop het landt kopieert en doorgeeft aan de servers van Google. Het web (vandaar de naam spider) is enorm en als Google alle content die ze vinden bij zou willen houden is dat eigenlijk onmogelijk te managen. Dit is waarom Google alleen de code van de pagina’s bijhoudt en ze de pagina’s die niet nuttig zijn (duplicate content, pagina’s met een lage autoriteit, etc.) weggooien.

Spiders gaan heel specifiek te werk. Ze springen van link naar link om nieuwe pagina’s te ontdekken. Dit is dan ook de reden waarom je content niet wordt geïndexeerd als je pagina’s niet gelinkt zijn. Wanneer een nieuw domein voor het eerst ontdekt wordt dan zal de spider eerst naar deze pagina op zoek gaan:

jouwdomein.nl/robots.txt

Als je de spider iets wilt laten weten, zoals welke content je geïndexeerd wil hebben of waar de sitemap te vinden is, kun je op deze pagina achterlaten. De spider volgt dan je instructies op. Hoewel de spider hier niet toe verplicht is, doen de spiders van Google over het algemeen wel wat je wil dat ze doen.

De spider zelf is een klein en simpel programma. Er zijn veel open source versies die je gratis kunt downloaden en zelf los kunt laten op het web. Hoewel het cruciaal is voor Google is het vinden van data niet het belangrijkste. Wat dat wel is, behandelen we hierna.

Indexeren

Wanneer je veel content hebt, heb je een manier nodig om snelkoppelingen in de content aan te maken. Google kan niet iedere keer dat iemand iets opzoekt door een mega database die alle pagina’s bevat gaan zoeken. Dat zou veel te langzaam gaan. In plaats daarvan indexeert Google de content om dit proces sneller te laten gaan. Zoekmachines gebruiken technologie zoals Hadoop om grote hoeveelheden data te managen in een korte periode. In die index zoeken gaat al weer veel sneller dan iedere keer door de hele database te gaan zoeken.

Veelgebruikte woorden zoals ‘en’, ‘de’, ‘of’ worden niet opgeslagen. Deze woorden staan ook wel bekend als stopwoorden. Ze worden over het algemeen niet gebruikt door de zoekmachine voor interpretatie van de content (hier zijn natuurlijk uitzonderingen in: ‘To be or not to be’ bestaat voor een groot deel uit stopwoorden) dus worden ze verwijderd om ruimte te besparen. Het is misschien niet een heel groot deel van de pagina, maar wanneer we het hebben over miljarden pagina’s gaat het toch over aardig wat ruimte. Deze manier van denken is belangrijk wanneer je Google en de keuzes dat het maakt probeert te begrijpen. Een kleine verandering per pagina kan uiteindelijk op een grote schaal veel uitmaken.

Rankende algoritmes

De content is nu geïndexeerd. Dus Google heeft er een kopie van gemaakt en een snelkoppeling naar de pagina in de index geplaatst. Geweldig, nu kan het gevonden en weergeven worden wanneer het relevant voor een zoekopdracht is! Elke zoekopdracht die je Google geeft zal waarschijnlijk duizenden resultaten hebben, dus nu moet Google beslissen in welke volgorde ze worden weergeven. Dit is echt het hart van SEO – het aanpassen van factoren die de resultaten volgorde manipuleren.

Google bepaald welke opdracht waarheen gaat met een algoritme. Een algoritme is een algemene term voor een proces of een set van regels die gevolgd worden om een probleem op te lossen. In het geval van Google is dit een verzameling van gewogen metingen die de de volgorde waarin verschillende pagina’s gerankt worden bepalen.

Het algoritme van Google begrijpen

Het algoritme van Google is niet meer het mysterie wat het ooit geweest is en de individuele factoren en metingen waar het vanuit opgebouwd is zijn bekend. We weten wat alle on- en off-page metingen zijn. Het lastige deel is om hun weging en de correlatie tussen metingen te begrijpen.

Als je zoekt op ‘chocoladecake recepten’ zal het algoritme de pagina’s wegen op basis van die zoekterm. Laten we eens naar een versimpelde versie van twee metingen en wat voor invloed ze op elkaar hebben kijken.

Meting 1 is de URL. Het keyword komt misschien wel voor in de URL, zoals in www.recepten.nl/chocoladecake. Google kan de keywords ‘chocoladecake’ en ‘recepten’ in de URL zien en kan daar een meting op baseren.

Nu gaan we verder naar meting 2, de backlinks van de pagina. Veel van die links bevatten misschien wel de woorden ‘chocoladecake’ en ‘recepten’. Maar Google hecht in dit geval misschien minder waarde aan deze meting omdat het te verwachten is dat de woorden uit de URL ook in de binnenkomende links voorkomen, of ze nou relevant zijn of niet. Aan de andere kant, kan Google deze meting juist meer waarde toekennen wanneer de keywords niet in de URL staan.

Alle verschillende factoren waar Google naar kijkt hebben invloed op elkaar. Een factor kan meer of minder waard worden (in de weging van metingen) en de relatie tussen de factoren verandert constant. Google heeft honderden updates per jaar waardoor die relatie tussen factoren constant verandert. Het is dus ook zo dat de weging van factoren en metingen en de relatie daartussen vaker verandert dan de metingen of factoren zelf. Als dit wel gebeurt gaat het meestal om grote updates zoals Penguin of Panda.

De verschillende metingen kunnen worden onderverdeeld in vier categorieën.

Relevantie

Hoe relevant is de content voor de zoekopdracht? De index is de eerste test om te bepalen of een pagina überhaupt bij de resultaten komt te staan. Maar we gaan nog wat verder om te bepalen in welke volgorde de resultaten worden weergeven, want het is natuurlijk logisch dat wanneer je ergens op zoekt, je de meest relevante resultaten te zien wilt krijgt.

Relevantie wordt bepaald door een mix van on- en off-page factoren. Deze factoren focussen allemaal op de plaatsing van keywords zoals in de paginatitels en in de anchor teksten. Sommige metingen zijn een combinatie van deze factoren. Bijvoorbeeld, wanneer een domein in zijn geheel als relevant wordt gezien voor de zoekterm, zal dit de relevantie score van de individuele pagina enorm boosten. Als je hier meer te weten over wilt komen, raad ik je aan om het artikel ‘How search engines use keywords’ te lezen.

Autoriteit

De wortels van autoriteit liggen in PageRank wat is bedacht door Larry Page (vandaar de naam). Het is de ruggengraat van hoe Google content rankt. PageRank begrijpen is deel van de sleutel tot het begrijpen van hoe Google werkt. Het is wel belangrijk om te erkennen dat er nog honderden andere factoren zijn die de ranking beïnvloeden, en dat PageRank nu minder belangrijk is dan het vroeger was.

PageRank wordt vaak uitgelegd door middel van een stemsysteem. Iedere link naar een pagina geldt als een stem. Des te meer stemmen een pagina heeft, des te hoger hij gerankt wordt. Wanneer een pagina met veel links naar een andere pagina linkt, wordt de kracht van die stemmen deels overgedragen. Dus ook al heeft een pagina maar een link, kan hij nog steeds hoog ranken wanneer de pagina die aan hem heeft gelinkt veel stemmen heeft. En de pagina’s waaraan deze pagina weer linkt hebben ook profijt van al die stemmen. De waarde die wordt doorgegeven van pagina tot pagina staat ook bekend als ‘link juice’ of ‘page juice’.

Relevantie is ook belangrijk in de context van autoriteit. Een link met een relevante anchor tekst kan zwaarder wegen dan een link die niet van een relevante website komt, geen relevante anchor tekst heeft, en überhaupt niet door Google meegenomen zou worden in de context van de zoekopdracht.

Vertrouwen

Dit is een anti-spam algoritme dat focust op het moeilijk maken van het manipuleren van de zoekresultaten. Google heeft een haat-liefde verhouding met SEO specialisten en het vertrouwen mechanisme is onderdeel van die verhouding. Aan de ene kant gaat een groot deel van SEO over het creëren van goede content en een goede gebruikerservaring. Aan de andere kant gaat het ook over het manipuleren van wat Google een natuurlijke volgorde van resultaten vindt.

Metingen van vertrouwen zijn moeilijk te manipuleren en geven Google meer vertrouwen in andere metingen. Dingen als hoe oud content of het domein is zijn metingen van vertrouwen. Wanneer je veel links van slechte sites hebt zijn deze links niet alleen waardeloos, maar kunnen ze Google ook nog eens twee keer na laten denken over jouw ranking bij de chocoladecake recepten zoekopdracht. En wanneer jouw pagina links naar zulke slechte sites heeft, heeft dat ook een negatief effect op je metingen van vertrouwen.

Google is eigenlijk een domein register, wat betekent dat ze alle data van verschillende domeinen kunnen zien. Dit maakt het mogelijk om informatie, zoals hoe vaak een domein van eigenaar is veranderd of hoe lang het duurt voordat de registratie verloopt, te integreren in deze metingen van vertrouwen. Deze zijn dan ook veel moeilijker te manipuleren.

Vertrouwen wordt ook bepaald door je type domein of pagina en welk type naar jou linkt. Tegenovergesteld aan het effect dat slechte websites op je hebben, hebben academische sites als .edu juist veel vertrouwen. Andere domein types kunnen ook een hoge vertrouwensscore hebben, wat ze meteen waardevoller maakt.

Bruikbaarheid

Google wil dat de content die ze weergeven in de zoekresultaten aantrekkelijk is voor zowel mensen als zoekmachine robots. Er is een set van metingen die alleen naar deze factoren kijken. Als je geweldige content hebt, maar het vervolgens vol propt met advertenties is dat niet goed voor de gebruikerservaring. Dit is waarom Google minder waarde hecht aan een pagina met abnormaal veel advertenties.

Paginasnelheid is een andere belangrijke factor. Pagina’s die langzaam laden zijn vervelend voor de gebruikers, wat er weer voor zorgt dat mensen terugklikken naar de zoekresultaten en een andere pagina kiezen. Google wil dat mensen Google blijven gebruiken en daarom willen ze dat pagina’s snel laden. Ze meten de paginasnelheid vanuit de HTML maar kunnen ook Chrome user data gebruiken.

Resultaattype en personalisering

Wanneer je iets opzoekt via je mobiele telefoon krijg je andere resultaten dan wanneer je hetzelfde via een desktop opzoekt. De uiteindelijke resultaten van de index (dus op laag niveau) zullen anders zijn. Het type apparaat is trouwens niet het enige wat de zoekresultaten beïnvloedt. Google kan er bijvoorbeeld ook voor kiezen om hele andere resultaten te laten zien als je iets andere zoektermen gebruikt.

Gelokaliseerde zoekopdrachten worden anders gewogen en laten andere resultaten zien dan bijvoorbeeld zoekopdrachten naar een product. Er zijn ook ‘mixed media’ zoekopdrachten waarin Google ervoor kiest om ook afbeeldingen en videos te laten zien. Sommige zoekopdrachten geven ook hele specifieke resultaten, zoals bij recente sportevenementen of verkiezingen.

Een andere factor is personalisatie. Je vorige zoekopdrachten hebben invloed op de resultaten van nieuwe zoekopdrachten. Er is een zekere mate van ‘machine learning’ gaande. Dus wanneer iemand constant naar een bepaald soort resultaat zoekt, gaat Google ervan uit dat de zoeker in de toekomst eenzelfde type resultaat wilt. Dit is vooral van toepassing bij ambigue zoektermen waar een woord meerdere betekenissen heeft.

Bron: https://www.wordtracker.com/academy/google/how-it-works/how-google-algorithm-works

Laat ons vrijblijvend kansen ontdekken voor jouw business

Ben je benieuwd waar online kansen liggen voor jouw business? En wil je advies van een online marketing bureau regio Ede, Arnhem of amersfoort?Neem dan geheel vrijblijvend contact met ons op, en wij maken een gratis online marketing scan voor je!

Gratis online marketing scan aanvragen

Online marketing trends
en inzichten ontvangen?

(maximaal 1x per maand)