Wij zoeken een PHP programmeur

Semantische dichtheid als ranking signaal

Semantische dichtheid als ranking signaal

Vorige week berichtte we al dat een patent van Google uit 2004 was toegekend dat de factoren die van invloed zijn op de waarde van een link beter beschrijft. Nu heeft het weblog Seo by the Sea achterhaald dat Google wederom een patent toegekend heeft gekregen en ook hier gaat het om een patent uit 2004. Ditmaal gaat het echter om een heel ander onderwerp, namelijk semantische dichtheid als ranking signaal.

Ranking signalen

De ranking van websites per zoekopdracht gebeurd op basis van het algoritme van Google. Dit algoritme houdt rekening met meer dan 200 factoren. Sommige van deze factoren wegen zwaarder dan anderen. Helaas zijn niet alle 200 factoren bekend. Gelukkig leren we er steeds meer kennen. Dankzij het net toegekende patent weten we er weer één: semantische dichtheid.

Semantische dichtheid

Een aantal van de factoren houden rekening met de kwaliteit en betrouwbaarheid van een pagina, andere factoren letten meer op de relevantie van de pagina ten opzichte van de zoekopdracht. Een eenvoudige indicator voor zoekmachines is natuurlijk of de woorden uit de zoekopdracht ook daadwerkelijk terugkomen op een pagina. Wanneer de woorden vaker terugkomen kan de pagina nog relevanter lijken voor de zoekopdracht.

Een andere indicator voor de relevantie ten opzichte van de zoekopdracht is hoe dicht sommige van de gebruikte termen bij elkaar staan. Hoe dichter bij termen bij elkaar staan, hoe nauwer ze aan elkaar gerelateerd zijn. Er kan uiteraard eenvoudig worden berekend hoe dicht sommige woorden bij elkaar staan in de tekst. De opmaak en structuur van een webpagina brengt echter wat meer uitdagingen met zich mee. Om dit duidelijk te maken gebruiken we het voorbeeld van een ongeordende lijst van Seo by the Sea:

Feiten over Saturnus

  • Een baan om de zon duurt 10.759,2 dagen;
  • Rotatie periode duurt 10 uur en 13 minuten;
  • Massa is 95 keer zo veel als de aarde;
  • Volume is 744 keer zo veel de aarde;
  • Afstand van de zon is 1.429 miljoen kilometers.

Stel dat bovenstaande lijst op een webpagina te vinden is. Wanneer we woorden gaan tellen staat “rotatie” dichter bij het woord “Saturnus” dan “volume”. Omdat ieder item in de lijst echter over Saturnus gaat kan er gezegd worden dat ze allemaal even relevant zijn voor Saturnus, ondanks dat ze visueel gezien niet allemaal even dicht bij het woord “Saturnus” (in de titel) staan. De bovenstaande pagina zou dus relevant kunnen zijn voor zoektermen als “massa saturnus” of “volume saturnus”.

Het pas toegekende patent beschrijft hoe de semantische dichtheid meegenomen kan worden, rekening houdend met de structuur en opmaak.

HTML-opmaak en structuur

Het bestuderen van de opmaak en structuur speelt dus een rol bij de bepaling van de relevantie van een pagina ten opzichte van de zoekopdracht. Hierbij kan er gekeken worden naar titels, kopjes (<h1> t/m <h6>), ongeordende (<ol>) en geordende lijsten (<ul>), tabellen, divs, line breaks (<br>), en andere onderdelen.

Titels kunnen een <h1> tag gebruiken, of een grotere font size, en de tekst eronder hoort waarschijnlijk bij de titel. Met andere woorden: de zoekmachine probeert visuele structuren te achterhalen die meer zeggen over waar de pagina over gaat (zoals een lijst van items met een bijbehorende titel). Met betrekking tot een lijst geeft ons dit de volgende informatie:

  1. Wanneer beide termen in hetzelfde lijst item staan worden ze als aanverwant gezien.
    In het voorbeeld: “baan” en “zon” uit het eerste lijst item
  2. Wanneer een term in een lijst item staat en een andere term in de titel van de lijst, dan staat dit paar (de twee termen) even dicht bij elkaar als een ander paar (titel van de lijst en term in een ander lijst item).
    In het voorbeeld: “Saturnus” en “rotatie” staan even dicht bij elkaar als “Saturnus” en “volume”
  3. Paren van termen in verschillende lijst items staan verder uit elkaar dan de paren die vallen onder 1 of 2.
    In het voorbeeld: “rotatie” en “volume” staan verder uit elkaar dan “Saturnus” en “rotatie”

Voor het voorbeeld hierboven geldt dat het titelwoord “Saturnus” dichterbij “afstand” (uit het laatste lijst item) staat dan de woorden “dagen” en “rotatie”, ondanks dat deze visueel gezien dichter bij elkaar staan.

Slot

Het nieuwe patent van Google laat het belang van een juiste opmaak en goede structuur zien. Door juist om te gaan met html, structuren, titels, kopjes en lijsten kan Google beter bepalen waar een pagina over gaat. Met deze informatie heeft u dus meer controle over hoe uw pagina gelezen wordt door zoekmachines en kunt u beter aangeven aan zoekmachines waar uw pagina over gaat.

4 Reacties op “Semantische dichtheid als ranking signaal”

  1. Wat denk ik ook steeds belangrijker wordt is waar een site in de “core” over gaat.

    Stel je hebt een website met miljoenen pagina’s en op al die pagina’s komen bepaalde keywords voor. Dan zal Google zeer waarschijnlijk de relatie van dergelijke woorden toetsen aan onderliggende pagina’s en de relevantie daarvan meenemen.

    Als “bewijs” voor die theorie kun je ook het “keyword” gedeelte in Google Webmaster Tools bekijken.

  2. @ Seth Rietdijk: hoe meer onderwerpen je website behandelt, hoe lastiger het wordt om duidelijk aan zoekmachines aan te geven waar je site en pagina’s over gaan. Een goede structuur (bijvoorbeeld silo structuur) kan mogelijk helpen om gerelateerde pagina’s te groeperen, maar je hebt gelijk als je zegt dat het moeilijker wordt.

    Goede tip van de Google Webmaster Tools. Geeft snel een beeld van de meest gebruikte zoekwoorden.

  3. @Jeroen… als een website veel onderwerpen behandeld (zoals bijvoorbeeld een encyclopedie) dan blijft het in in de core een “encyclopedie”. Aan “encyclopedie” kun je dan bepaalde synoniemen of gerelateerde woorden koppelen (oa: definitie, betekenis, achtergrond etc.) en onderliggende pagina’s daarmee laten varieren.

    Zo krijg je simplistisch gezegd (en in een perfecte internetwereld) ook de meest schone zoekmachine index.

  4. @Seth: dat zou inderdaad de ideale situatie zijn. Helaas bestaat deze perfecte internetwereld nog niet en kan een grote hoeveel pagina’s het zoekmachines nog wel eens lastig maken om het onderwerp te bepalen. Wel wordt het steeds beter en kunnen ze het overkoepelende thema beter bepalen heb ik het idee.

Reageer