Hoe werkt een zoekmachine

Zoekmachine · Tags:

De werking van een zoekmachine is op zich niet zo moeilijk te begrijpen. De intelligentie die achter de software zit van zoekmachines is echter zeer complex.

searchengines

Om te beginnen bestaat een zoekmachine uit vier componenten:

  • de gebruikersinterface (hetgeen jij ziet als je bijvoorbeeld Google.nl intoetst)
  • de spider of crawler
  • de database
  • de software die de rangschikking (ranking) van de resultaten bepaalt (het algoritme)

De spider of de crawler

De spider of crawler is een soort browser die de bron van een HTML document doorloopt. De spider neemt de tekst op en slaat deze op in de database. Ook worden de links gevolgd (zowel de interne links als de externe) zodat het werk van een spider in feite nooit ophoudt. Na een link, volgt er wel weer een andere. Een Webmaster van een website kan zelf aangeven of hij wilt dat een spider wel of niet zijn pagina’s indexeert en de links volgt. Dit kan op twee manieren, per pagina bepalen of via een zogenaamde robots.txt bestand. In dit laatste bestand staat in een bepaalde syntax wat een spider wel en niet mag doen binnen een website.

De database

De database van een zoekmachine bestaat uit meerdere database centra die, zoals bij Google, over de hele wereld verspreidt staan. Daarom kan het voorkomen dat de positie van een webpagina per land kan verschillen. Zeker als Google net een database update is begonnen. Een database update kan maandelijks gebeuren. Dan worden alle nieuwe pagina’s die de afgelopen maand zijn gevonden samen met de bestaande pagina’s  in de totale database weer opnieuw gerangschikt. Hierdoor kunnen dan weer verschillen ontstaan in de plaatsbepaling van een pagina.

De software (algoritme)

Hoe het ranking berekeningsprogramma (algoritme) van een zoekmachine werkt weet niemand. Ook bij Google weten de programmeurs dat niet exact. Zou je dat wel weten, dan zou je zeer rijk kunnen worden omdat je dan de zoekmachine kan manipuleren om met jouw site bovenaan te staan. Vroeger kon men de zoekmachine wel een beetje manipuleren, maar vandaag is dat niet meer mogelijk.

Wel kun je een website zo inrichten dat de pagina’s zo optimaal mogelijk zijn ingericht voor de zoekmachines. Dit heet SEO (Search Engine Optimization) of Zoek Machine Optimalisatie. Het is bijvoorbeeld belangrijk dat je domeinnaam de belangrijkste sleutelwoorden van het onderwerp van je website bevat. Ook is het belangrijk dat in titels, headers en subheaders, je content en de bestandsnaam van een webpagina de belangrijkste sleutewoorden bevatten van die pagina. Op die manier kan de zoekmachine jouw pagina(s) beter rangschikken op relevantie.

Bijvoorbeeld een website met informatie over fruitbomen:

  • gewenste domeinnaam: fruitbomeninformatie.nl (a GEEN streepjes gebruiken, dus niet: fruitbomen-informatie.nl)
  • Titels van pagina’s (van verschillende fruitbomen) bijvoorbeeld:
    • pagina met appelbomen
      • Titel: Informatie over appelbomen
      • bestandsnaam: appelbomen.html
      • header tekst: Hoe kweek je appelbomen
      • Content af en toe gevarieerd het woord appelboom gebruiken
      • Links naar andere (zelfde website) pagina’s: zorg dat de linknaam de sleutelwoorden bevatten van de pagina waar naartoe gelinked wordt. Een lang van de appelboom pagina naar de perenboom pagina zou dan heten: “Klik hier om naar de perebomen informatie te gaan
    • pagina met perenbomen
      • zelfde als boven maar dan met de naam ‘peer’
    • pagina met sinaasappelbomen
    • etc.

Voor meer gedetailleerde informatie over hoe je een website hoort te optimaliseren kun je vinden bij seowebontwerp.nl

Enter 468x60 Google AdSense Code Here

Comments

Schrijf een reactie!