Computers zijn dom, ook in 2015. Ze doen wat ze wordt opgedragen en bedenken zelf niets. Dus ook niet dat je agendacode ‘SQ 323’ betekent dat jouw vlucht morgenochtend om 6:55 uur vanaf Schiphol vertrekt. En dat je dan om 3:55 uur gewekt wilt worden. Als je telefoon jou toch uit zichzelf op tijd wekt, komt dat maar door één ding: metadata.

Metadata is data over data die we niet uit de data zelf kunnen aflezen. Een kroegfoto op je laptop is een verzameling pixels, maar daarover kun je veel dingen zeggen: wie er op de foto staan, wat de naam van de kroeg is, hoe laat en op welke dag de foto genomen is, wat de lengte- en breedtegraad zijn, en dat het überhaupt om een foto gaat.

Deze extra data maakt de foto waardevoller. Want je kunt de foto nu terugvinden op je harddisk door te sorteren op de datum waarop de foto is genomen. En je kunt ook zoeken naar alle foto’s waarop je favoriete stapmaatje Bob staat. Of naar alle bestanden die betrekking hebben op Bob. Dus ook mails, filmpjes en documenten.

Garbage in, garbage out

Als je een computer niet tot in detail uitlegt wat iets precies betekent, kan het apparaat er nooit chocola van maken. Je kunt een nieuwsbericht zien als één grote verzameling tekens. Probeer uit die brij van letters, cijfers en leestekens maar te achterhalen welke reeksen datums zijn. En vervolgens wat deze datums betekenen: datum van publicatie, datum waarop Jantje iets aan Pietje vroeg, datum waarop iets plaatsvond?

Maar als je de data structureert en metadateert, creëer je hiërarchie en context. Met andere woorden: de computer weet dan wat een brokje data betekent. En dan is diezelfde computer een handig – en al snel onmisbaar – hulpmiddel.

Dus als in jouw agenda een vluchtnummer staat (inclusief de metadata die zegt dat het een vluchtnummer is), dan is het voor die computer een koud kunstje om dat vluchtnummer op internet op te zoeken en je te laten weten of de vlucht vertraging heeft. Of om te bepalen hoe laat je vanaf je huidige locatie moet vertrekken om op tijd bij de gate te zijn. Kortom, iets is voor een computer pas een vluchtnummer als je ‘m dat vertelt.

Van zoekresultaten naar het antwoord op je vraag

Met het voorbeeld van het vluchtnummer wordt duidelijk waar we naartoe bewegen: de zoekopdracht die maar één resultaat oplevert: het juiste antwoord. Dat is waar Google Now en Siri om draaien. Hoe laat vertrekt mijn vlucht? Is de supermarkt bij mij in de straat nog open? Het gaat daarbij om personalisatie en context. Wat wordt wanneer aan wie getoond en waarom?

Soorten metadatering

HTML is een vorm van metadatering. De tags vertellen je wanneer iets een titel is of een paragraaf, maar dat zegt nog niets over de inhoud. Alleen over de presentatie ervan: toon dit als titel, toon dat als paragraaf.

Interessanter wordt het met tags zoals <title> of <meta name=”description” content=”korte samenvatting van de inhoud van de pagina”>; deze tags vertellen waar een pagina specifiek over gaat. Of de tag <em> die je kunt gebruiken in plaats van <i>: de eerste geeft aan dat je iets wilt benadrukken (‘emphasize’), de tweede dat iets schuin gedrukt staat (‘italic’).

De volgende en laatste stap is dat je vertelt dat een brokje data een persoon betreft, met voornaam, achternaam, tussenvoegsel, adres, telefoonnummer, etc. Of een evenement, een boek, een productaanbieding, een review… Hiermee komen we terecht bij het semantische web waar specifieke technologieën zijn ontwikkeld voor betekenistoekenning aan data.

Metadata gaat over hoe informatie getoond wordt (denk aan het organische zoekresultaat van Google) of helpt bijvoorbeeld bij de analyse van data (de computer weet dat iets als telefoonnummer of vluchtnummer geïnterpreteerd moet worden).

Snel scoren met metadata

Hoe kun je, zonder direct expert te hoeven worden op het gebied van RDFa, Microdata, Schema.org, OWL en XML, je website eenvoudig toegankelijker maken met metadata?

  1. Denk na over de betekenis van je paginacontent en gebruik HTML-tags die de betekenis vatten in plaats van de opmaak.
  2. Maak optimaal gebruik van de HTML-tag; welke meta-informatie kun je hierdoor aan je pagina meegeven?
  3. Bepaal of, en zo ja welke, contentonderdelen een persoon zijn, een locatie, product, evenement, organisatie, film, boek of recensie. Gebruik vervolgens schema.org om ze te metadateren. Een handige tool hiervoor is schema-creator.org of Google hulp.
  4. Bepaal zelf wat op Twitter wordt getoond als een link naar je content wordt geplaatst met Twitter Cards.
  5. Facebook heeft iets soortgelijks (wel uitgebreider): Open Graph (wordt ook door andere social diensten gebruikt).

Fotocredits: Ryan Ozawa


6.998 keer gelezen Geschreven door