Translate Milfy!

donderdag 11 juni 2015

Crowdsourcing in de taalkunde aflevering 2: Ancient Lives

door Marten van der Meulen

Weten jullie allemaal wat crowdsourcing is? Dat is het inzetten van Jan Modaal, Henk, Ingrid en ander Generaal Publiek voor allerlei zaken. Een vage definitie, maar het is ook eigenlijk best een vaag begrip. In de wetenschap is het minder vaag. Daar betekent crowdsourcing: het grote publiek data laten verwerken. Het is nauwelijks te overschatten hoe fijn dit voor wetenschappers is. Ook in de taalhoek is er een en ander te doen. Milfje bespreekt de komende tijd een aantal schitterende projecten. Weet je, als iedereen die wat te zeuren had over taal nou mee zou werken aan deze projecten, dan zou de wereld een stuk beter zijn. Aflevering 2: Ancient Lives



Een van mijn nieuwe lievelingswebsites is Zooniverse. Dat is een platform waar wetenschappers zogenaamde "citizen science" kunnen bedrijven. Wat wij zegmaar crowdsourcing noemen. Ze hebben schitterende projecten op allerlei gebied, varierend van planeten jagen tot kankerdata analyseren, maar ze hebben ook verschillende projecten in de humaniora. Een van die projecten richt zich op het ontcijferen van stukjes Oud-Griekse tekst.

Het project heet Ancient Lives. In dit project is het de bedoeling dat mensen stukjes papyrusrol transcriberen, die zijn gevonden in de Egyptische stad Oxyrhyncyhus (ook leuk als je nog een babynaam zocht). Door deze data te ontsluiten krijgen onderzoekers meer inzicht in het taalkundige gedrag van mensen in de Egyptische oudheid. Maar er wordt ook weleens een nieuw fragment van een gedicht van Sappho tussen gevonden...

Het is meteen duidelijk waarom computers dit niet zouden kunnen lezen: de stukjes papyrus zitten vol vlekken en scheurtjes. Het transcriberen is op het eerste gezicht heel eenvoudig. Eerst markeer je het midden van een karakter op het papyrus, en daarna ga je de letters van het bijgevoegd Griekse toetsenbord af, om te zien welke letter er het meest op lijkt. 

Op het eerste gezicht zei ik. Op het tweede gezicht valt het allemaal behoorlijk tegen. Het voorbeeldfragment is behoorlijk goed te lezen, maar de echte puzzels zijn dat een stuk minder. Het is uiteindelijk best moeilijk om te zien welke letters het nou zijn. De achtergrond is donker, en de letters springen er niet echt uit. Wat het wel fijn maakt is dat het om hele kleine fragmentjes gaat, van soms maar enkele letters. Je hebt dus wel redelijk snel iets bereikt. 

Wat ├ęcht jammer is, is dat je niks begrijpt van wat je doet. Het is alleen maar matchen, zonder dat je ook maar enig inzicht krijgt in wat er nou eigenlijk staat. Dat is echt heel jammer, want het levert helemaal geen smeuige anekdotes op over Grieks worstelen, of zelfs boodschappenlijstjes van voor de jaartelling. Toch is het aardig, en je helpt er mensen enorm bij.

Voor wie me dit vooral interessant lijkt, is docenten Grieks. De timing is wat ongelukkig zo vlak voor de zomervakantie, maar zou het niet een geweldige oefening zijn voor leerlingen om spelenderwijs het alfabet te leren herkennen? En ze helpen daar ook nog eens de wetenschap mee! Toegegeven, je leert niks over grammatica, maar je went wel aan het letterbeeld, en dat is bij Grieks al moeilijk genoeg.

Geen opmerkingen:

Een reactie plaatsen