Research and Development 1/^Archief/2008-2009/Handschriftherkenning/Logboek
Inhoud
Logboek
week 1
week 2
In week 2 hebben zijn we op zoek gegaan naar een onderwerp en daarbij een onderzoeksvraag. In eerste instantie wilden wij graag iets doen over bayesiaanse netwerken.
week 3
In week 3 zijn we verder gegaan met het zoeken naar onderwerpen en mogelijke onderzoeksvragen. Doordat we niet echt het gevoel hebben dat we een toetsend onderzoek over bayesiaanse netwerken kunnen doen, maar juist alleen maar ontwikkelonderzoeken ("Is het mogelijk om x te maken?") hebben we besloten dat bayesiaanse netwerken geen goed onderwerp zou zijn.
Bijeenkomst 17-2
We zijn op dinsdag 17 februari bij elkaar gekomen om de knoop door te hakken. Het onderwerp wat we kiezen is handschriftherkenning. Onze onderzoeksvraag die we hier bedacht hadden was: "Zijn nieuwe manieren van input ook daadwerkelijk beter dan oude manieren van input". Hierbij doelde we op dat er veel technologische ontwikkelingen waren op het gebied van input (spraak- en handschriftherkenning, en touchscreens) maar zouden deze beter zijn dan bijvoorbeeld een muis en toetsenbord? We wilde dit meten door mensen beide manieren te laten proberen en dat ze vervolgens een cijfer aan beide manier zouden geven. Daarnaast wilde we ook testen hoe productief de verschillende manieren van input waren door bijvoorbeeld mensen een kleine tekst te laten schrijven.
Gesprek docent 20-2
We zijn op vrijdag op gesprek geweest bij Sjaak Smetsers. Hij was van mening dat onze onderzoeksvraag te breed was. We zullen dus onze vraag moeten versmallen. We dachten hierbij aan ons onderwerp te veranderen naar OCR ("Optical Character Recognition"). We zijn aan het denken om in ons onderzoek de kwaliteit van verschillende OCR applicaties met elkaar te vergelijken. We moeten hierbij dus nog een onderzoeksvraag bij moeten bedenken.
week 4
Bijeenkomst 04-3
Naar aanleinding van het gesprek met de docent zijn we nog eens bij elkaar gaan zitten om te kijken hoe we het onderzoek willen aanpakken. Besloten is dat de uiteindelijke onderzoeksvraag gaat worden 'Hoe goed is OCR-software bij het herkennen van kinderhandschriften'. Verder hebben we besproken wat we onder 'goed' en 'kinderen' verstaan en wat voor tekst we gaan gebruiken. Volgende dat we moeten beslissen is welke OCR-software we gaan toetsen en welke tekst we daarvoor gaan gebruiken.
week 5
Overleg 12-3
De tekst/testzinnen die we gaan gebruiken om de OCR-software te testen is nu bekend. We hebben gekeken naar de OCR software die we gaan gebruiken en hier een lijstje van gemaakt. Tim zal zijn neefjes en nichtjes de tekst op laten schrijven zodat we de OCR-software kunnen toetsen. Verder hebben we een mogelijk probleem. Het kan namelijk zijn dat de ene scanner beter in OCR is dan de andere (door kwaliteitsverschil van de scans bijvoorbeeld). We overwegen het scannen nu in duplo uit te voeren om te kijken of dit het geval is en inderdaad invloed heeft op de OCR.
week 6
Bijeenkomst 17 maart
In deze bijeenkomst hebben we besloten naast kinderen ook volwassenen in het onderzoek op te nemen. Dit hebben we gedaan zodat we dan het verschil tussen volwassenen en kind kunnen berekenen en er dus conclusies aan kunnen binden. Ook hebben we bij deze bijeenkomst besloten welke software we daadwerkelijk gingen gebruiken.
Bijeenkomst 18 maart
De resultaten waren niet geheel zoals verwacht. We zijn erachter gekomen dat er een verschil is tussen OCR en ICR software, waarbij OCR meer voor getypte tekst geschikt is en ICR voor handgeschreven tekst. ICR is een stuk minder ver dan OCR en vereist dat je het programma inleert. Maar omdat ICR software minder ver gevorderd is, is het ook lastiger om eraan te komen. We hebben bepaald dat we ook nog een poging doen om tekstjes op een geheel wit vel met een fijnschrijver te schrijven, dit om de leesbaarheid voor de scanner te verhogen.
Laatste update: Ben Siebert 20 mrt 2009 12:10 (UTC)