Research and Development 1/^Archief/2007-2008/Spraakcomputers/Pilot

Uit Werkplaats
Ga naar: navigatie, zoeken
Bagjoke.jpg

Research and Development 1

Patrick van Bommel
Sjaak Smetsers


 © comments



Pilot-onderzoek: Spraakgeneratie - Het gebruik van de stemmen van TomTom navigatiecomputers

Definities/specificering:

Na het gesprek met Erik en Sjaak hebben we moeten veranderen van ons hoofdonderwerp: het was te groots en te moeilijk: afstudeerniveau of zelfs hoger.

Daarom gaan we ons richten op een kleine gebied in deze Pilot: de stemmen gebruikt in een (Tom Tom) navigatiecomputer: welke wordt/worden het meest gebruikt en waarom? Op het internet zijn heel veel samples te beluisteren van stemmen die je voor je navigatiecomputer kunt dowloaden.

Deze varieren van gewone mannelijke of vrouwelijke stemmen in een bepaalde taal, tot de stemmen van acteurs en zangers,zoals Sarah Michelle Gellar en Ozzy Ozbourne.

In overweging nemen:

  • Is het de moeite waard? : Veel mensen gebruiken tegenwoordig een navigatiecomputer om van A naar B te kunnen komen. Veel mensen stellen deze in zodat ze de stem die aanwijzingen geeft, de hele rit door kunnen verdragen. Wij denken dat het als een niet te groot Pilot onderzoek, interessant en leuk is om te kijken wat mensen beweegt om een bepaalde stem te kiezen/downloaden.
  • Is het onderzoekbaar te maken? : Inmiddels wel: het is flink ingekrompen en voor een Pilot realiseerbaar. Veel mensen maken gebruik van een TomTom, waardoor we hopelijk een grote groep mensen in verschillende leeftijdscategorieën kunnen enqueteren.
  • Om welk vakgebied gaat het? : Kunstmatige Intelligentie, met als focus-gebied taal en spraak. Dit is relevant voor het thema van R&D1 dit jaar.
  • Is het doenlijk? : Zie specificering. Wij denken van wel omdat alle componenten makkelijk te vinden zijn.
  • Eventuele vervolgonderzoeken? : Verschil tussen Nederlands en Engels? Man en Vrouw? Nederlands en Vlaams? Bekende stemmen en onbekende stemmen?

Onderzoeksplan

Voor de bijeenkomst van 18 februari, een bespreking van ons onderzoeksplan met Sjaak en Eric, bij deze het onderzoeksplan.

Vraagstelling:

Wat beweegt mensen om een bepaalde stem te kiezen voor hun navigatiecomputer?

Methode

Doormiddel van het zoeken naar samples van de beschikbare stemmen, het beluisteren hiervan willen wij inzicht krijgen in wat de mogelijkheden zijn met betrekking tot stemkeuze voor navigatiecomputers. Vervolgens selecteren we enkele uiteenlopende stemmen, die we voorleggen aan wat proefpersonen die aan moeten geven wat ze van deze stem vinden, of ze hem zouden kiezen en waarom wel of waarom niet.

Uitwerking hiervan:
Samples
  • Mannelijk, Engels
  • Vrouwelijk, Engels
  • Mannelijk, Nederlands
  • Vrouwelijk, Nederlands
  • Sean Connery (Engels met accent)
  • Sarah Michelle Gellar (Amerikaanse actrice, populair bij tieners).


Vragen
Michiel heeft een vragenlijst gemaakt van 22 vragen. 22 vragen bij 6 samples wordt iets teveel van het goede. We moeten daarom ook nog een selectie maken van de vragen die wij het meest bij ons onderzoek vinden passen.
Veel vragen zijn dubbel, omdat bijvoorbeeld vraag 2 en 3 in een vraag kunnen: Als je hem aangenaam vindt, kun je je er niet aan ergeren, zeg maar. Dus misschien moeten we dit anders oplossen? De schaal bijvoorbeeld in het midden zetten en twee uitersten tegenover elkaar zetten. Vijf keuzerondjes ertussen en kijken waar mensen het meest naar neigen?
Gaby Schaap.jpg
Gaby SchaapResearch and Development 1 Remove this comment when resolved!


  1. Ik vind deze stem betrouwbaar overkomen
  2. Ik vind deze stem aangenaam
  3. Ik erger me aan deze stem
  4. De stem is goed verstaanbaar
  5. De woorden zijn duidelijk
  6. De stem is helder
  7. Ik kan de stem goed horen
  8. Ik voel me prettig bij deze stem
  9. Deze stem doet me denken aan iemand die ik ken
  10. Ik zou deze stem willen gebruiken in mijn TomTom
  11. Ik zou deze stem willen gebruiken om mail voor te lezen
  12. De stem klinkt natuurlijk
  13. De stem klinkt boeiend
  14. De stem klinkt krachtig
  15. De stem straalt vertrouwen uit
  16. De stem klinkt verlegen
  17. De stem klinkt spontaan
  18. De stem klinkt onzeker
  19. De stem klinkt bemoedigend
  20. De stem klinkt vreemd
  21. De stem klinkt verbaasd
  22. De stem klinkt vrolijk

De schaal van antwoorden is op dit moment:

Heel erg mee eens, Mee eens, Neutraal, Niet mee eens, Heel erg niet mee eens.

Misschien dat we dit dus tussen twee antwoorden kunnen zetten, zoals

Ik vind deze stem Aangenaam O O O O O O Ik erger me aan deze stem

Zoiets?

Verwerken resultaten

Zodra de enquete is uitgedeeld/opgestuurd, moeten we zorgen dat we de antwoorden verwerken. De criteria hangen af van de uiteindelijk te stellen vragen die we in de enquete zullen stellen.

We hebben enkele dagen om dit te doen en we moeten hier ook zeker wel de tijd voor kunnen nemen.

Theoretisch Kader


Navigatiecomputers zijn het hé-le-máál. Kijk in een willekeurige auto (en zelfs motoren tegenwoordig) eens naar binnen en je ziet of (bij stilstand) de zuignap eenzaam tegen de voorruit geplakt, of al (al rijdend) een grote lichtbron in de auto, die het letterlijke licht in de duisternis is.

De Navigatiecomputermarkt, gedomineerd door TomTom, is enkele jaren geleden in opgekomen. De kaarten verdwenen onder de stoelen en de zuignap werd op het raam geplakt.

Van A naar B komen kostte ineens veel minder moeite en massaal schaften Nederland en de rest van de wereld zo'n klein kastje met ingebouwde kaarten aan.

De computer vertelt je precies wat je moet doen. Je voert in waar je naartoe wilt, de GPS bepaalt waar je nú bent en hoppakee, binnen enkele minuten (afhankelijk van de te bereizen afstand) is er een route voor je uitgestippeld. Een vriendelijke stem vertelt je welke afslagen je moet nemen, verzoekt je vriendelijk om te draaien als je tóch nog verkeerd weet te rijden en laat je vol vrolijkheid weten, dat de bestemming is bereikt.

En die stem, daar willen wij eens naar gaan kijken.

Elke computer heeft een aantal vooraf ingeladen stemmen. Bij het instellen van je computer kun je kiezen welke stem je wilt. Per taal zijn er verschillende stemmen mogelijk. Zo zijn er mannen en vrouwenstemmen, Nederlandse en Vlaamse accenten, Brits Engels en Amerikaans Engels en verder ook nog talloze 'leuke' stemmen, die je kunt downloaden via internet.

Onze vraag is: waarom kiezen mensen voor een bepaalde stem?

Literatuur, websites en andere bronnen


Taakverdeling

  • Wiki bijwerken, zweep eroverheen: Gaby
  • Enquete: Michiel
  • Samples: Nurer
  • Samenstellen uiteindelijke enquete: allen
  • Verwerken resultaten: allen
  • Presentatie: Gaby en ?


Tijdschema

We lopen achter.
Na de bespreking met Sjaak en Eric en onze recapitulatie is er door vakantie volgens mij een hoop aan tijd doorheen geschoten. Dit is is niet de bedoeling. Deze week moeten we hard aan de slag om onze Pilot tot een goed einde te kunnen brengen.

Dit betekent: bij elkaar komen, actie ondernemen en bewijzen dat we 't zeker kunnen. Morgen moeten er vragen bedacht zijn en de enquete gemaakt. Volgende week moeten we presenteren, dit gaat dus de verkeerde kant op!

Als we het nu niet doen, gaat 't nooit meer goed komen.

Daarom hier een rooster voor de komende twee weken:

Maandag 9 maart: Bij elkaar komen ( 's avonds? Moet wel vrees ik! )

Dinsdag 10 maart: Enquete klaar en verspreiden (via internet? via vragenlijsten op uni? )

Woensdag 11 maart: Enquete is klaar -> SAMPLES!!! Liever gisteren dan vandaag. Vanavond enquete over de mail.

Donderdag 12 maart: We zitten nu hier en wat we hebben is een opzet voor de enquete, samples en wat overige ideeën. Wiki is bijna up to date, en we hebben nog een week en een dag.

Vrijdag 13 maart: Bij elkaar komen op de uni. 12.35 URD

Zaterdag 14 maart:

Zondag 15 maart:

Maandag 16 maart: Verwerken resultaten enquete?

Dinsdag 17 maart:

Woensdag 18 maart:

Donderdag 19 maart:

Vrijdag 20 maart: Presentatie! Meteen inschrijven zodat we nog wat speling hebben!

Opmerkingen

De spraaksoftware die ik voor OCT heb gebruikt is beperkt bruikbaar. Zal vanavond even de URL van deze website hier neerzetten. Er zijn verschillende stemmen en talen mogelijk, maar je kunt slechts een beperkt aantal zinnen gratis laten uitspreken of in ieder geval zonder registratie.
Doen we nog iets met die samples? Als Nurer computerzinnetjes gaat zoeken heeft hij wellicht toch wel iets aan de websites. Kan iemand hier die URL's nog even neerzetten?
Michiel van Lierop.jpg
Michiel van LieropResearch and Development 1 Remove this comment when resolved!



We gaan nu kijken of welke stemcomputers het meest aangenaam zijn om naar te luisteren.