Wetenschap23 mei 2000

„Hoi Jan komma nieuwe alinea”

Het gevoel is hetzelfde als die ervaring van de eerste keer fietsen zonder handen aan het stuur. Je praat tegen de computer en het apparaat noteert wat je zegt, zonder dat je het toetsenbord aanraakt.

Dicteersoftware voor algemeen gebruik is al twee jaar te koop, maar de kwaliteit ervan viel tegen. De software vereiste niet alleen een sterke computer, maar ook veel geduld van de gebruiker. Bij een test van deze krant, anderhalf jaar geleden, scoorden de drie toonaangevende merken niet meer dan matig.

De komst van de Pentium III-processor heeft daar verandering in gebracht, en intussen is de software de kinderschoenen ontgroeid. Voor de Nederlandse taal zijn er twee bekende producten: FreeSpeech van Philips en Voice Xpress van L & H. Philips introduceerde vorig najaar de versie FreeSpeech 2000; L & H bracht in maart haar versie 4.0 op de markt en verwacht dit najaar versie 5.0.

Een belangrijke verbetering van de huidige software is dat je vrijwel op normale spreeksnelheid kunt dicteren. Dat werkt echter pas goed als het programma gewend is geraakt aan de stem van de gebruiker. Die moet daarvoor eerst een reeks zinnen voorlezen aan de computer. Intussen went de gebruiker aan het voorlezen van de leestekens: „Hoi Jan komma nieuwe alinea ja komma kijk maar eens goed...”

Elke nieuwe gebruiker moet opnieuw het programma trainen, want anders bakt de computer er weinig van. De (minimale) duur van de trainperiode is kort: zeven minuten (L & H) tot een kwartier (Philips), vergeleken met een tot anderhalf uur bij de versies van twee jaar geleden.

Nauwkeurigheid
De belangrijkste vraag is natuurlijk: Hoeveel fouten maakt de computer? De twee programma's doen nauwelijks voor elkaar onder. Zonder training is de kwaliteit al behoorlijk. Bij een test met een eenvoudig krantenartikel en een spreeksnelheid van 110 woorden per minuut herkent zowel Philips als L & H gemiddeld negen van de tien woorden. Dat klinkt goed: 110 woorden betekent zo'n 650 aanslagen per minuut, sneller dan welke typiste ook. In de praktijk valt met 10 procent fouten echter nauwelijks te werken, want dat betekent één fout in elke regel. Het corrigeren daarvan is lastig. Het gaat niet om het verschil tussen een d of een t –die haalt de ingebouwde spellingchecker er al uit– maar om verkeerd herkende zinspatronen, bijvoorbeeld: „een flinke tik bal door de pas” in plaats van „een flinke tippel door het bos”.

Na het doorlopen van de training werkt de software nog lang niet foutloos: 7 (L & H) tot 8 (Philips) procent van de woorden wordt niet herkend. Dat zijn echter grotendeels (plaats)namen en termen die ontbreken in het lexicon: Middelharnis, vermoeiends, sportbenodigdheden. Als de niet herkende woorden apart worden toegevoegd aan het programma, gaat de foutscore omlaag tot 1,5 (L & H) à 2 (Philips) procent. Heel acceptabel.

De nauwkeurigheid hangt ook af van de spreeksnelheid. 110 woorden per minuut is iets lager dan het normale spreektempo. De meeste sprekers zitten bij een normaal gesprek tussen de 140 en 180 woorden per minuut. Bij een test met 150 woorden per minuut daalt de nauwkeurigheid tot een foutscore van 4 à 6 procent.

Beide programma's beloven dat ze zelflerend zijn, zodat ze na enkele weken beter gaan presteren. Ze hebben daar ook een extra voorziening voor: 'voed' de software met schrijfsels van de spreker, zodat het programma zijn jargon en stijl beter leert kennen.

Vlotte pc
Zowel FreeSpeech als Voice Xpress werkt in allerlei tekstverwerkers. Een vlotte pc is wel vereist. De test is uitgevoerd met een Pentium III, 500 Mhz en Windows 2000 als besturingssysteem. Ondanks de 256 megabyte werkgeheugen werkt andere software beduidend trager zodra een van de spraakherkenningsprogramma's actief is. Dat is vooral merkbaar bij Philips FreeSpeech. Wie een van de programma's wil aanschaffen, doet er goed aan royaal boven de minimaal aangegeven systeemvereisten te zitten.

Philips levert bij FreeSpeech een 'muis met oren', de SpeechMike, een speciale microfoon met trackball en luidspreker. Het is even wennen aan het gebruik ervan en bij langer dicteren is het niet prettig om de hele tijd met de microfoon in je handen te zitten, zeker niet als je fouten met de hand wilt corrigeren.

Die correcties kun je ook 'handsfree' uitvoeren met spraakcommando's. Beide programma's zijn daarin erg flexibel en accepteren allerlei verschillende commando's voor dezelfde opdracht: „maak deze regel vet”, „de volgende vier woorden twintig punten maken” of „deze alinea één centimeter inspringen”. Voice Xpress heeft hierin meer mogelijkheden dan FreeSpeech.

Samengevat: spraakherkenningssoftware is gebruiksvriendelijk, levert goede resultaten en gaat het ontstaan van een muisarm tegen. Wie echter gewend is na iedere vijf getikte woorden er vier te schrappen, heeft er weinig aan. Hoewel: versie 5.0 van Voice Xpress filtert zelfs het „uhmm” van aarzelende sprekers weg. Het is vooral handig voor het dicteren van teksten, voor het schrijven van vlotte informele briefjes of voor e-mail. Als je die tenminste aan iedereen die in de buurt van je pc zit, wilt laten horen...

”Voice Xpress 4.0”, van Lernout & Hauspie, Ieper, België, 2000; ƒ 399,- (de versie Standard 4.0 kent geen natuurlijke opdrachten voor Word en kost ƒ 99,-
Minimale systeemeisen: Windows 95 of hoger, Pentium II-processor, 300 Mb schijfruimte, 64 Mb RAM (aanbevolen: 96 Mb).

”FreeSpeech 2000” van Philips, Wenen, Oostenrijk, 1999; ƒ 269,- (incl. SpeechMike ƒ 399,-)
Minimale systeemeisen: Windows 95 of hoger, Pentium 166, 50 Mb schijfruimte, 48 Mb RAM (aanbevolen: 64 Mb, in combinatie met Microsoft Word: 96 Mb).