Wetenschap & techniek

Vertaalmachine denkt steeds meer als een mens

Google Translate is al jaren de onbetwiste bron voor iedereen die snel een tekst wil vertalen. Maar concurrenten van de vertaaldienst komen met steeds betere vertaaltechnieken.

Pieter Beens
19 June 2018 08:47Gewijzigd op 17 November 2020 04:10
Statische machinevertalingen leveren soms hilarische resultaten op en leiden vaak tot fouten als een vertaling weer wordt terugvertaald. beeld ANP, Piroschka van de Wouw
Statische machinevertalingen leveren soms hilarische resultaten op en leiden vaak tot fouten als een vertaling weer wordt terugvertaald. beeld ANP, Piroschka van de Wouw

Een conferentie met Google, Amazon en Facebook als hoofdsponsors: die moet toch gaan over technologie, apps en de allernieuwste smartphones? Niets is minder waar. De drie technologiereuzen –met een gezamenlijke marktwaarde van een slordige 1,8 biljoen dollar– verbonden vorig jaar hun naam aan een conferentie over machinevertalingen.

Net als Apple, het Chinese Baidu en tal van kleinere bedrijven investeren ze grote bedragen in technologieën die teksten ‘automatisch’ vertalen. Hun doel: de techniek zo perfectioneren dat computervertalingen niet meer van menselijke vertalingen te onderscheiden zijn. Dat ideaal komt steeds dichterbij.

Machinevertaling

Er zijn maar weinig consumenten die nog nooit Google Translate hebben gebruikt. De vertaaldienst bestaat al ruim tien jaar en vertaalt dagelijks meer dan 143 miljard woorden in zo’n 100 talen. Tot vorig jaar gebeurde dat via zogenaamde statistische machinevertalingen (SMT). Deze technologie analyseert eenvoudig gezegd bronteksten en vertalingen, waarna er een overzicht wordt gemaakt van elk woord en de juiste vertaling. Een flinke hoeveelheid kansberekeningen en hogere wiskunde produceert vervolgens een letterlijke vertaling van de brontekst.

Statische machinevertalingen leveren niet alleen hilarische resultaten op, maar leiden vaak ook tot fouten als een vertaling weer wordt terugvertaald. Vertaal bijvoorbeeld het Engelse ”translation matters” (”vertalen is belangrijk”) naar het Japans (”hon’yaku jikō”) en weer terug, en de vertaalmachine komt met een heel ander resultaat: ”the problem of translation” (”het probleem van vertalingen”).

Neurale netwerken

Door de opkomst van nieuwe technologieën lijken de dagen van de statische machinevertalingen echter geteld. Vorig jaar introduceerde Google een nieuwe versie van de vertaaldienst, gebaseerd op ”machine learning”. Daarbij wordt er gebruikgemaakt van zogenaamde neurale netwerken, die eigenlijk het menselijke brein nabootsen en continu nieuwe dingen leren. In tegenstelling tot statistische machinevertalingen hoeft er niet meer eens in de zo veel tijd een nieuwe database met vertalingen te worden geüpload, maar kunnen resultaten bijna direct worden verbeterd.

Toch moet de vertaalkwaliteit van de nieuwe versie van Google Translate het afleggen tegen een nog piepjonge concurrent. Het vorig jaar gelanceerde DeepL (deepl.com), een vertaalmachine van Duitse bodem, produceert in veel gevallen beduidend betere resultaten, daarbij geholpen door zijn eigen kunstmatige intelligentie.

Toch laten ook de resultaten van DeepL zien dat machinevertalingen voor bepaalde talen een stap te ver zijn. Sommige talencombinaties zijn nu eenmaal gemakkelijker in ingewikkelde berekeningen te vangen dan anderen. Bovendien zijn er niet altijd voldoende gegevens beschikbaar om een vertaalmachine voldoende te kunnen trainen.

BLUE-score

Door de opkomst van neurale netwerken kunnen vertaalmachines betere output realiseren met minder input. De kwaliteit van die output wordt gemeten met de BLUE-score, die automatisch vertaalde teksten vergelijkt met die van een menselijke vertaler.

Het idee achter BLUE is heel eenvoudig: hoe dichter een automatische vertaling bij een professionele menselijke vertaling komt, hoe beter die is. Daarom streven de bedrijven achter vertaaldiensten naar een zo hoog mogelijke BLUE-score. Toch is de BLUE-score niet het einde van alle tegenspraak. Een hoge BLUE-score voor de ene talencombinatie zegt immers niets over de kwaliteit van een andere talencombinatie. Bovendien is taal geen exacte wetenschap: er zijn meestal veel goede manieren om dezelfde tekst te vertalen, waardoor zelfs een perfecte vertaling een minder goede BLUE-score kan hebben.

Correcties

Desondanks lijken neurale netwerken de toekomst van vertaaldiensten te gaan uitmaken. Niet alleen worden de vertalingen steeds beter, dankzij de neurale netwerken kunnen vertaalmachines ook nog eens snel leren.

Het Amerikaanse bedrijf Lilt introduceerde vorig jaar als eerste bedrijf ”adaptieve machinevertalingen”, een technologie die leert van correcties in machinevertalingen en deze direct toepast in volgende vertalingen. Bijkomend voordeel is dat het vertaalprogramma voortdurend meer over taal en over de stijl van de gebruiker leert, zodat vertalingen ook steeds menselijker worden.

Miljardenmarkt

Terug naar Google, Amazon en Apple: waarom stonden deze bedrijven in de rij om een conferentie over machinevertalingen te sponsoren? Dat heeft niet in de laatste plaats te maken met het enorme potentieel van de markt voor machinevertalingen. De wereldwijde vertaalmarkt zal in 2021 naar verwachting bijna 47,5 miljard dollar waard zijn. De bedrijven achter de vertaalmachines willen daar graag een graantje van meepikken.

Bovendien kunnen bedrijven zoals Facebook hun gebruikers vasthouden door berichten automatisch in hun moedertaal te vertalen. Met de kennis van vertalingen kunnen ze ook nog eens besparen op de kosten die ze nu moeten maken om hun platforms te vertalen – iets wat jaarlijks snel miljoenen euro’s kost. En uiteindelijk geldt ook hier: kennis is macht. Wie de beste vertaaldienst biedt, trekt gebruikers en verzamelt kennis en kunde die kunnen worden omgezet in klinkende munt. Maar de snelle opkomst van DeepL laat zien dat de volgende klap weleens uit onverwachtse hoek zou kunnen komen.

RD.nl in uw mailbox?

Ontvang onze wekelijkse nieuwsbrief om op de hoogte te blijven.

Hebt u een taalfout gezien? Mail naar redactie@rd.nl

Home

Krant

Media

Puzzels

Meer