Techreus Meta steelt boeken van Els Florijn en Mirjam van der Vegt: „Ik voelde eerst boosheid en woede, daarna verdriet”
Techreus Meta heeft miljoenen geroofde boeken uit een illegale Russische bibliotheek gebruikt voor het ontwikkelen van kunstmatige intelligentie (AI). Ook christelijke schrijvers zijn de dupe. De Auteursbond overweegt juridische stappen.

Al meer dan 350 auteurs reageerden op de actie ”Heeft Meta ook jouw werk gestolen?” die de Auteursbond begin deze maand lanceerde. Met het initiatief wil de belangenvereniging in beeld brengen welke auteurs en uitgeverijen zijn betrokken, om zo gezamenlijk stappen tegen Meta te kunnen zetten.
Begin dit jaar kwam aan het licht dat Meta, het moederbedrijf van Facebook, Instagram en WhatsApp, gebruikmaakt van werken uit Library Genesis (LibGen) voor het ontwikkelen van zijn AI-model Llama 3. Llama 3 is een geavanceerd taalmodel dat onder meer vragen in natuurlijke taal kan beantwoorden en kan brainstormen over ideeën. Topman Mark Zuckerberg gaf zelf toestemming voor het downloaden van de dataset uit LibGen, blijkt uit rechtbankdocumenten.
LibGen is een van de grootste illegale onlinebibliotheken ter wereld en bevat zo’n 7,5 miljoen boeken en 81 miljoen wetenschappelijke artikelen. Dit zijn in veel gevallen auteursrechtelijk beschermde werken, die gratis kunnen worden gedownload. De auteur krijgt er geen vergoeding voor. De database is van Russische oorsprong, verder is niet bekend wie erachter zit.
Diefstal
Het Amerikaanse tijdschrift The Atlantic heeft de lijst van geroofde boeken in LibGen doorzoekbaar gemaakt. Op de lijst staan onder meer werken van auteurs die veel gelezen worden in christelijke kring, zoals Els Florijn, Joke Verweerd, Mirjam van der Vegt, Sarah van der Maas, Marlies Medema en Adri Burghout.
Dat Meta deze illegale database gebruikt voor het verbeteren van haar AI-modellen, is pure diefstal, meent Noor van der Heijden, woordvoerster van de Auteursbond. „Het is onrechtmatig gebruik van auteursrechtelijk werk.”
Auteurs zijn boos, merkt ze. „Van de een staat er één boek in, van een ander een heel oeuvre. Het is ontluisterend om je titels te zien in een database zonder dat je er een cent voor hebt gekregen. Het is alsof er bij je thuis is ingebroken.”
Meta had auteurs eerst om toestemming moeten vragen en hun vervolgens een vergoeding moeten aanbieden, stelt Van der Heijden. De hoogte van die vergoeding vindt ze lastig te bepalen. In NRC noemt columnist Auke Hulst een bedrag van 5000 dollar per boek, te verdelen tussen uitgever en auteur. Hij baseert dit bedrag op een deal die softwarebedrijf Microsoft vorig jaar sloot met uitgever HarperCollins.
De Auteursbond broedt op tegenmaatregelen en is daarover in conclaaf met de Europese koepelorganisatie voor schrijvers, de European Writers’ Council. Daarnaast heeft de belangenbehartiger contact met de Franse auteursbond, die al een zaak tegen Meta heeft aangespannen.
Kunstroof
Of een rechtszaak tegen Meta veel kans van slagen heeft, waagt Arnoud Engelfriet van het Amsterdamse juridisch adviesbureau ICTRecht te betwijfelen. De jurist, die is gespecialiseerd in internetrecht en AI, ziet meerdere hobbels voor een succesvolle claim. „Allereerst moet de Auteursbond in de Verenigde Staten een rechtszaak aanspannen, want Meta zit in San Francisco en heeft in Nederland niets verkeerd gedaan. Ten tweede is het de vraag welk bedrag een reële vergoeding is voor het gebruik van boeken voor AI-training. Hier zijn geen prijslijsten of modellen voor, want dit is nog nooit gebeurd.”

Een algemeen probleem in het ICT-recht, zegt Engelfriet, is dat de praktijk veel sneller gaat dan het recht kan bijbenen. „Meta noemde dit lang geleden al ”move fast and break things”: ga het doen en zorg dat het een succes wordt, de scherven ruimen we daarna wel op. Dat is wat we hier in actie zien.”
Schrijfster Mirjam van der Vegt spreekt over „kunstroof”. Engelfriet heeft moeite met zo’n beladen term. Volgens hem gebeurt het vaker dat AI-ontwikkelaars hun systemen trainen op grootschalig, zonder toestemming verzamelde content.
„In de VS geldt een open norm van ”fair use” (eerlijk gebruik, MC), die het mogelijk maakt om iedere vorm van gebruik als eerlijk te verklaren als de onderbouwing goed genoeg is”, legt de jurist uit. „De rechter mag dat toetsen, en dat is voor het trainen van AI nog nooit gebeurd. Dus we kunnen niet met zekerheid zeggen of fair use geldt bij het trainen van AI door Amerikaanse bedrijven. In dit geval is de complicatie dat de gebruikte gegevens uit illegale bron komen, maar dat de gegevens op zich ook legaal verkrijgbaar zijn. Het zijn immers boeken en artikelen. Weegt de bron mee bij de bepaling? Ook dit is nog nooit bepaald.”