Wetenschap & techniekIntegriteit

Wat doen ChatGPT en corruptie met de status van de wetenschap?

Integriteit is een groot goed voor wetenschappers. Ze danken daaraan een groot deel van hun naam en faam. Maar juist die onkreukbaarheid staat ernstig onder druk.

Bart van den Dikkenberg

3 February 2023 08:14Gewijzigd op 3 February 2023 11:19Leestijd 9 minuten

De grote publicatiedruk maakt het verleidelijk voor wetenschappers om te zoeken naar alternatieve wegen om artikelen te publiceren. Sommige neigen naar corruptie of fraude. beeld iStock

Het gaat deze keer niet om fraude zoals Diederik Stapel die heeft gepleegd. De hoogleraar sociale psychologie aan Tilburg University had jarenlang onderzoeksgegevens verzonnen en vervalst. Hij werd in 2011 ontslagen. Momenteel gaat het subtieler. Aan de artikelen mankeert het niet, maar zijn ze wel van de auteur die erboven staat?

Een van de oorzaken dat de integriteit van wetenschappers ter discussie staat, is de voortdurende druk om te publiceren. Zo verwacht het Radboudumc van zijn hoofdonderzoekers dat ze elke vijf jaar minstens zes artikelen publiceren in een gerenommeerd vakblad. Een gemiddelde Nederlandse wetenschapper schrijft er per jaar 1,8, telde het Rathenau Instituut.

Sommige onderzoekers lijken er weinig moeite mee te hebben dat de lat hoog ligt. Elke vijf dagen verschijnt een artikel waarboven hun naam prijkt.

Wereldwijd zijn er een paar honderd veelschrijvers. De meesten zijn natuurkundige. Zij werken vaak in teams, en boven elke publicatie komt de naam van ieder teamlid te staan. Artikelen met honderden tot duizenden auteurs zijn geen uitzondering bij het CERN, het Europese deeltjesfysicalaboratorium bij het Zwitserse Genève.

Niet alleen het aantal artikelen onder eigen naam is van belang voor een wetenschapper; het maakt ook uit in welk tijdschrift een artikel verschijnt. Wetenschappers publiceren bij voorkeur in uitgaven van bijvoorbeeld Nature en Science. Die hebben in het algemeen een hoge status die wordt afgemeten aan een hoge journal impactfactor.

Dat alles komt ten goede aan de ranking van de wetenschapper: hoe meer hij schrijft en hoe vaker zijn artikelen worden geciteerd, hoe hoger zijn h-index, ook wel de carrière-index genoemd. Deze index is vaak doorslaggevend bij het verdelen van geld en banen in de academische wereld. Voor een wetenschapper is het dus van groot belang om hoog op de h-index te komen. Kortom, wetenschap bedrijven is vandaag de dag een ratrace onder het motto: ”publish or perish” (publiceer of verdwijn) .

Die druk om te publiceren maakt het verleidelijk om te zoeken naar alternatieve wegen om artikelen te publiceren. Sommige rieken naar corruptie, plagiaat of fraude.

Artikelfabriek

Uitgevers van wetenschappelijke tijdschriften hebben afgelopen jaar ontdekt dat wetenschappers soms bureautjes inhuren om hun naam bij de auteurs van een artikel geplaatst te krijgen, terwijl ze niet aan het onderzoek hebben deelgenomen.

De bedrijfjes, paper mills (artikelfabrieken) genoemd, adverteren op socialemediasites, waaronder Facebook en Telegram. Meestal zijn de paper mills gevestigd in Rusland of een Oost-Europees land. Hun prijzen voor auteursplaatsen variëren van honderden tot duizenden dollars, al naargelang het onderzoeksgebied en het prestige van het tijdschrift.

„Wij vermoeden dat het publish or perish-verschijnsel een rol speelt bij auteurs die zich inlaten met dergelijke paper mills”, verklaart Tim Kersjes, hoofd integriteit van wetenschappelijk uitgever Springer Nature, desgevraagd. „Het is misschien anekdotisch, niet wetenschappelijk onderbouwd, bewijs, maar er zijn auteurs die ook gewoon hebben toegegeven tegenover ons dat dit de reden is.”

Arvind Narayanan, computerwetenschapper aan de Princeton University (VS), noemt dat „perverse prikkels die tot dit gedrag leiden”. Hij wijst met name op universiteiten die promoties beoordelen door artikelen in proefschriften op te tellen „zonder rekening te houden met hun kwaliteit of impact”.

Franchiseonderneming

Anna Abalkina, econoom aan de Vrije Universiteit van Berlijn, analyseerde in haar zoektocht naar fraudegevallen meer dan duizend advertenties op de Russischtalige website International Publisher. Ze herleidde de aanbiedingen op het web naar een frauduleus auteurschap van 460 gepubliceerde artikelen. Die waren samen goed voor ruim 6 miljoen euro.

International Publisher heeft franchiseondernemingen over de hele wereld. Het Russische bedrijf verhandelt niet alleen auteurschapsposities, maar schrijft voor veel geld ook artikelen voor gerenommeerde tijdschriften. Abalkina: „Het is een groeiend probleem.”

Alle wetenschappelijke uitgevers hebben ermee te maken, stelt Kersjes van Springer Nature. „Daarbij gaat het om het publiceren van frauduleuze en gefabriceerde artikelen. Ik wil benadrukken dat het gaat om een klein aandeel van alle publicaties wereldwijd. Maar Springer Nature neemt deze malafide pogingen om via een paper mill artikelen gepubliceerd te krijgen zeer serieus. Wij vinden die onacceptabel. Ze ondermijnen de validiteit en integriteit van de wetenschappelijke literatuur.”

Nijdig

Een hoofdredacteur van een niet nader genoemd gedupeerde tijdschrift, was „echt nijdig” toen hij over de fraude hoorde. „Ik weet dat er veel dingen te koop zijn, maar auteurschap? Het is gewoon te gek voor woorden. Dit is gewoon totaal onaanvaardbaar”, zei hij vorig jaar tegen Nature.

Wetenschappelijke bladen hebben inmiddels tientallen artikelen ingetrokken vanwege vermoedens van afwijkingen rond het auteurschap. Integriteitsspecialisten waarschuwen dat het probleem groter zal worden en dat er waarschijnlijk nog meer intrekkingen volgen. Kersjes: „Als we sterk vermoeden dat een artikel het werk is van een paper mill, kan dit reden zijn om de geloofwaardigheid ervan in twijfel te trekken en kunnen we overgaan tot intrekking. We willen de integriteit van de literatuur waarborgen. Lezers en onderzoekers moeten kunnen vertrouwen op de inhoud.”

Wetenschappelijke vakbladen zijn begonnen met het onderzoeken en intrekken van artikelen die aan het Russische bedrijf zijn gekoppeld. Tot nu toe heeft de internationale database Retraction Watch bijna 200 verdachte artikelen geïdentificeerd.

Een van de gedupeerde tijdschriften is het International Journal of Emerging Technologies in Learning. In juli 2022 heeft het vakblad dertig papers ingetrokken die waren gekoppeld aan activiteiten van International Publisher. Het wetenschappelijke tijdschrift meldde daarbij dat de artikelen verband hielden met een „criminele artikelfabriek die auteurschappen en artikelen verkoopt voor publicatie in verschillende onlinetijdschriften aan betalende klanten”.

ChatGPT

Een andere bedreiging voor de integriteit van de wetenschap is de komst van ChatGPT, een kunstmatig intelligente chatbot die in opdracht realistische teksten van hoog niveau kan genereren. Deze ontwikkeling leidt ertoe dat „de experts niet kunnen bepalen wat waar is of niet”, vreest Sandra Wachter, technoloog van de Oxford University. Wetenschappers maken zich daarover grote zorgen.

Wetenschappelijke uitgevers hebben software in gebruik om artikelfabrieken, verzonnen resultaten, dubbele inzendingen en plagiaat te herkennen. Thomas Lancaster, onderzoeker academische integriteit aan het Imperial College London, constateert dat ChatGPT eerder is te onderscheppen dan een artikel uit een artikelfabriek. Maar ook tekst die is geproduceerd door ChatGPT glipt gemakkelijk door de mazen van het net.

Tijdens een recent Amerikaans onderzoek passeerden alle teksten die uit ChatGPT rolden de digitale plagiaatcontrole. Van de wetenschappelijke samenvattingen die de chatbot maakte, passeerde 34 procent van de samenvattingen probleemloos een kunstmatig intelligent controlesysteem. Menselijke recensenten behaalden een vergelijkbare score. „ChatGPT schrijft geloofwaardige wetenschappelijke samenvattingen”, concludeerden de onderzoekers.

Als wetenschappers niet kunnen vaststellen of onderzoek echt is of verzonnen, heeft dat „ernstige gevolgen”, vreest Wachter van Oxford University. Niet alleen voor de integriteit van de wetenschap, maar ook voor de samenleving als geheel.

Beleidsmakers baseren zich geregeld op wetenschappelijk onderzoek. Zij zouden totaal verkeerde beslissingen kunnen nemen als ze afgaan op neponderzoek. Artikelen op basis van verzonnen onderzoek naar geneesmiddelen kunnen zelfs de veiligheid van mensen in gevaar brengen.

Wetenschappers pleiten ervoor om teksten die ChatGPT heeft gegenereerd uit wetenschappelijke publicaties te bannen. Maar dat is nog niet eenvoudig.

Uitgever Springer Nature kiest er vooralsnog voor ChatGPT of vergelijkbare programma’s toe te staan als hulpmiddel. Maar dan moet de auteur dat wel verantwoorden in zijn artikel. Kersjes van Springer Nature: „We staan nadrukkelijk niet toe dat ChatGPT als coauteur wordt vermeld. De reden is simpel: auteurs van een wetenschappelijk artikel worden geacht verantwoordelijkheid te dragen voor de inhoud, en ChatGPT kan dat niet.”

Het Russische bedrijf International Publisher verhandelt niet alleen auteurschapsposities, maar schrijft voor veel geld ook artikelen voor gerenommeerde tijdschriften. beeld iStock

Waarschuwing

Ook studenten hebben ChatGPT ontdekt. Wat wetenschappers zorgen baart, is dat de studenten niet alleen schrijfwerk gaan uitbesteden aan de chatbot, maar ook hun denkwerk. Studenten laten het kunstmatig intelligente systeem bijvoorbeeld onderzoeksvragen bedenken, samenvattingen schrijven of antwoorden op tentamenvragen formuleren. Om die reden heeft de Radboud Universiteit studenten woensdag gewaarschuwd om ChatGPT niet te gebruiken. Het hulpmiddel is niet toegestaan en gebruik ervan valt binnen de definitie van fraude of plagiaat, benadrukt de universiteit.

Studenten kunnen met gemak afstuderen op een tekst die ChatGPT heeft geschreven. Dan Gillmor, docent journalistiek aan de Arizona State University (VS), legde de chatbot een opdracht voor die zijn studenten ook van hem krijgen. Het artikel dat ChatGPT genereerde, zou een student een goed cijfer hebben opgeleverd. „Dit betekent het einde van het essay”, verwacht Lilian Edwards, student innovatie aan de Engelse universiteit van Newcastle.

Een groot probleem is dat ChatGPT geen nieuwe wetenschappelijke inzichten oplevert, omdat het slechts bestaande gegevens herschikt tot nieuwe tekst. De chatbot heeft geen begrip van de wereld, geen motivatie en geen moreel kompas. Bovendien levert een opdracht aan ChatGPT soms aannemelijk klinkende, maar onjuiste of onzinnige teksten op.

Er is een nieuwe aanpak nodig, constateren de uitgevers van wetenschappelijke tijdschriften. Om de wetenschappelijke integriteit te redden, heeft de internationale conferentie over machine learning ICML in januari alvast een verbod afgekondigd op artikelen die volledig of voor een deel zijn geschreven door een chatbot.

Eén ding is alvast duidelijk: om vast te stellen of een tekst is geschreven door een kunstmatig intelligente chatbot, isook een kunstmatig intelligent detectieprogramma nodig . Zoals de GPT Zero-app van Edward Tian, student informatica van Princeton University (VS). De app achterhaalt aan de hand van statistische kenmerken of een tekst door een mens of door een slim programma is geschreven. Volgens testen voldoet GPT Zero „matig”.

Open AI, de maker van ChatGPT, lanceerde woensdag de detectietool AI Text Classifier. Erg betrouwbaar is dat programma nog niet. In Engelstalige testen herkende het programma 26 procent van de teksten geschreven door ChatGPT. „Een stuk betrouwbaarder dan andere systemen die ChatGPT proberen te herkennen”, schrijft Open AI. Maar het programma beoordeelt 9 procent van de door mensen geschreven tekst verkeerd. Bij minder dan duizend tekens is de tool „erg onbetrouwbaar”. Of digitale plagiaatsoftware, GPT Zero en AI Text Classifier in staat zullen zijn om de rotte appels van de wetenschap eruit te vissen, valt dus nog te bezien.