Categorieën
Historisch bedrijf

AI is geen historicus, maar schrijft wel geschiedenis

AI is geen historicus, maar schrijft wel geschiedenis

Historici reageren met een mengeling van angst en woede op de opmars van kunstmatige intelligentie (AI). De hooivorken liggen klaar nu scripties automatisch gegenereerd worden en academische managers een eindeloze stroom tech-utopisme over ons heen storten. De meeste historici krijgen inmiddels braakneigingen bij alles wat naar AI riekt en spreken zich afkeurend uit over ChatGPT en aanverwante technieken. De robots kunnen nooit wat wij kunnen! Milieuvervuiling! Plagiaat! Wij hebben dit niet nodig!

Hoezeer ik de strijd tegen managers en scriptieslop ook steun, kritisch nadenken over AI vraagt meer dan moraliserende afkeuring. Kunstmatige intelligentie zal niet meer weggaan. En juist daarom doen we er goed aan om kritisch en realistisch na te denken over de impact van AI op ons vakgebied. In dit schrijven doe ik daartoe een poging. Niet door me af te vragen of AI wel of geen historicus kan zijn, maar door te reflecteren op de gevolgen voor de onderzoekspraktijk. Mijn stelling is dat AI zorgt voor nieuwe vormen van overvloed. Deze ontwikkeling vraagt niet om goed- of afkeuring, maar om denkwerk.

AI is geen mens

Voor ik mijn stelling uit de doeken doe, eerst wat begripsverheldering. Het gaat er namelijk nogal onstuimig aan toe in discussies over AI. Tal van collega’s keuren AI inmiddels categorisch af. Kunstmatige intelligentie slurpt drinkwater, veronachtzaamt intellectueel eigendom en maakt ons simpelweg dommer, zo is de stemming. Veel van dit soort statements zijn gebaseerd op misinformatie en een onvermogen de technologie los te zien van de sociaal-economische context waarin technologie functioneert.1Zo wordt de invloed van individuele prompts schromelijk overdreven, stoelt grootschalige paniek over cognitieve degeneratie op buitengewoon twijfelachtig onderzoek, is de ontwikkeling van vormen van AI die niet op diefstal en uitbuiting gebaseerd zijn al in volle gang, hoeft AI niet per se racistische stereotypen te reproduceren en zijn we echt niet verplicht om AI bij techkapitalisten af te nemen (dat kan gewoon op je laptop).

Belangrijker is echter dat veel van dit soort moraliserende weerstand voortkomt uit de neiging om AI te vermenselijken. Het klagen over de economische, ecologische en cognitieve gevolgen van de AI-revolutie komt vaak voort uit het beeld van AI als een autonome agent. Dit is ook precies het beeld dat Sam Altman en de andere techkapitalisten ons voorhouden: AI is de perfecte therapeut, werknemer of scriptieschrijver. Door hierin mee te gaan en te zeggen dat AI dat allemaal niet is, beperken we het debat echter tot een vrij doelloze welles-nietes over vermenselijkte techniek.

Een visie die radicaal en realistisch is begint bij het identificeren van AI als productiemiddel enerzijds, en informatietechnologie anderzijds. Ik zal me voornamelijk op dit laatste aspect richten. Dit laat niet onverlet dat de sociaal-economische context waarin AI gebruikt en toegeëigend wordt, bevraagd moet worden. In een ideale wereld is Sam Altman verbannen naar Elba, zijn de techbedrijven genationaliseerd en wordt de door AI gerealiseerde productiviteitsgroei vertaald in publiek eigendom in plaats van winst. Ook deze strijd is niet gebaat bij passief moralisme, maar bij een kritische analyse van de wijze waarop kapitalisten (al veel langer) het publieke domein kapen, het sociale surplus opslurpen en de democratie om zeep helpen.

AI als informatietechnologie

Het vermenselijkte beeld van AI staat niet alleen een kritische politieke analyse in de weg, maar verhult ook de daadwerkelijke veranderingen in de historische onderzoekspraktijk. We krijgen de impact van AI op de geschiedwetenschap scherper in beeld als we het grote taalmodel zien als een informatietechnologie. ChatGPT mag dan de show stelen als therapeut of scriptieschrijver, maar binnen de geschiedwetenschap is AI vooral een techniek die informatie identificeert, ordent, sorteert, en samenvat. Hiermee staan de taalmodellen in een lange lijn van informatietechnologieën zoals de microfilm, het internet of Google Scholar.

Deze technieken zorgen vooral voor nieuwe vormen van overvloed. Met het internet of de microfilm kunnen we vooral nieuwe informatie in nieuwe vormen gebruiken. Dat vraagt om kritische reflectie, maar ook om nieuwe vormen van denken en doen over informatie, simpelweg omdat veel van dit soort technologie niet verdwijnt. Ook AI dwingt ons tot denkwerk en wel over een nieuwe overvloed aan bronnen en onderzoeksobjecten.

Een overvloed aan bronnen

Allereerst zorgt kunstmatige intelligentie voor de snelle groei van het aantal bronnen dat voor historici toegankelijk is. Dit komt vooral tot uiting in de digitalisering van bronmateriaal. Kranten, boeken, manuscripten en handschriften worden gedigitaliseerd met “HTR” (Handwritten Text Recognition) of “OCR” (Optical Character Recognition). Lang bleef digitalisering beperkt tot seriële bronnen zoals kranten of parlementaire handelingen. In de afgelopen jaren is het scannen en transcriberen breder toegepast. In Nederland zijn bijvoorbeeld VOC-archieven recent gedigitaliseerd. Daarnaast zijn veel vakgenoten inmiddels verslingerd aan Transkribus en wordt digitalisering op kleine schaal steeds gebruikelijker.

De techniek achter digitalisering verschilt niet wezenlijk van wat tegenwoordig voor AI doorgaat. Ondanks dat OCR en HTR werken met afbeeldingen en ChatGPT met tekst, gebruiken ze alle drie neurale netwerken die getraind zijn op enorme datasets om tekstuele en visuele structuren te herkennen en te verwerken. Meer recente (AI-)modellen zijn vooral sneller en beter. Kunstmatige intelligentie is dus een techniek die de bestaande digitalisering vooral versnelt.

Hoewel AI veel mogelijk maakt, is de digitalisering niet louter een succesverhaal. Het is nog altijd onduidelijk hoe we precies wegwijs worden in al die scans. Infrastructuurprojecten en archieven beloven directe doorzoekbaarheid “à la Google”. Met zoektermen of ‘Linked Open Data’ kan alles altijd in één oogopslag gevonden worden, zo klinkt het uit de archief- en infrastructuurwereld. Deze retoriek is gestoeld op de misvatting dat informatie zonder representatie kan. Google sorteert resultaten op basis van complexe algoritmes (en ordinaire betaling) en is dus allerminst een manier om breder of efficiënter te zoeken.

Tussen de historicus en de bron staat altijd een ordening; een reeks representaties die het zoekresultaat ontegenzeggelijk beïnvloeden. Het gebruik van zoektermen of gelinkte entiteiten geeft ons niet direct een beter overzicht, maar een andere ordening. En de nieuwe ordeningen zijn geenszins perfect, zo bleek maar weer uit de kritiek op het Stadsarchief Amsterdam. Zoektermen zorgen voor tunnelvisie (hoewel dat niet per se hoeft) en “Linked Open Data” heeft naar mijn weten nog nooit tot iets geleid.

Dat betekent geenszins dat we krampachtig vast moeten houden aan de bestaande archiefcatalogus, -index of -inventaris, zoals historici soms doen. Dit soort systemen zijn immers ook ordeningen, en niet bepaald geschikt voor de nieuwe overvloed. De uitdaging is dus om zoekpraktijken te ontwikkelen die ons in staat stellen soepel door massa’s materiaal te bewegen, zonder dat dat leidt tot bijvoorbeeld cherry-picking of anachronistisch zoektermgebruik. Dit denkwerk hoeven we gelukkig niet alleen te doen. Archiefwetenschappers, taalkundigen en statistici hebben genoeg te zeggen over ordening, digitale curatie, corpora als bron, en manieren om de diversiteit, representativiteit en geschiktheid van digitaal doorzoekbare data in te kunnen schatten. Maar een uitwisseling met deze vakgebieden moet wel opgestart worden.

Een overvloed aan onderzoeksobjecten

De invloed van AI reikt verder dan alleen het vergroten van de toegankelijkheid van historische bronnen. Het vermogen van taalmodellen om steeds beter te begrijpen wat er in teksten staat, creëert ook een overvloed aan onderzoeksobjecten. We kunnen niet alleen meer bronnen sneller vinden, we kunnen ook meer verschillende aspecten in die bronnen identificeren, classificeren en analyseren.

In recent onderzoek laat collega Arjan van Dalfsen zien hoe taalmodellen kunnen worden ingezet om attitudes ten opzichte van dieren te onderscheiden in vroegmoderne teksten. Hij gebruikt een groot taalmodel om onderscheid te maken tussen tien verschillende houdingen – afkomstig uit een bestaande theorie – en laat het model vervolgens aangeven in welke passages zulke houdingen voorkomen. Vergelijkbaar onderzoek gebruikt taalmodellen om bijvoorbeeld te identificeren of een tekst over een bepaalde gebeurtenis gaat of om complexe metaforen op te sporen.

Dergelijke classificatiemethoden zijn op zichzelf niet nieuw. Onder de noemer “distant reading” proberen onderzoekers al veel langer tekstuele patronen te gebruiken om geesteswetenschappelijke en historische vragen te beantwoorden. Wat echter verandert, is de mate van complexiteit die nu geoperationaliseerd kan worden. Waar eerdere technieken vooral werkten met oppervlakkige kenmerken zoals woordfrequenties of trefwoorden, zijn grote taalmodellen in staat om abstracte en contextafhankelijke concepten te herkennen: metaforen, toonzetting, impliciete waarderingen of ideologische lading. Om mezelf toch een menselijke metafoor toe te staan: het is alsof iedere historicus nu beschikt over een annoterende student-assistent.2 Voordat mij nu een werkgeversideologie verweten wordt: de student-assistenten hoeven we niet weg te bezuinigen, maar kunnen nu ingezet worden voor interpretatie- en schrijfwerk.

Kortom, AI zorgt ervoor dat we een veel breder scala aan theorieën en concepten kunnen operationaliseren. Hiermee kunnen we veel grotere vragen beantwoorden of bestaande antwoorden bevragen. Met de opgespoorde attitudes kan Arjan bestaande ideeën over de veranderende houding tussen mens en dier testen. Met metafoordetectie kan discoursanalyse nieuwe lagen van betekenis blootleggen die voorheen moeilijk te kwantificeren waren. En met sentimentanalyse of ideologiedetectie kunnen we politieke of morele onderstromen in tekstcorpora in kaart brengen, niet alleen op het niveau van woorden, maar ook op het niveau van narratieven en argumentatieve structuren.

Overigens hoeft deze epistemische overvloed niet te betekenen dat we allemaal sociale wetenschappers moeten worden en ons onderzoek hoeven te beperken tot het zielloos draaien van regressiemodelletjes. Juist het vermogen om te classificeren maakt van taalmodellen een geschikt middel om classificatie te bevragen. Het opsporen van ambiguïteit en uniciteit kan bij uitstek met technieken die juist algemene patronen en herhaalbare structuren weten te vangen. Door modellen in te zetten die geneigd zijn om te groeperen, te standaardiseren en te vereenvoudigen, kunnen we zichtbaar maken waar dergelijke vereenvoudigingen tekortschieten. De kracht van AI ligt dan niet alleen in het herkennen van overeenkomsten, maar ook in het blootleggen van de uitzonderingen – de gevallen die niet netjes in categorieën passen, die botsen met de aannames van het model, of die op meerdere manieren te interpreteren zijn.

De overvloed aan onderzoeksobjecten vraagt echter ook om meer dan optimisme en revolutionaire retoriek. Het is heel leuk dat theorieën en analytische concepten beter te operationaliseren zijn, maar dan moeten we wel weten wat voor theorieën en concepten we eigenlijk willen gebruiken. Bovendien is er nog veel onduidelijk over de beperkingen van grote taalmodellen. In welke mate moeten we ze finetunen op historisch materiaal? Hoe kunnen we inzicht krijgen in de denkstappen die het model maakt tijdens classificaties? En hoe rapporteren we dit soort onderzoek eigenlijk?

Het mag duidelijk zijn dat AI ons confronteert met veel vragen over het karakter van ons eigen vakgebied. Zoals wel vaker functioneert technologie als een contrastvloeistof die bestaande zwaktes, spanningen en angsten in onze discipline blootlegt. AI mag daarom geen historicus zijn, maar schrijft wel degelijk geschiedenis.

Ruben Ros is postdoctoraal onderzoeker aan de Universiteit Utrecht. Hij houdt zich bezig met computationele tekstanalyse, politieke geschiedenis, en de ontwikkeling van technocratisch denken in politiek debat.