Thomson Reuters wint eerste grote zaak om AI-auteursrecht
De eerste grote juridische strijd over AI en auteursrecht is beslecht: Thomson Reuters heeft zijn zaak gewonnen tegen startup ROSS Intelligence. Deze rechtszaak draait om de vraag of het gebruik van auteursrechtelijk beschermde data om een AI-systeem te trainen is toegestaan als 'fair use' (redelijk gebruik). Het oordeel van de rechter – waarin hij het fair use-verweer van ROSS verwierp – zet een belangrijk precedent. In dit artikel bespreken we de achtergrond van de zaak, de argumenten van beide partijen en waarom de rechter fair use afwees. Ook kijken we naar de bredere implicaties voor ontwikkelaars van generatieve AI, de impact op Silicon Valley en andere AI-bedrijven die afhankelijk zijn van auteursrechtelijk beschermde datasets. Tot slot behandelen we de reacties uit de industrie en academische wereld (waaronder Cornell-professor James Grimmelmann) én de mogelijke vervolgstappen voor AI-bedrijven: kunnen ze zich aanpassen of moeten ze hun strategie herzien?
Achtergrond van de zaak
Thomson Reuters is eigenaar van Westlaw, een toonaangevend juridisch researchplatform. Westlaw bevat vrijwel alle jurisprudentie uit de VS en voorziet elke uitspraak van zelfgeschreven headnotes – korte samenvattingen van de juridische kernpunten in die zaak. Daarnaast ordent Westlaw die headnotes in een genummerd Key Number System om gerelateerde uitspraken over hetzelfde juridische onderwerp te groeperen. Deze door jurist-redacteuren gemaakte toevoegingen bieden juristen snelle inzichten in rechtspraak.
ROSS Intelligence was een legal tech startup (opgericht rond 2014) die een AI-gedreven juridisch zoekinstrument wilde bouwen. Het idee was dat advocaten in natuurlijke taal vragen konden stellen en relevante jurisprudentie als antwoord kregen. Zo’n AI vergt training met veel voorbeeldvragen en juiste antwoorden. ROSS had daarvoor juist behoefte aan de gestructureerde kennis uit Westlaw’s headnotes en Key Number System. In 2015 benaderde ROSS Thomson Reuters om een licentie te nemen op deze data, maar Thomson Reuters weigerde – waarschijnlijk omdat een dergelijk AI-zoekproduct zou concurreren met Westlaw.
Toen een rechtstreekse licentie mislukte, zocht ROSS een alternatieve route. Het huurde het bedrijf LegalEase Solutions in om zogeheten “Bulk Memos” te maken – dit waren grote sets juridische vragen met bijbehorende antwoorden, over uiteenlopende rechtsproblemen. Advocaten bij LegalEase gebruikten Westlaw’s headnotes als referentie om die vragen en antwoorden op te stellen (met instructie ze niet letterlijk te kopiëren). De Bulk Memos dienden als trainingsmateriaal voor ROSS’ AI-algoritme. In feite had ROSS zo toegang tot de essentie van Westlaw’s gecureerde inhoud, zonder formeel iets van Thomson Reuters te kopen.
Thomson Reuters kwam erachter hoe ROSS aan de data kwam en spande in mei 2020 een rechtszaak aan tegen ROSS Intelligence. Het verwijt: ROSS had zonder toestemming omvangrijke delen van Westlaw’s door Thomson Reuters geschreven content overgenomen om een concurrerend product te bouwen. Dit zou inbreuk op het auteursrecht van Thomson Reuters opleveren, en bovendien contractbreuk (tortious interference) omdat LegalEase vermoedelijk Westlaw’s gebruiksvoorwaarden schond. ROSS ontkende inbreuk en beriep zich op fair use – het Amerikaanse concept van redelijk gebruik – en stelde dat het gebruik van de data gerechtvaardigd was om een nieuw, transformerend AI-systeem te trainen.
Verloop en actuele status
Jarenlang werd er geprocedeerd. In eerste instantie leek het erop dat een jury zich over de feiten moest buigen omdat de rechter in 2023 oordeelde dat niet alle vragen bij voorbaat beantwoord konden worden. ROSS heeft tijdens het proces ook een antitrust-tegenvordering ingediend (het beschuldigde Thomson Reuters van misbruik van monopoliepositie), maar die claim werd door dezelfde rechter verworpen. De juridische strijd was bovendien slopend voor ROSS: de startup moest eind 2021 haar activiteiten staken onder druk van de hoge proceskosten. Toch zette ROSS de juridische verdediging voort. In februari 2025 kwam U.S. Circuit Judge Stephanos Bibas (zittend als districtsrechter) uiteindelijk tot een summary judgment-uitspraak die gunstig uitpakte voor Thomson Reuters. Het was de eerste rechterlijke beslissing in de VS die expliciet oordeelde over fair use in de context van AI-trainingsdata – een mijlpaal die door de hele tech-industrie scherp werd gevolgd.
Het geschil: auteursrecht vs. fair use
Auteursrechtelijke positie van Thomson Reuters. De kern van Thomson Reuters’ zaak was dat de door haar samengestelde headnotes en het Key Number-systeem origineel, creatief werk zijn, en dus beschermd door het auteursrecht. Hoewel gerechtelijke uitspraken zelf niet onder copyright vallen (in de VS zijn rechterlijke uitspraken publieke domein), voegt Thomson Reuters met de headnotes een menselijke selectie en samenvatting toe. De headnotes “distilleren, synthetiseren of leggen (delen van) een juridisch opinie uit” en halen daarmee de vereiste minimale creativiteit om voor auteursrecht in aanmerking te komen. Zelfs wanneer een headnote letterlijk een passage uit het vonnis citeert, wordt dat gezien als een creatieve keuze: de redacteur koos precies dat fragment als de kern van het juridisch punt, wat getuigt van redactionele originaliteit.
De rechter ging mee in dit standpunt. Hij oordeelde dat de Westlaw-headnotes, zowel individueel als in hun verzameling, voldoende origineel zijn om door auteursrecht beschermd te worden. Daarmee stond vast dat Thomson Reuters een geldig auteursrecht op deze content heeft – een essentiële eerste stap voor de rest van de zaak.
Beschuldiging van ongeoorloofde kopieeractie
Vervolgens voerde Thomson Reuters aan dat ROSS (via LegalEase) deze beschermde content feitelijk had gekopieerd. LegalEase had immers Westlaw geraadpleegd om de Bulk Memos op te stellen, en die memo’s bleken inhoudelijk sterk op de headnotes te lijken. De rechter stelde een diepgaand vergelijkend onderzoek in naar duizenden headnotes en de corresponderende vragen in de Bulk Memos. Daarbij vond hij bewijzen van substantiële overname: van bijna 3.000 onderzochte headnotes waren er 2.243 waarvan de taal “zeer nauw aansloot bij de bewoordingen van de Bulk Memo-vraag, en niet bij de taal van de uitspraak zelf”. Met andere woorden, het materiaal van Thomson Reuters was herkenbaar terug te vinden in ROSS’ trainingsdata. ROSS had dus zonder toestemming een omvangrijke hoeveelheid auteursrechtelijk beschermde tekst overgenomen.
Verweer van ROSS: fair use
Dat ROSS de Westlaw-content (indirect) gekopieerd had, was moeilijk te ontkennen – de vraag was of dit door fair use gerechtvaardigd werd. ROSS betoogde van wel. Het stelde dat het de headnotes niet voor een concurrerend naslagwerk gebruikte, maar als trainingsmateriaal voor een AI, wat een ander doel zou dienen (transformatief gebruik). Het AI-systeem “bestudeerde alleen de taalpatronen” van de headnotes om vragen aan uitspraken te koppelen, en reproduceerde niet zomaar Westlaw’s creaties. Bovendien was het uiteindelijke product – een AI juridische assistent – een innovatie die de samenleving ten goede komt, vergelijkbaar met hoe zoekmachines of andere tools tijdelijk kopieën maken in het ontwikkelproces (intermediate copying). ROSS probeerde zich zo te beroepen op rechtspraak waarin kopiëren als tussenstap is toegestaan, bijvoorbeeld in softwareontwikkeling of data-analyse.
Thomson Reuters hield echter vol dat ROSS’ gebruik allesbehalve beperkt of transformeert was: de AI werd juist getraind om Westlaw’s door mensen geschreven inzichten na te bootsen en zo een concurrerende juridische zoekdienst te bieden. ROSS profiteerde commercieel van Thomson Reuters’ redactionele keuzes zonder toestemming of vergoeding, wat volgens Thomson Reuters niet onder redelijk gebruik kon vallen. De vraag voor de rechtbank was dus of deze inzet van Westlaw-data voldoende fair use was om niet als inbreuk te gelden.
Waarom het fair use-verweer van ROSS verworpen werd
Rechter Bibas boog zich over de vier factoren van het fair use-toetsingskader in het Amerikaanse auteursrecht: (1) het doel en karakter van het gebruik, (2) de aard van het oorspronkelijke werk, (3) de hoeveelheid en substantieel karakter van het overgenomen deel, en (4) het effect op de potentiële markt of waarde van het werk. Hij kwam tot de conclusie dat geen van deze factoren genoeg in het voordeel van ROSS uitsloeg om het kopiëren te rechtvaardigen – met name factor (1) en (4) werkten sterk in het voordeel van Thomson Reuters.
Doel en transformatief karakter
Bij de eerste factor keek de rechter of ROSS’ gebruik “anders van aard of doel” was dan het origineel en dus creatief hergebruikte (transformative use), of dat het vooral een commerciële substituut opleverde. Hoewel ROSS een nieuw AI-product ontwikkelde, was dit product bedoeld om rechtstreeks te concurreren met Westlaw’s eigen legal research functionaliteit. De AI zou advocaten antwoorden geven die ze anders via Westlaw’s headnotes en zoeksystematiek zouden krijgen. Bibas oordeelde daarom dat ROSS niet zozeer iets nieuws creëerde met de informatie, maar vooral Westlaw’s toegevoegde waarde nabootste voor commercieel gewin. Het transformatieve gehalte woog dus gering. In plaats van bijvoorbeeld kritische analyse of parodie (klassieke voorbeelden van fair use), had ROSS de content gebruikt om een vergelijkbaar dienst te bouwen. Dit deed denken aan simpelweg “een concurrerend product maken” in plaats of naast Westlaw, hetgeen deze factor in het voordeel van Thomson Reuters deed uitvallen.
Aard van het werk
De tweede factor – de aard van het oorspronkelijke werk – gaf ROSS op het eerste gezicht iets meer lucht, maar was niet doorslaggevend. Westlaw’s headnotes zijn een mix van feiten (juridische uitkomsten die op zichzelf niet beschermd zijn) en creatieve samenvatting. Dergelijke semi-feitelijke werken genieten iets minder sterke auteursrechtelijke bescherming dan pure fictie of kunst. De rechter erkende dat dit factor twee richting fair use zou kunnen duiden, maar dit woog volgens hem niet zwaar genoeg om de andere factoren te neutraliseren, zeker gezien de duidelijke commerciële insteek van ROSS’ gebruik.
Omvang van de overname
De derde factor – hoeveelheid en kern van het overgenomen materiaal – viel ongunstig uit voor ROSS. Het betrof hier niet een klein citaat of een incidenteel fragment, maar duizenden case-samenvattingen die systematisch waren benut. ROSS had daarmee substantieel “het hart” van Westlaw’s toegevoegde waarde overgenomen: de door jarenlange arbeid opgebouwde dataset van juridische headnotes. De rechter zag dit als een omvangrijke kopieeractie die verder ging dan nodig voor enig redelijk doel. Het feit dat LegalEase probeerde de headnotes niet letterlijk te kopiëren maakte weinig verschil, aangezien de Bulk Memos inhoudelijk sterk leunden op Thomson Reuters’ expressieve keuzes.
Markteffect en potentiële schade
De cruciale vierde factor is volgens rechter Bibas het effect van ROSS’ gebruik op de markt voor Thomson Reuters’ werk. Hierover was hij bijzonder duidelijk: ROSS’ AI-zoekdienst was bedoeld als vervanging van Westlaw in de markt van juridische research-tools. In zijn oordeel schreef hij: “Even taking all facts in favor of Ross, it meant to compete with Westlaw by developing a market substitute.”
Met andere woorden, ROSS richtte zich op hetzelfde publiek (juristen) met een vergelijkbare dienst, en gebruikte daarvoor Thomson Reuters’ eigen content. Dit ondermijnt de huidige en toekomstige inkomsten van Thomson Reuters: elke klant die voor ROSS zou kiezen in plaats van Westlaw, dankzij de kwaliteit die rechtstreeks te danken is aan Westlaw’s gegevens, betekent marktverlies voor Thomson Reuters.
Bovendien benadrukte de rechter dat niet alleen de directe concurrentie op de juridische zoekmarkt telt, maar ook de potentiële licentiemarkt voor dergelijke data. Thomson Reuters heeft zijn headnotes zelf (nog) niet in licentie gegeven voor AI-training, maar de mogelijkheid bestaat wel. Als AI-bedrijven deze data zonder toestemming gebruiken, verdwijnt de vraag naar licenties – wat een vorm van marktderving is. “Het doet er niet toe of Thomson Reuters de data zelf al gebruikt om AI te trainen; de impact op een potentiële markt voor AI-trainingsdata is voldoende,” stelde Bibas, en hij merkte op dat ROSS onvoldoende bewijs had geleverd dat zulke markten niet zouden ontstaan of geraakt worden.
Gezien het sterk commerciële karakter van ROSS’ gebruik en het rechtstreekse marktconflict met Westlaw vond de rechter dat de factoren (1) en (4) zwaar tegen fair use pleitten. Factor (2) bood ROSS weinig hulp en factor (3) werkte eerder in Thomson Reuters’ voordeel door de grote hoeveelheid content die was overgenomen. De balans viel daarmee uit in het nadeel van ROSS. Rechter Bibas trok een harde conclusie: “None of Ross’s possible defenses holds water. I reject them all.” Het beroep op fair use werd volledig verworpen en hij stelde vast dat ROSS inbreuk had gemaakt op Thomson Reuters’ auteursrechten. Thomson Reuters kreeg summary judgment toegekend op de inbreukvraag, waarmee de aansprakelijkheid van ROSS vaststaat (alleen nog details als eventuele schadevergoeding zouden later door een jury bekeken kunnen worden).
Bredere implicaties voor generatieve AI-ontwikkelaars
Deze uitspraak – de eerste in zijn soort – heeft de aandacht getrokken van de hele technologie- en creatieve sector. Generatieve AI-systemen, zoals grote taalmodellen (ChatGPT enzovoort) en AI-afbeeldingsgeneratoren, worden immers getraind op enorme hoeveelheden data, waaronder ontelbare auteursrechtelijk beschermde teksten, afbeeldingen, muziek en code. Tot nu toe opereerden veel AI-bedrijven in een grijs gebied: men ging er stilzwijgend van uit dat het verzamelen en gebruiken van internetdata als trainingsmateriaal min of meer mocht, bijvoorbeeld als fair use of onder impliciete toestemmingen. Deze zaak laat echter zien dat rechthebbenden bereid zijn om dat aan te vechten – en dat ze kunnen winnen.
Voor generatieve AI-ontwikkelaars is het vonnis van Bibas een potentiële wake-upcall. Fair use was tot nu toe een sleutelformule in de juridische verdediging van AI-bedrijven die zonder expliciete licentie data verzamelen. Techbedrijven stellen dat hun AI’s bestaande werken “bestuderen” om vervolgens iets nieuws te creëren, en dat dit vergelijkbaar is met hoe mensen leren van boeken om later zelf iets te schrijven. Auteurs, kunstenaars en andere rechthebbenden hebben daarentegen betoogd dat AI-modellen feitelijk nieuwe content genereren die concurreert met hun werk (bijvoorbeeld een AI-afbeelding in de stijl van een bepaalde kunstenaar), en dat het ongecontroleerd kopiëren van hun gehele oeuvres onrechtvaardig is. In dit brede debat biedt Thomson Reuters v. ROSS nu de eerste blik op hoe een rechter ertegenaan kijkt.
Het beeld is niet gunstig voor de AI-bedrijven. De rechter heeft hier duidelijk gemaakt dat fair use grenzen kent, zeker wanneer een AI-bedrijf de creatieve input van een ander commercieel exploiteert. Dit zou wel eens navolging kunnen krijgen in andere lopende zaken. In de VS lopen momenteel tientallen copyrightzaken tegen AI-ontwikkelaars, variërend van een groepszaak van auteurs tegen OpenAI’s GPT-modellen tot een rechtszaak van visuele kunstenaars tegen beeldgenerator Stability AI, en procedures rond muziek- en codegebruik. Cornell-professor en internetjurist James Grimmelmann waarschuwt dat als deze beslissing als precedent wordt gevolgd, dit “heel slecht is voor generatieve-AI-bedrijven”. Het vonnis suggereert volgens hem dat veel jurisprudentie waar AI-bedrijven zich op beroepen – zoals eerdere fair use-uitspraken over data-analyse en tijdelijk kopiëren – hier mogelijk “irrelevant” is geworden. Met andere woorden, de argumenten die tot nu toe zijn aangevoerd om AI-training te rechtvaardigen, overtuigen wellicht niet als de rechter het gebruik niet als voldoende transformatief ziet of vreest dat er een vervangend product ontstaat.
Dit betekent dat bedrijven als OpenAI, Google, Microsoft en Meta, die allemaal inzetten op generatieve AI, hun juridische positie met zorg moeten heroverwegen. Waar zij aanvankelijk misschien vertrouwden op een ruime interpretatie van fair use, zullen ze nu rekening houden met strenger toezicht. We zien nu al dat sommige spelers voorzichtiger worden. Zo is ROSS een voorbeeld van hoe een startup door juridische tegenwind geheel tot stilstand kan komen, terwijl de kapitaalkrachtige techgiganten zich beginnen in te dekken met data-licentiedeals en grote juridische teams. Het vonnis in Thomson Reuters v. ROSS zou de AI-sector kunnen dwingen tot een professionele inhaalslag op het gebied van copyright compliance: van Wild West naar gereguleerder gebruik van trainingsdata.
Gevolgen voor Silicon Valley en AI-bedrijven
Silicon Valley’s innovatiemodel – “move fast and break things” – loopt tegen de harde muur van het auteursrecht aan. AI-bedrijven, groot en klein, zullen hun omgang met data moeten aanscherpen. Deze zaak toont dat gevestigde contentbedrijven zoals Thomson Reuters bereid zijn hun intellectuele eigendom fel te verdedigen, en dat ze kans van slagen hebben. Voor startups en investeerders in AI is dit een waarschuwing: het zomaar gebruiken van beschermde datasets van derden kan leiden tot dure rechtszaken die een bedrijf kunnen verlammen.
De geschiedenis van ROSS Intelligence illustreert dit gevaar. ROSS had innovatieve technologie en een veelbelovend product, maar beschikte niet over de diepe zakken om een jarenlange juridische strijd vol te houden. Het resultaat was bedrijfsbeëindiging nog vóór er een definitieve uitspraak kwam. Grotere techbedrijven zoals Google en OpenAI hebben weliswaar de middelen om zich in de rechtbank te verdedigen of schikkingen te treffen, maar ook voor hen zijn de risico’s toegenomen. Een nederlaag zoals ROSS die leed, al is het op een specifiek terrein (juridische data), kan een precedent scheppen dat ook elders toegepast wordt. Bedrijven die afhankelijk zijn van grote hoeveelheden content – denk aan social media, zoekmachines, nieuws-aggregators en AI-labs – moeten vrezen dat rechthebbenden nu sterker staan. We kunnen meer claims en minder vrijblijvendheid verwachten. Zo zou de muziek- en filmindustrie zich gesterkt kunnen voelen om stevig op te treden tegen ongevraagd gebruik van hun catalogi als AI-trainingsmateriaal, nu een rechter duidelijk partij koos voor de contentproducent.
Anderzijds zullen AI-ontwikkelaars in Silicon Valley nieuwe samenwerkingsmodellen moeten zoeken met de contentindustrie. We zien de eerste contouren hiervan: Getty Images klaagde een AI-image-generator aan voor het gebruik van miljoenen foto’s en dwong zo aandacht af voor licenties; schrijvers en nieuwsuitgevers onderhandelen met AI-firma’s over compensatie. In juli 2023 sloot de Associated Press bijvoorbeeld een deal om een deel van haar nieuwsarchief in licentie te geven aan OpenAI als trainingsdata. Dergelijke initiatieven wijzen op een verschuiving: van het stiekem scrapen van data naar betaalde data-partnerships tussen techbedrijven en contentaanbieders. Silicon Valley begint in te zien dat toegang tot kwalitatieve data een prijskaartje heeft. Dit zal vooral grote spelers bevoordelen (die zich die licenties kunnen veroorloven), terwijl kleinere nieuwkomers klem kunnen komen te zitten tussen hoge datakosten en het risico van inbreukclaims.
Toch zit er ook voor de tech-industrie een zilveren rand: duidelijkheid. Iedere nieuwe juridische uitspraak brengt meer helderheid in wat wel en niet mag. Als meer rechters de lijn van Thomson Reuters v. ROSS volgen, weten AI-bedrijven dat fair use geen vrijbrief is en kunnen ze hun strategie daarop aanpassen. Het alternatief – gokken op ruime interpretaties en dan geconfronteerd worden met claims – is veel riskanter geworden. Silicon Valley zal dus, hoe paradoxaal ook, wellicht wat langzamer en voorzichtiger moeten gaan bewegen als het om datahongerige AI-projecten gaat.
Reacties uit de industrie en academische wereld
De uitspraak heeft sterke reacties uitgelokt, zowel bij contentproviders als in de tech- en academische gemeenschap. Thomson Reuters zelf toonde zich uiteraard tevreden. “We are pleased that the court granted summary judgment in our favor and concluded that Westlaw’s editorial content, created and maintained by our attorney editors, is protected by copyright and cannot be used without our consent,” verklaarde een woordvoerder, en hij benadrukte: “The copying of our content was not ‘fair use.’”. Voor Thomson Reuters is dit een bevestiging dat hun investeringen in juridische redactie beschermd zijn en dat AI-aanbieders niet vrij spel hebben om daaruit te putten. Ook andere uitgevers en databankbeheerders voelen zich gesterkt; zij zien dit als een erkenning van de waarde van hun arbeid en een signaal dat ongeautoriseerd gebruik aangepakt kan worden.
Aan de kant van AI-ontwikkelaars en tech-experts is de stemming gemengd, maar overwegend bezorgd. Omdat ROSS zelf al uit de markt is gestapt, bleef een directe reactie van het bedrijf uit. In bredere zin vreest men dat dit vonnis de ruimte voor innovatie inperkt. Cornell-professor James Grimmelmann – een expert op het gebied van internetrecht – verwoordde de angst vanuit de tech-kant als volgt: “If this decision is followed elsewhere, it’s really bad for the generative AI companies.” Volgens Grimmelmann laat rechter Bibas’ redenering weinig over van de fair use-argumenten waarop AI-bedrijven tot nu toe hebben vertrouwd. Veel van die argumenten (bijv. analogieën met tijdelijk kopiëren in software of Google’s zoekindex) werden door de rechter terzijde geschoven als niet van toepassing in deze context. Dit maakt AI-ontwikkelaars nerveus: de juridische verdedigingslinie lijkt smaller te worden.
Ook andere juristen en academici hebben gereageerd. De Authors Alliance, een belangenorganisatie voor auteurs die doorgaans open toegang en redelijk gebruik ondersteunt, noemde de uitspraak “poorly reasoned” en vond dat het vonnis voorbijgaat aan gevestigde jurisprudentie op het gebied van fair use. Zij betogen dat de feiten in de ROSS-zaak uniek zijn (met een directe concurrentiesituatie) en hopen dat toekomstige rechters de argumentatie niet zullen overnemen zonder kritisch te kijken. Met andere woorden, men in de academische wereld hoopt dat dit geen einde betekent van fair use in AI, maar eerder een bijzonder geval dat niet één-op-één toepasbaar is op bijvoorbeeld generatieve AI die beelden of teksten maakt.
Binnen de juridische praktijk benadrukken experts dat dit vonnis in elk geval een nieuwe hobbel vormt voor AI-bedrijven. Advocaat Chris Mammen (Womble Bond Dickinson) stelt dat deze uitspraak “a finger on the scale towards holding that fair use doesn’t apply” legt in AI-zaken. Hoewel elke zaak feitelijk anders is, vreest hij dat rechters nu sneller zullen oordelen dat fair use niet van toepassing is wanneer een AI-systeem concurreert met menselijke makers of uitgevers. Tech-industrie organisaties houden zich ondertussen op de vlakte in afwachting van hoger beroep of verdere jurisprudentie, maar achter de schermen zal dit ongetwijfeld besproken worden in board rooms en R&D-afdelingen van AI startups. Er klinkt begrip dat rechthebbenden compensatie willen, maar ook zorg dat te strikte handhaving de ontwikkeling van nuttige AI-toepassingen kan verstikken.
Potentiële vervolgstappen: hoe nu verder?
Nu dit vonnis op tafel ligt, rijst de vraag hoe AI-bedrijven hiermee moeten omgaan. Moeten ze hun aanpak fundamenteel wijzigen, of zijn er manieren om zich aan te passen zonder hun hele datagedreven model op te geven? Een paar mogelijke vervolgstappen en strategieën tekenen zich af:
Hoger beroep en juridisch uitklaren. Allereerst is er het pad van verdere juridische strijd. ROSS zelf is nagenoeg verdwenen, maar theoretisch zou er hoger beroep kunnen worden ingesteld tegen het vonnis van Bibas. Een hof van appel (en misschien uiteindelijk het Hooggerechtshof) zou dan een definitiever woord kunnen spreken over fair use bij AI-training. Gezien ROSS’ situatie is het onzeker of een beroep er komt, maar andere lopende zaken zouden dit vraagstuk alsnog bij hogere instanties kunnen brengen. Voor de AI-industrie zou duidelijke hogere rechtspraak wenselijk zijn om uniforme richtlijnen te krijgen.
Datasets en licenties herzien. Intussen zullen AI-ontwikkelaars proactief hun data-verzamelstrategieën onder de loep nemen. Een logische stap is het zoeken van licentiedeals voor belangrijke trainingsdata. In plaats van stilletjes webscraping te doen of derden in te huren zoals ROSS deed, kunnen bedrijven overeenkomsten sluiten met contentleveranciers. We zien dit al gebeuren: nieuwsmedia, stockfoto-databanken en uitgevers sluiten partnerschappen met AI-firma’s voor gecontroleerd datagebruik. Dit kost geld, maar vermindert het risico op juridische conflicten en kan zelfs leiden tot samenwerking (bijv. gedeelde expertise of exclusieve toegang tot hoogwaardige data). Grote spelers als OpenAI hebben hier een voorsprong – ze hebben recent dergelijke deals gesloten – maar ook kleinere bedrijven kunnen nichedatasets legaal proberen te verkrijgen of zich aansluiten bij coalities die data inkopen.
Gebruik van publieke en open data. Een andere aanpassing is het verschuiven van focus naar publiek domein-materiaal of data onder open licenties. AI-bedrijven kunnen hun modellen (voor zover mogelijk) trainen op datasets die vrij van rechten zijn of door gebruikers zelf aangeleverd en gedeeld met toestemming. Dit is uiteraard niet voor alle doeleinden haalbaar – er is nu eenmaal veel waardevolle informatie die beschermd is – maar het stimuleert creatief nadenken over alternatieve databronnen. Enkele AI-projecten proberen bijvoorbeeld geheel op Wikipedia-achtige content of open-source documenten te trainen om juridische risico’s te vermijden.
Technische en operationele aanpassingen. Bedrijven kunnen ook hun modus operandi aanpassen om minder kwetsbaar te zijn. Denk aan het beperken van output die rechtstreeks op beschermde werken lijkt, of aan het inbouwen van filters die voorkomen dat een model letterlijke teksten uit auteursrechtelijk beschermde trainingdata prijsgeeft. Sommige AI-modellen worden getraind met technieken als differentiële privacy of samenvattende tussenlagen, zodat de gearchiveerde originelen niet makkelijk reproduceren in output. Dit is echter meer symptoombestrijding; het onderliggende juridische probleem (het kopiëren zelf tijdens training) blijft.
Lobbyen voor duidelijkere regels. Ten slotte zou de AI-sector kunnen kiezen voor een strategiewijziging op beleidsniveau. Als de rechtspraak de kant van de rechthebbenden blijft kiezen, kunnen AI-bedrijven druk gaan uitoefenen voor nieuwe wet- en regelgeving. Een mogelijkheid is pleiten voor een expliciete uitzondering of regeling voor text and data mining (TDM) en AI-training, die balans zoekt tussen innovatie en auteursrecht. In sommige andere rechtsgebieden bestaan al beperkte uitzonderingen voor data-analyse (bijv. in de EU voor wetenschappelijk onderzoek). AI-bedrijven in Silicon Valley zouden kunnen aanvoeren dat zonder zo’n kader technologische vooruitgang wordt belemmerd. Of dit politiek haalbaar is, hangt af van hoeveel overtuigingskracht ze tegenover de lobby van contentindustrie kunnen uitoefenen.
Het is duidelijk dat Thomson Reuters vs. ROSS een keerpunt markeert. AI-ontwikkelaars moeten hun strategie herzien – business as usual is geen optie als de juridische wind draait. Sommigen zullen zich schikken en zorgen voor toestemming of compensatie voor de data die ze nodig hebben. Anderen zullen creatiever worden in het vermijden van beschermde inhoud. En weer anderen wachten misschien af in de hoop dat dit vonnis een uitzondering blijft op de regel. De komende tijd zal in elk geval uitwijzen of dit strenge oordeel navolging krijgt. Zoals een commentator het verwoordde: dit besluit “puts a finger on the scale” tegen fair use voor AI, maar toekomstige rechters en wetgevers bepalen of die schaal definitief doorzwaait.
Conclusie
De rechtszaak tussen Thomson Reuters en ROSS Intelligence biedt een voorproefje van hoe de botsing tussen generatieve AI en het auteursrecht eruitziet. De achtergrond – een startup die een gevestigde databank uitbuit om te concurreren – leidde tot een principiële uitspraak: fair use kent grenzen en het klakkeloos gebruiken van andermans gecureerde data voor AI is onacceptabel. Dit heeft grote gevolgen voor Silicon Valley en alle AI-bedrijven die teren op bestaande content. De reacties lopen uiteen van opgeluchte rechthebbenden tot bezorgde innovatoren. Het is nu aan de AI-sector om te bewijzen dat ze kan innoveren met respect voor intellectueel eigendom – door zich aan te passen, samen te werken met contentmakers of de discussie aan te gaan over wat redelijk gebruik in het AI-tijdperk zou moeten inhouden. Eén ding is zeker: de ontwikkeling van generatieve AI zal voortaan gepaard gaan met meer juridische scherpte en waarschijnlijk meer samenwerking tussen tech en content, in plaats van de wilde grijszone die het tot voor kort was. De grens tussen inspireren en infringen (inspiratie opdoen vs. inbreuk maken) is door deze zaak een stuk duidelijker getrokken. Het is nu aan AI-ontwikkelaars om binnen die grenzen te opereren – of ze via de juiste wegen te verleggen.