AI in de juridische praktijk: het belang van gestructureerde data
De razendsnelle opmars van AI roept niet alleen ethische en juridische vragen op, maar stelt ook fundamentele eisen aan de manier waarop we onze data organiseren. Steeds vaker wordt duidelijk: de kwaliteit en structuur van de data waarmee een AI-model wordt getraind, bepaalt in hoge mate hoe dat model zich gedraagt in de praktijk. Of, zoals recent onderzoek het treffend samenvat: You are what you eat – and so is your AI.
Waarom deze blog?
Deze blog is bedoeld voor juristen, compliance officers en beleidsmakers die weliswaar géén technische achtergrond hebben, maar wél betrokken zijn bij AI-toepassingen in hun organisatie. We leggen uit waarom gestructureerde data niet zomaar een IT-zorg is, maar juist een juridische én governancevraagstuk raakt.
Wat bedoelen we met "AI alignment"?
Alignment betekent in dit verband: zorgen dat een AI-systeem doet wat de mens wil dat het doet. Denk aan een chatbot die op een juridisch verantwoorde manier met cliënten communiceert of een intern AI-systeem dat compliance-informatie verwerkt zonder ongewenste vooroordelen. Het probleem: AI-modellen leren op basis van grote hoeveelheden data – en als die data rommelig, onvolledig of dubbelzinnig zijn, leert het model gedrag dat kan afwijken van de bedoeling.
AI denkt zoals je haar voedt
Het onderzoek You Are What You Eat (2025) laat overtuigend zien hoe het interne denkproces van een AI-model wordt gevormd door de structuur van de trainingsdata. Twee modellen kunnen exact dezelfde prestaties laten zien op een toetsset, maar tóch totaal verschillend reageren in de praktijk. De reden? Ze hebben intern een ander algoritmisch ‘wereldbeeld’ opgebouwd. En dat wereldbeeld komt direct voort uit de data waarmee ze zijn getraind.
Belangrijke inzichten uit het onderzoek:
🔍 Twee modellen met dezelfde output kunnen totaal anders redeneren
🧩 De structuur van de data beïnvloedt de structuur van het model
🛠️ Technieken als RLHF (Reinforcement Learning from Human Feedback) beïnvloeden vaak alleen de uitkomst, niet de manier van denken van een model
Waarom gestructureerde data cruciaal is
1. Relaties, regels en hiërarchie
Gestructureerde data – zoals tabellen, kennisgrafen of formele regels – maken onderliggende relaties expliciet. In een juridische context kunnen dat bijvoorbeeld:
wetsteksten met duidelijke verwijzingen zijn,
compliance-eisen die aan branchespecifieke verplichtingen gekoppeld zijn,
of interne gedragsregels gekoppeld aan beleid en procedures.
Deze structuur zorgt ervoor dat het AI-model coherente, controleerbare en toetsbare uitkomsten genereert. Dat is essentieel in een domein waarin fouten grote gevolgen kunnen hebben.
2. Minder is soms meer
Het gaat niet om méér data, maar om betere data. Simpele maar goed gestructureerde voorbeelden kunnen een model veel effectiever leren wat de bedoeling is dan duizenden onsamenhangende tekstfragmenten.
3. Verificatie en verantwoording
In juridische contexten is het belangrijk dat beslissingen uitlegbaar zijn. Met gestructureerde input kun je beter herleiden hoe een conclusie tot stand is gekomen – cruciaal bij audits, bezwaarprocedures of ethische toetsing.
Wat gaat er mis zonder structuur?
In het paper wordt uitgelegd dat AI-modellen soms ‘shortcut solutions’ leren: snelle maar oppervlakkige strategieën die op het eerste gezicht correct lijken, maar de onderliggende bedoeling missen. Denk aan:
Een model dat altijd “ja” zegt op verzoeken omdat dat gemiddeld vaker voorkomt in de training
Of een model dat juridische terminologie herkent, maar de logica van de wetsartikelen niet begrijpt
Zonder structuur bestaat het risico dat het model leert te voorspellen wat waarschijnlijk is, in plaats van wat juridisch correct is.
Praktische implicaties voor juridische organisaties
Betere AI begint met betere data
Zorg voor goed gelabelde, domeinspecifieke data:
Annotaties bij wetsartikelen
Voorbeelden van correcte toepassing van regelgeving
Heldere formats voor beleidsdocumenten
Data-governance = AI-governance
De EU AI Act benadrukt de rol van transparantie, risicobeheersing en gegevenskwaliteit. Juridische organisaties doen er goed aan om databeleid onderdeel te maken van hun compliance framework.
Denk verder dan performance
Een model dat ‘goed scoort’ op testdata is niet per se veilig of betrouwbaar. Kijk ook naar hoe het model redeneert en of dit in lijn is met je juridische normen.
Case: AI in juridische documentanalyse
Stel: je traint een AI om juridische documenten te screenen op AVG-risico’s. Als je dit doet met ongestructureerde tekst, loop je het risico dat het model alleen oppervlakkige patronen leert (“zoek naar het woord privacyverklaring”). Maar als je diezelfde data structureert:
welke artikel is van toepassing?
welk type persoonsgegevens wordt genoemd?
op wie is het beleid van toepassing?
...dan leert het model veel beter waarom iets relevant is, en kan het die kennis generaliseren naar nieuwe situaties.
Een boodschap aan beleidsmakers en juristen
De les uit dit onderzoek is helder: wie AI inzet in juridische context, moet niet alleen letten op de techniek, maar vooral op de data. En niet zomaar data, maar gestructureerde data.
Je krijgt wat je erin stopt. Of zoals auteurs het zeggen: You are what you eat – and so is your AI.
Dat betekent:
Richt je data-infrastructuur in met het oog op juridische helderheid
Werk samen met data scientists aan goed gestructureerde juridische datasets
Zorg dat je niet alleen test op output, maar ook begrijpt wat er onder de motorkap gebeurt
Tot slot: van alchemie naar wetenschap
AI-alignement is nu vaak nog een kwestie van trial & error. Maar als AI écht betrouwbaar moet zijn in juridische toepassingen, moeten we overstappen op een wetenschappelijke benadering. Zoals thermodynamica ooit nodig was om stoommachines veilig te maken, zo is kennis over datastructuren en generalisatie nodig om AI juridisch verantwoord te laten opereren.
Samenvatting
🧠 AI-alignment draait niet alleen om output, maar om hoe een model leert te denken
📊 De structuur van data bepaalt de structuur van het model
⚖️ In juridische toepassingen is gestructureerde data essentieel voor controleerbaarheid en uitlegbaarheid
📌 De EU AI Act onderstreept het belang van transparantie en gegevenskwaliteit
📉 Zonder structuur loop je risico op simplificaties of misalignment
💡 Begin vandaag: organiseer je juridische data bewust en strategisch