Varför hög datakvalitet är grundläggande för juridisk AI

Hur dålig datakvalitet leder till hallucinationer och varför generiska språkmodeller misslyckas i juridisk tillämpning.

En advokat lämnar in en inlaga till hovrätten i Köln (Oberlandesgericht Köln). Hänvisningarna är exakta, källorna auktoritativa: "Meyer-Götz, i: Hauß/Gernhuber, Familienrecht, 6:e uppl. 2022, Avsnitt 1671 marginalnot 33." Upplagenummer, paragraf, marginalnot – allt professionellt formaterat.

Allt var påhittat.

Domstolens slutsats: Den citerade källan existerar inte. En chatbot hade uppenbarligen blandat ihop tre olika publikationer. Författarnamn, antologititlar och upplagenummer kombinerades utan att det någonsin kontrollerades om de hörde till samma källa. Rättsliga principer hävdades som aldrig hade fastslagits i litteratur eller domstolsbeslut. En chatbot hade genererat trovärdiga men helt grundlösa källhänvisningar och advokaten hade skickat in dem utan verifiering.

Detta är inte en isolerad händelse. I september 2025 dömde regiondomstolen i Frankfurt am Main i ett liknande fall: tre påstådda beslut från den federala domstolen, alla påhittade. Domstolen svarade otvetydigt och anklagade advokaten för att äventyra rättskipningen. En tydlig signal. 

Dessa fall visar vad som verkligen betyder något när man använder juridisk AI: Det är inte hastigheten på svaren eller det eleganta användargränssnittet som är avgörande, utan tillförlitligheten hos underliggande data. 



När AI hallucinerar: Två fall från praktiken

Frankfurt- och Kölnfallen visar ett gemensamt mönster: advokater förlitade sig på AI-genererade källhänvisningar utan att verifiera dem. Resultatet blev inlagor fulla av exakt klingande men helt påhittade citat. Det som tekniskt kallas hallucination, fenomenet där språkmodeller genererar trovärdig information som är falsk, fick här omedelbara rättsliga konsekvenser. Domstolarna stämplade detta tillvägagångssätt i hårda ordalag som missbruk och ett äventyrande av rättskipningen.

Problemet ligger inte enbart hos de advokater som brutit mot sin omsorgsplikt, utan i grunden också hos tekniken de använde. Generiska språkmodeller, system som ChatGPT eller Claude som tränats på texter från det öppna internet, är inte utformade för att pålitligt bearbeta specialiserat juridiskt innehåll. Av deras enorma mängd träningsdata utgörs endast en minimal del av juridiska texter, och av den delen är en ännu mindre bråkdel tyska juridiska dokument. De kan känna igen mönster och generera övertygande texter, men de förstår varken lagens inneboende systematiska struktur, de subtila men kritiska semantiska skillnaderna i det juridiska språket eller vikten av precision i juridiskt arbete. 


 

Vad datakvalitet egentligen innebär i juridisk praxis

Datakvalitet inom det juridiska området innebär mycket mer än teknisk renhet eller den rena volymen av tillgängliga dokument. Det handlar om fem centrala dimensioner som måste samverka för att juridisk AI ska leverera pålitliga resultat.


  • Relevans. Inte alla beslut har betydelse för alla frågor. En juridisk databas av hög kvalitet måste kunna skilja på vägledande domar och perifera beslut, på aktuella och föråldrade domstolsbeslut, på beslut från lägre instanser och prejudikat från högsta domstolen. 


  • Fullständighet. Ett enskilt beslut kan vara korrekt återgivet, men vad hjälper det om motpartens synsätt saknas, om efterföljande beslut inte beaktas, om den doktrinära klassificeringen från litteraturen är utesluten? Juridiskt arbete lever på att väga, jämföra och systematiskt penetrera ett juridiskt problem. En ofullständig databas förhindrar just detta. 


  • Precision. Målnummer, källhänvisningar, marginalnoter – juridiska referenser följer strikta konventioner eftersom endast detta säkerställer verifierbarhet. Ett system som inte garanterar denna precision är oanvändbart i juridisk praxis, oavsett hur till synes vältaliga svaren kan verka vid en första anblick. 


  • Kontextualisering. Ett domstolsbeslut får sin fulla innebörd endast tillsammans med litteratur, lagkommentarer, förarbeten och information om huruvida det har ersatts av ett nyare beslut. Att bearbeta domstolsbeslut isolerat skapar inte rättssäkerhet utan en bräcklig kunskapsbas. 


  • Aktualitet. Rätten utvecklas ständigt. Ett beslut som gällde igår kan vara föråldrat idag. Juridisk AI måste inte bara ha tillgång till aktuella data utan också känna igen när, varför och hur den rättsliga situationen har förändrats. 




Varför enbart domstolsbeslut inte räcker

Många leverantörer av juridisk AI fokuserar på att samla in och göra så många domstolsbeslut som möjligt sökbara. Det låter som ett vettigt tillvägagångssätt, men det är bara halva striden. En dom är inte ett isolerat faktum utan en del av en komplex juridisk diskurs.

Ta ett arbetsrättsligt fall om ogiltigförklaring av uppsägning som exempel. Den relevanta domen från högsta domstolen kan i sig ge insikt i en specifik fråga. Men hur klassificerar litteraturen detta beslut? Finns det avvikande meningar? Vilka konsekvenser drar kommentarslitteraturen för avtalspraxis? Har en lägre domstol tillämpat högsta domstolens riktlinjer eller avvikit från dem? Först när alla dessa frågor kan besvaras framträder en komplett bild av rättsläget.

Det är precis här som etablerade juridiska förlag utmärker sig. Plattformar som beck-online erbjuder inte bara domar utan även lagkommentarer, förarbeten, facktidskrifter och praktiska handböcker. Avgörande här är det löpande redaktionella underhållet och länkningen av innehåll som görs av fackjurister. Endast denna struktur gör att domstolsbeslut kan förstås i sitt doktrinära och praktiska sammanhang. 

 


Vägen till en pålitlig juridisk AI

Attraktionskraften hos generiska språkmodeller är förståelig. De är lättillgängliga, enkla att använda och ger svar på nästan alla frågor. Men de ignorerar de komplexa särdragen i juridiska texter och är föremål för ett ständigt behov av uppdatering som de inte kan möta utan specialiserat underhåll.

Modern teknik som Retrieval-Augmented Generation (RAG) representerar ett betydande framsteg. Istället för att generera svar uteslutande från en språkmodells träningsmaterial, hämtar RAG-system relevanta dokument från en databas och integrerar dem i svaret. Detta minskar hallucinationer avsevärt – men bara om den underliggande databasen är av hög kvalitet, aktuell och omfattande.

Ett RAG-system som endast har tillgång till en ofullständig eller dåligt underhållen databas med domstolsbeslut kan fungera tekniskt felfritt men ändå leverera oanvändbara resultat. Datakvalitet avgör svarkvalitet. En AI-algoritm kan inte, oavsett hur sofistikerad den är, kompensera för saknat eller felaktigt innehåll. 



Hur modern juridisk AI skapar tillförlitlighet

Bra juridisk AI adresserar just detta. Den kombinerar högkvalitativt, redaktionellt underhållet fackinnehåll med modern AI-teknik och skapar svar som inte bara är genererade utan också verifierbara. Varje påstående dokumenteras med en konkret källa – en dom, en lagkommentar, en artikel. Användare kan omedelbart spåra var informationen kommer ifrån och själva avgöra om de litar på källan.

Denna transparens och spårbarhet är inte en teknisk funktion utan en grundläggande förutsättning för att använda juridisk AI i praktiken. Först när advokater, juridiska avdelningar och domstolar kan förstå på vilken grund AI ger sina svar kan förtroende utvecklas. Och endast med detta förtroende blir juridisk AI ett verktyg som inte ersätter det juridiska arbetet utan ger ett gediget stöd.

Lärdomen från fallen i Frankfurt och Köln är tydlig: Vägen från domstolsbeslut till rättssäkerhet går bara åt ett håll: genom högkvalitativa data. Först när det juridiska fackinnehållet kontinuerligt underhålls, struktureras och länkas samman med AI-metoder som RAG växer det fram ett instrument som tillförlitligt stöder praktiken. Allt annat förblir ett lapptäcke och sätter inte bara klienterna utan även förtroendet för rättsstaten på spel. 


Maximilian Detken

Innehållsförteckning

Alla rättigheter förbehållna Noxtua AG ©

Alla rättigheter förbehållna Noxtua AG ©