Proč je vysoká kvalita dat zásadní pro právní AI
Jak špatná kvalita dat vede k halucinacím a proč obecné jazykové modely v právní praxi selhávají.

Právník předloží Vyššímu zemskému soudu v Kolíně nad Rýnem podání. Citace jsou přesné, odkazy autoritativní: „Meyer-Götz, in: Hauß/Gernhuber, Familienrecht, 6. vydání 2022, § 1671 na okraj poznamenává 33.“ Číslo vydání, odstavec, poznámka pod čarou – vše profesionálně naformátováno.
Vše vymyšlené.
Závěr soudu: Citovaný zdroj neexistuje. Chatbot zjevně smíchal tři různé publikace dohromady. Jména autorů, tituly sborníků a čísla vydání byla zkombinována, aniž by se kdy ověřilo, zda patří ke stejnému zdroji. Byly tvrzeny právní principy, které nebyly nikdy etablované v literatuře nebo v rozhodnutích soudů. Chatbot vygeneroval věrohodné, ale zcela nepodložené citace a právník je předložil bez ověření.
Nejde o ojedinělý incident. V září 2025 rozhodoval Zemský soud ve Frankfurtu nad Mohanem v podobném případu: tři údajná rozhodnutí Spolkového soudního dvora, všechna vymyšlená. Soud reagoval jednoznačně a obvinil právníka z ohrožení výkonu spravedlnosti. Jasný signál.
Tyto případy odhalují, na čem při využívání právní AI skutečně záleží: Rozhodující není rychlost odpovědí ani elegance uživatelského rozhraní, ale spolehlivost podkladových dat.
Když AI halucinuje: Dva případy z praxe
Františkánské a kolínské případy ukazují společný vzorec: právníci se spoléhali na citace generované AI bez jejich ověření. Výsledkem byla podání plná přesně znějících, ale zcela vymyšlených citací. To, co je technicky známé jako halucinace, tedy fenomén, kdy jazykové modely generují věrohodně znějící, ale nepravdivé informace, zde mělo okamžité právní důsledky. Soudy označily tento přístup tvrdými slovy za zneužití a ohrožení výkonu spravedlnosti.
Problém nespočívá pouze na straně právníků, kteří porušili svou povinnost náležité péče, ale zásadně také v technologii, kterou použili. Generické jazykové modely, systémy jako ChatGPT nebo Claude trénované na textech z otevřeného internetu, nejsou navrženy tak, aby spolehlivě zpracovávaly specializovaný právní obsah. Z jejich rozsáhlých tréninkových dat tvoří právní texty pouze minimální část, a z té ještě menší zlomek tvoří německé právní dokumenty. Dokážou rozpoznat vzorce a generovat přesvědčivě znějící text, ale nechápou ani vnitřní systematickou strukturu práva, ani jemné, ale podstatné sémantické rozdíly v právním jazyce, ani důležitost přesnosti v právní práci.
Co skutečně znamená kvalita dat v právní praxi
Kvalita dat v oblasti práva znamená mnohem více než technickou čistotu nebo samotný objem dostupných dokumentů. Jde o pět hlavních dimenzí, které musí spolupracovat, aby právní AI poskytovala spolehlivé výsledky.
Relevance. Ne každé rozhodnutí je důležité pro každou otázku. Vysoce kvalitní právní databáze musí být schopna rozlišovat mezi zásadními rozhodnutími a okrajovými usneseními, mezi současnými a zastaralými soudními rozhodnutími, mezi rozhodnutími soudů nižší instance a precedenty nejvyšších soudů.
Úplnost. Jediné rozhodnutí může být přesně reprodukováno, ale k čemu to je, když chybí opačný názor, když se nezohledňují následná rozhodnutí, když je vyloučena doktrinální klasifikace z literatury? Právní práce se rozvíjí díky zvažování, porovnávání a systematickému pronikání do právního problému. Neúplná datová báze tomu přesně brání.
Přesnost. Spisové značky, citace, poznámky na okraji – právní odkazy se řídí přísnými konvencemi, protože pouze to zajišťuje ověřitelnost. Systém, který tuto přesnost nezaručuje, je pro právní praxi nepoužitelný, bez ohledu na to, jak výmluvně se odpovědi mohou na první pohled zdát.
Kontextualizace. Rozhodnutí soudu rozvíjí svůj význam pouze ve spojení s literaturou, komentáři, legislativními materiály a s informací o tom, zda nebylo nahrazeno novějším rozhodnutím. Zpracování textů rozsudků izolovaně nevytváří právní jistotu, ale křehký vědomostní základ.
Aktuálnost. Právo se neustále vyvíjí. Rozhodnutí platné včera může být dnes již neaktuální. Právní AI musí mít přístup nejen k aktuálním datům, ale musí také rozpoznat, kdy, proč a jak se právní situace změnila.

Proč soudní rozhodnutí sama o sobě nestačí
Mnoho poskytovatelů právní AI se zaměřuje na shromažďování a vyhledávání co největšího počtu soudních rozhodnutí. To zní jako rozumný přístup, ale je to jen polovina úspěchu. Rozsudek není izolovaným faktem, ale součástí komplexního právního diskursu.
Vezměte si jako příklad případ neplatného rozvázání pracovního poměru v pracovním právu. Relevantní rozhodnutí Spolkového soudního dvora samotné může poskytnout pohled na konkrétní bod. Jak ale s tímto rozhodnutím zachází odborná literatura? Existují odlišné názory? Jaké důsledky vyvozuje komentářová literatura pro smluvní praxi? Zavedl soud nižší instance pokyny Spolkového soudního dvora, nebo se od nich odchýlil? Teprve až je možné odpovědět na všechny tyto otázky, vzniká ucelený obrázek o právní situaci.
To je přesně oblast, v níž vynikají zavedená právní vydavatelství. Platformy jako beck-online poskytují nejen rozsudky, ale také komentáře, legislativní materiály, časopisecké články a praktické příručky. Klíčová je zde neustálá redakční údržba a propojování obsahu právními odborníky. Pouze tato struktura umožňuje porozumět soudním rozhodnutím v jejich doktrinálním a praktickém kontextu.
Cesta ke spolehlivé právní AI
Půvab generických jazykových modelů je pochopitelný. Jsou snadno dostupné, snadno se používají a poskytují odpověď na téměř jakoukoli otázku. Ignorují však složitá specifika právních textů a podléhají neustálé potřebě aktualizace, kterou bez specializované údržby nemohou splnit.
Významný pokrok představují moderní technologie, jako je Retrieval-Augmented Generation (RAG). Místo generování odpovědí výhradně z tréninkového materiálu jazykového modelu vyhledávají systémy RAG relevantní dokumenty z databáze a integrují je do odpovědi. To výrazně snižuje halucinace – ale pouze tehdy, pokud je podkladová databáze kvalitní, aktuální a komplexní.
Systém RAG, který přistupuje pouze k neúplné nebo špatně udržované databázi soudních rozhodnutí, může fungovat technicky bezchybně, a přesto poskytovat nepoužitelné výsledky. Kvalita dat určuje kvalitu odpovědi. Sebesložitější algoritmus AI nedokáže kompenzovat chybějící nebo chybný obsah.
Jak moderní právní AI vytváří spolehlivost
Dobrá právní AI řeší přesně tento bod. Kombinuje vysoce kvalitní, redakčně udržovaný specializovaný obsah s moderní technologií AI a vytváří odpovědi, které nejsou pouze vygenerované, ale ověřitelné. Každé tvrzení je doloženo konkrétním zdrojem – rozsudkem, komentářem, článkem. Uživatelé mohou okamžitě zjistit, odkud informace pocházejí, a sami se rozhodnout, zda zdroji důvěřovat.
Tato transparentnost a sledovatelnost není technickou funkcí, ale základním předpokladem pro využívání právní AI v praxi. Důvěra se může rozvinout pouze tehdy, když advokáti, právní oddělení a soudy pochopí, na jakém základě AI své odpovědi poskytuje. A pouze s touto důvěrou se právní AI stává nástrojem, který nenahrazuje právní práci, ale poskytuje jí solidní podporu.
Ponaučení z případů z Frankfurtu a Kolína nad Rýnem je jasné: Cesta od soudních rozhodnutí k právní jistotě vede pouze jedním směrem: přes kvalitní data. Pouze tehdy, když je specializovaný právní obsah neustále udržován, strukturován a propojován s metodami AI, jako je RAG, vzniká nástroj, který spolehlivě podporuje praxi. Vše ostatní zůstává improvizací a ohrožuje nejen klienty, ale i důvěru v právní stát.
Maximilian Detken
