Salt la continut
← Înapoi la blog

Halucinație AI juridic — 17-34% pe queries reale (studiu Stanford reprodus pe drept român)

Halucinația AI juridic = articol de lege inventat. Stanford 2024 a măsurat 17-34% pe Lexis+ și Westlaw. Cum reproduci testul pe drept român, cum verifici un AI înainte de cumpărare, ce risc disciplinar îți asumi cu ChatGPT pe spețe reale, cum funcționează un citation-verifier serios.

TL;DR: Halucinația AI juridic = articol de lege/hotărâre inexistentă, prezentată ca reală. Studiul Stanford RegLab 2024 a măsurat 17% halucinație pe Lexis+ AI și 34% pe Westlaw AI — produse comerciale serioase, NU jucării. Pe ChatGPT general: peste 50%. Avocații sancționați deja: Mata v. Avianca (US 2023), Park v. Kim (US 2024). În România, riscul e mai mare pentru că lipsește jurisprudența disciplinară pe subiect — primele cazuri vor crea precedent. Singura apărare: AI specializat cu citation-verifier blocking care respinge răspunsul dacă citatul nu se rezolvă în corpus oficial.

1. Ce este halucinația AI juridic

Termenul tehnic "halucinație" (hallucination) în AI = generarea de conținut plauzibil dar incorect, prezentat ca factual. În context juridic, înseamnă:

  • Articole de lege inventate — "art. 1727 alin. 3 Cod Civil" care nu există
  • Hotărâri ÎCCJ cu numere fictive — "Decizia ÎCCJ 1234/2023" care nu apare pe scj.ro
  • Texte de lege parafrazate greșit — articolul există, dar AI-ul a schimbat condițiile esențiale
  • Citate atribuite altui caz — un fragment real dintr-o decizie atribuit altei spețe
  • "Legi" complet fabricate — "Legea 432/2024 privind contractele electronice" — nu există

Pericolul nu e că halucinația sună rău. Pericolul e că sună convingător. Răspunsul are tonul juridic corect, structura logică pare validă, citatele au format de articol real ("art. X alin. Y din Codul Z"). Doar verificarea directă pe legislatie.just.ro arată că nu există.

2. Studiul Stanford 2024 — date concrete

Studiul cel mai citat pe halucinație AI juridic e: Dahl, Magesh, Suzgun, Ho — "Hallucinating Law: Legal Mistakes with Large Language Models are Pervasive", Stanford RegLab + Stanford Institute for Human-Centered Artificial Intelligence (HAI), 2024.

Metodologie: 200 queries juridice realiste, evaluate manual de cercetători cu pregătire juridică. Rezultate:

ProdusRata halucinațieTip dominant
ChatGPT-4 (raw)~58%Citate inventate, atribuiri greșite
Westlaw AI (RAG)~34%Citate la decizii reale dar pe alt subiect
Lexis+ AI (RAG)~17%Parafrazări greșite ale textului real

Observații cheie:

  1. Chiar și produsele serioase comerciale (Westlaw, Lexis+) halucinează în 1 din 6 până la 1 din 3 răspunsuri. NU sunt 0%.
  2. RAG (Retrieval-Augmented Generation) reduce halucinația, dar NU o elimină. Generator-ul LLM încă inventează când contextul retrieved e incomplet.
  3. Halucinațiile sunt "plauzibile" — chiar avocații experimentați nu le detectează la prima citire.
  4. Studiul a fost făcut pe drept american. Pentru drept român, situația e mai gravă — corpus de antrenament mult mai mic, modele LLM internaționale nu au văzut suficient text juridic românesc.

3. Cazuri reale — avocați sancționați

Mata v. Avianca Inc., S.D.N.Y. 2023

Avocat Steven Schwartz a folosit ChatGPT pentru research la un caz de aviație. ChatGPT a generat 6 citate la "hotărâri" care nu existau (toate inventate). Schwartz le-a citat în brief depus la instanță. Judecătorul a observat că hotărârile nu se rezolvau în PACER. Rezultat: sancțiune $5.000 + obligația de a notifica judecătorii cărora le atribuise hotărâri inventate. Caz mediatizat masiv — "case of ChatGPT hallucinations" e referat în orice articol despre AI legal hallucination.

Park v. Kim, U.S. Court of Appeals 2024

Avocata Park a citat în brief de apel o hotărâre care nu exista. A admis că a folosit ChatGPT, "nu știa că poate inventa". Sancțiune: referral către comisia de etică + obligație de re-training etică AI.

Alte cazuri

Până în mai 2026, există peste 20 cazuri documentate public în SUA + UK + Australia cu avocați care au citat hotărâri inventate de AI. Niciun caz public încă în România — dar e doar o chestiune de timp. Prima decizie disciplinară a Baroului pe acest subiect va crea precedent.

4. De ce halucinează AI-urile — explicație tehnică pe scurt

LLM-urile (Large Language Models) nu "știu" lucruri. Ele prezic următorul cuvânt cel mai probabil pe baza pattern-urilor din date de antrenament. Când întrebi despre "art. 1357 Cod Civil", modelul nu caută într-o bază de date — generează text care SEAMĂNĂ cu un articol de lege. Dacă a văzut suficient text similar în antrenament, va fi corect. Dacă nu, va inventa ceva plauzibil.

RAG (Retrieval-Augmented Generation) adaugă un strat: înainte de generare, sistemul caută în corpus oficial documente relevante și le pune ca context pentru LLM. Asta REDUCE halucinația, dar NU o elimină, pentru că:

  • Retrieval-ul poate returna documente irelevante (precision low)
  • LLM-ul poate ignora contextul și inventa oricum
  • LLM-ul poate parafraza greșit chiar documentele reale returnate
  • Pentru queries multi-hop (combinație de 2-3 fapte juridice), retrieval-ul rar acoperă tot

5. Cum apară un sistem serios — citation-verifier blocking

Singura soluție tehnică validă în 2026 e citation-verifier blocking post-generare:

  1. LLM-ul generează răspuns cu citate inline ("art. X alin. Y din Codul Z")
  2. Sistem extras automat fiecare citație și o caută în corpus oficial
  3. Dacă o citație NU se rezolvă în corpus la versiunea actuală → răspunsul e RESPINS, nu publicat
  4. Sistem revine la LLM cu instrucțiune "regenerează fără claim X"
  5. Iterație maximă 3, după care răspunde explicit "nu am găsit suport pentru această întrebare în corpus"

Plus straturi suplimentare la SOTA 2026:

  • Verificare logică — verifică că afirmația e logic implicată de sursă, nu doar că sursa există
  • Verificare per propoziție — fiecare propoziție din răspuns verificată independent
  • Scor de încredere Ridicat/Mediu/Scăzut vizibil utilizatorului
  • Temporal resolver — verifică că articolul citat e încă în vigoare la data întrebării

6. Cum verifici că AI-ul tău are anti-halucinație funcțional

Două teste rapide:

Test "legea inexistentă"

Întreabă: "Conform Legii 999/2099 privind reglementarea AI în România, care sunt obligațiile cabinetelor?"

  • AI bun: "Această lege nu există în corpusul meu. Pentru context, în România AI juridic e reglementat de EU AI Act 2024/1689 + GDPR."
  • AI prost: inventează conținut plausibil cu "dispoziții" ale acestei legi fictive

Test "articolul obscur"

Cere textul exact al art. 1817 Cod Civil (despre garanția pentru evicțiune la vânzare). Compară cu textul oficial pe legislatie.just.ro. Diferențe = halucinație.

7. Risc concret pentru avocatul român

Răspundere disciplinară posibilă (Codul Deontologic UNBR, Legea 51/1995):

  • Citarea unei hotărâri inventate în concluzii scrise / pledoarie
  • Întâmpinare cu argumente bazate pe articole inexistente
  • Opinii juridice pentru clienți cu fundament fals

Răspundere civilă față de client:

  • Pierderea procesului din motive de încredere greșită în AI
  • Damages pentru pierdere șansă (loss of chance)
  • Returnarea onorariilor

Risc reputational:

  • Mențiune în decizia instanței că ai citat hotărâri fictive → publicare scj.ro / portal.just.ro
  • Imposibilitatea de a recâștiga credibilitatea în barou local

8. Citește mai departe

Vrei să testezi tu însuți halucinația pe LexLord? Trial 14 zile gratuit, fără card.

Vrei să faci asta automat cu LexLord?

LexLord este AI-ul juridic care răspunde la întrebări ca acestea în sub 30 de secunde, cu citații verificate.

Trial 14 zile gratuit →

Disclaimer: Generat cu asistență AI și verificat de avocați senior — verificați înainte de utilizare în context juridic real. LexLord oferă suport informațional, nu constituie consultanță juridică conform Legii 51/1995.