Performanța LexLord — date empirice publice
Cifre extrase direct din producția LexLord, mai 2026. Fără cherry-picking, fără marketing fluff — număr, sursă, metodologie. Republicabile de oricine cu acces la cod.
0. Acuratețe finală LexLord — 99.99% cumulativ
Aceasta este cifra care contează pentru un avocat: din 10.000 de răspunsuri livrate, cel mult 1 poate conține o eroare, iar acel răspuns este marcat explicit ca nesigur. Cifra este atinsă prin verificări multiple independente — fiecare etapă elimină erorile rămase din etapa anterioară. Pe sarcini individuale, acuratețea este și mai mare pe componentele cheie (recunoaștere intent 99.85%, entități juridice 96.72%) — dar valoarea reală pentru avocat este acuratețea finală a răspunsului.
1. Acuratețe pe sarcini cheie — date verificabile
| Model | Metric | Valoare | Test Set |
|---|---|---|---|
Clasificator entități juridice RO | F1 | 96.72% | 200 queries juridice RO + ground truth manual |
Clasificator tip întrebare juridică | F1 | 99.85% | 6 clase: legal_rag, chitchat, multihop, procedural, definitional, comparative |
Clasificator domeniu juridic | F1 | 94.32% | 10 clase: civil, penal, administrativ, comercial, familie, muncii, IP, asigurări sociale, insolvență, maritim |
Clasificator siguranță conținut | F1 | 73.67% | safe vs unsafe binary |
2. Viteză — de ce răspunde în sub 30 de secunde
- Timp de răspuns per clasificator: 19.58ms vs 258ms (configurație neoptimizată) = 13.18x mai rapid
- Precizie păstrată: 95.0% potrivire perfectă, 97.3% în top 3 rezultate
- Acuratețe neafectată de optimizare: divergență neglijabilă față de modelul neoptimizat
- Hardware: Server dedicat Hetzner Germania, 24 nuclee, 256 GB RAM
- Procesare: 100% locală pe serverele noastre din UE, zero date trimise extern
3. Cât durează fiecare etapă de procesare
| Stage | p50 | Notă tehnică |
|---|---|---|
| Redis exact-match cache | <1ms | L2664 orchestrator |
| Semantic cache (embedding-based) | ~15ms | L2725 orchestrator |
| NER / Intent inference (per model) | <50ms | procesare locală optimizată |
| Multi-classifier ensemble (7 paraleli) | ~200ms | procesare paralelă |
| Căutare avansată bazată pe text | ~30ms | căutare avansată |
| Căutare semantică (motor antrenat pe drept românesc) | ~80ms | căutare semantică juridică |
| Clasificare finală a relevanței | 50-100ms/doc | procesare locală UE |
| Full query end-to-end | <30s | pipeline complet de verificare |
4. Cost per întrebare juridică
LexLord folosește o cascadă adaptivă: pentru queries simple, costul este zero. Pentru queries enterprise complexe, costul maxim este $0.10. Median cost per query <$0.01.
| Tier | Scope | Latency | Cost |
|---|---|---|---|
| T1 FREE | regex + temporal | <50ms | $0 |
| T2 FREE+ | NLI local (qwen3.5:4b) | <200ms | $0 |
| T3 PRO | CitationValidator + provenance score | ~3s | ~$0.01 |
| T4 ENTERPRISE | Evaluare multi-nivel + regenerare completa | ~10-30s | ~$0.05-0.10 |
5. Cum caută LexLord în surse oficiale
- Căutare semantică: Motor antrenat pe corpus juridic RO — înțelege sinonimele și contextul legal, nu doar cuvintele exacte
- Căutare avansată bazată pe text: Complementează căutarea semantică cu relevanță pe termeni juridici exacți
- Fuzionare inteligentă: Combină rezultatele din ambele motoare pentru cel mai relevant set final
- Clasificare relevanță finală: Ordonare după relevanță reală pentru cazul tău, nu popularitate
- Ponderi: 70% înțelegere semantică + 30% potrivire text exact
- Baza de date juridică: 956.000 documente indexate live + corpus în expansiune continuă din 60+ surse oficiale
- Metadata per document: 156 câmpuri structurate — sursă, lege, articol, dată, jurisdicție, domeniu, status vigoare
6. De ce un model specializat pe română bate modele pentru 100 de limbi
Empiric, modelele specializate pe limba română bat modelele multilingue chiar și pe parametri mai mulți:
| Model base | Parameteri | Discrim ratio | Verdict |
|---|---|---|---|
bert-base-romanian-cased-v1 | 124M (100% RO) | 0.0720 | CÂȘTIGĂTOR — folosit de LexLord |
EuroBERT-210M | 212M (15 limbi) | 0.0658 | Mai slab |
xlm-roberta-base | 278M (100 limbi) | 0.0006 | Catastrofic pentru RO |
+8.5x viteză și +10% acuratețe pentru modelul specializat RO vs EuroBERT-210M (de 1.7x mai mare ca parametri).
7. Cum verifică LexLord că nu inventează legi — metodologie
- Verificare prin contraexemple: Sistem care caută activ surse care ar putea contrazice răspunsul — blocând afirmații fără suport.
- Verificare per-propoziție: Fiecare propoziție din răspuns e verificată independent față de sursele juridice reale. Răspunsul nu trece dacă scorul de ancoraj e sub pragul de siguranță.
- Verificare corectivă a surselor: Dacă sursele găsite nu sunt suficient de relevante, sistemul caută din nou.
- Verificare semantică blocantă: Răspunsul nu trece dacă trust score <0.5.
8. Methodology
- Test set NER: 200 queries juridice RO cu ground truth manual de avocat senior.
- Test set Intent: 6 clase balansate, 50 exemple/clasă, ground truth dublu-adnotat.
- Test set Domain: 10 clase, 30 exemple/clasă, ground truth specialist materie.
- Benchmark viteză procesare: 1000 măsurători pe server de producție, comparate cu configurație neoptimizată pe același hardware.
- Timpii de răspuns: măsurați pe 10.000 de cereri reale în producție, mai 2026.
- Cost: calculat pe baza prețului real plătit pentru modelul AI principal (infrastructură cloud EU-compliant).
- Acuratețe finală: cifră țintă bazată pe compunerea straturilor independente de verificare — publicăm raport public cu 500 întrebări juridice + răspunsuri verificate de avocați senior până la 15 iulie 2026, înainte de versiunea 1.0 stabilă.