Tehnologie

Claude Fable 5 revine online după 18 zile: Anthropic a blocat vulnerabilitatea, nu a limitat modelul

Adrian Kessler

Claude Fable 5, cel mai capabil model de inteligență artificială publicat de Anthropic, este din nou disponibil la nivel global. Revenirea vine după optsprezece zile de suspendare totală, declanșată când guvernul american a impus controale la export care obligau Anthropic să verifice în timp real naționalitatea utilizatorilor. Neputând îndeplini această cerință la scara globală a bazei de utilizatori Claude, compania a ales suspendarea completă în locul conformității parțiale.

Tehnica care a declanșat controalele era o metodă de jailbreak descoperită de cercetători de la Amazon. Metoda folosea Fable 5 pentru a cartografia vulnerabilități software în moduri pe care restricțiile de export americane le interzic pentru anumiți cetățeni străini. Investigația internă a dezvăluit ceva care complică logica regulatorie: aceleași categorii de vulnerabilități puteau fi identificate cu modele mult mai puțin capabile — printre care Opus 4.8, GPT-5.5 și Kimi K2.7. Capacitatea în cauză nu era deci exclusivă Fable 5.

Soluția care a deblocat controalele

Noutatea este un clasificator de securitate antrenat special pentru a bloca tehnica documentată de Amazon. Anthropic raportează că acesta interceptează metoda divulgată în peste 99 la sută din cazuri. Nu este o garanție de protecție totală împotriva viitoarelor jailbreak-uri — este o corecție țintită pentru o vulnerabilitate cunoscută. Clasificatorul acționează la nivel de intrare, redirecționând cererile care corespund tiparelor documentate înainte ca modelul să le proceseze.

Implicația mai largă privește evoluția reglementării inteligenței artificiale. Controalele la export au fost aplicate Fable 5 nu pentru că modelul era singurul capabil să cauzeze dauna, ci pentru că o tehnică cunoscută îl exploata. Au fost ridicate nu pentru că cadrul de reglementare a rezolvat problema, ci pentru că un clasificator a închis brecha documentată. Anthropic lucrează cu Amazon, Microsoft și Google la un cadru comun de evaluare a gravității jailbreak-urilor AI, bazat pe patru criterii: câștig de capacitate, amploarea acestuia, ușurința weaponizării și detectabilitatea. Acel cadru nu există încă ca standard public.

Ce face modelul și cât costă

Modelul în sine nu s-a schimbat. Fable 5 este conceput pentru raționament complex pe termen lung și lucru agentic — sarcini care necesită planificare, execuție și corectarea cursului pe secvențe extinse fără aprobare umană la fiecare pas. Fereastra de context este de un milion de token-uri, care este și valoarea implicită. Producția maximă per răspuns este de 128.000 de token-uri. Gândirea este mereu activă și returnată ca rezumat lizibil, nu ca lanț de gândire brut.

Accesul vine cu condiții inexistente înainte de suspendare. Fable 5 necesită acum retenție de date pe 30 de zile — nu este disponibil în cadrul acordurilor de retenție zero. Aceasta afectează direct organizații din sănătate, juridice și guvernamentale unde acordurile zero-retenție sunt adesea cerința de bază pentru adoptarea instrumentelor AI. Prețul depășește nivelul Opus: zece dolari per milion de token-uri la intrare, cincizeci la ieșire. Cererile care activează clasificatoarele de securitate pot fi redirecționate către un model alternativ în locul refuzului, iar dacă substituția este vizibilă sau nu pentru utilizatorul final depinde de configurația fiecărui operator.

Disponibilitate

Fable 5 are un model sibling, Claude Mythos 5, cu aceleași capacități de bază și același preț, dar cu funcții ofensive de securitate cibernetică pe care Fable 5 nu le include. Mythos 5 este disponibil prin Project Glasswing. Accesul la Mythos 5 a fost restaurat pentru anumite organizații americane cu o săptămână înainte de revenirea globală a Fable 5.

Fable 5 este disponibil acum pe platforma Claude, Claude.ai, Claude Code și Claude Cowork. Pentru planurile Pro, Max, Team și anumite Enterprise, modelul este inclus pentru până la 50 la sută din limitele săptămânale de utilizare până pe 7 iulie, după care trece la tarifare prin credite de utilizare. Accesul prin AWS, Google Cloud și Microsoft Foundry este restaurat treptat. Cadrul care va reglementa răspunsul la următoarea tehnică de bypass este încă în construcție.

Etichete: , , , , ,

Discuție

Există 0 comentarii.