Claude Fable 5 a găsit peste 10.000 de vulnerabilităţi, acum public

Timp de 27 de ani, un singur defect a rămas neatins în OpenBSD, unul dintre sistemele de operare în care au încredere băncile, firewallurile şi serverele din spatele site-urilor de zi cu zi. Oricine putea ajunge la maşină printr-o reţea o putea bloca, iar vreme de aproape trei decenii nimeni nu a observat. Un model Anthropic numit Mythos a observat. Acum acel model are o faţă publică: Anthropic a lansat Claude Fable 5, prima versiune a celui mai capabil sistem al său la care oricine se poate înscrie pentru a o folosi.

Ceea ce face Fable 5 demn de atenţie nu este un loc într-un clasament. Este faptul că modelul din spate citeşte software-ul aşa cum un auditor cu experienţă citeşte un contract, până dă de singura clauză care strică totul. În cadrul unui program de cercetare pe care Anthropic îl numeşte Project Glasswing, versiunea preliminară a parcurs peste o mie de proiecte open source, codul liber şi partajat care pune în mişcare cea mai mare parte a internetului, şi a semnalat peste 23.000 de probleme. Mai mult de 10.000 au fost suficient de grave încât să fie clasificate drept ridicate sau critice.

Detaliul care i-a tulburat chiar şi pe cercetătorii Anthropic este că nimeni nu a învăţat modelul să facă asta. Compania susţine că abilitatea de a găsi şi de a exploata slăbiciuni nu a fost niciodată un obiectiv de antrenare: a apărut de la sine, pe măsură ce modelul raţiona tot mai bine despre cod. FFmpeg este exemplul cel mai clar. Un defect se ascundea de 16 ani în acel software de procesare video, motorul din spatele a nenumărate aplicaţii de streaming şi playere, cuibărit într-o linie de cod pe care instrumentele de testare automată o declanşaseră de cinci milioane de ori fără să sesizeze vreodată pericolul. Modelul l-a sesizat.

Pentru cei mai mulţi oameni, nimic din toate acestea nu se vede. Software-ul verificat de Mythos este infrastructură invizibilă: motorul navigatorului, nucleul sistemului de operare, biblioteca media îngropată în interiorul unui telefon. Dar invizibilul este tocmai problema. Defectele scoase la lumină supravieţuiseră fiindcă trăiau într-un cod prea vechi, prea plictisitor sau prea adânc pentru ca cineva să continue să-l recitească. Un instrument capabil să recitească tot, fără să obosească, schimbă şansele celor care întreţin temeliile internetului şi, în mâini greşite, ale celor care ar vrea să le atace.

Cifre ca acestea înseamnă ceva doar raportate la o măsură. La CyberGym, un test care verifică dacă un model poate reproduce o vulnerabilitate de securitate reală, motorul Mythos din Fable obţine 83,1 la sută, faţă de 66,6 la sută la precedentul Claude Opus 4.6: cam diferenţa dintre un analist debutant competent şi un specialist care rareori greşeşte. Câştigurile nu se opresc la securitate. Compania de analiză Hex a raportat că Fable a fost primul model care a depăşit 90 la sută la testul său intern, iar primii utilizatori descriu salturi asemănătoare în dezvoltarea de software, analiza datelor şi proiectarea interfeţelor.

Apoi vine răsturnarea. Fable 5 public nu va face tocmai lucrul care îl face remarcabil. Anthropic a izolat patru domenii, securitatea cibernetică, biologia, chimia şi o tehnică de copiere numită distilare, iar când o cerere se apropie de ele, Fable predă în tăcere conversaţia modelului mai vechi şi mai sigur, Claude Opus 4.8. Compania spune că asta se întâmplă rar, iar primele date arată că cel puţin 95 la sută din sesiuni rulează integral pe Fable. Rezultatul este un produs neobişnuit: cel mai capabil model lansat vreodată de Anthropic, oprit intenţionat să-şi folosească abilitatea cea mai ascuţită.

Acest design lasă întrebări la care lansarea nu răspunde pe deplin. O barieră care se dă la o parte în 5 la sută din cazuri rămâne o barieră cu cusături, iar linia dintre a explica cum funcţionează un software şi a explica cum să-l spargi este rareori curată. Anthropic afirmă că un program extern de recompense pentru erori a rulat peste 1.000 de ore fără să găsească o cale universală de a ocoli limitele, dar acestea sunt cifrele propriei companii, neverificate de vreun reglementator extern. Mai există un cost pe care cei mai mulţi îl vor simţi întâi: Fable 5 costă 10 dolari pe milionul de tokeni la intrare şi 50 pe milion la ieşire, unităţile aproximative pe care un model le taxează pentru citit şi scris, dublul preţului lui Opus 4.8. Iar oricine îl foloseşte cedează ceva mai tăcut, fiindcă Anthropic păstrează acum 30 de zile de date de utilizare chiar şi pentru clienţii care de obicei plătesc pentru a nu păstra nimic, numind asta o apărare împotriva abuzului.

Deocamdată, accesul depinde de felul în care foloseşti deja Claude. Programatorii ajung la Fable 5 imediat prin interfaţa de programare a Anthropic, iar o versiune separată, numită Mythos 5, a fost predată unui grup restrâns de organizaţii aprobate în prealabil, alături de o coaliţie a industriei care include Apple, Google, Microsoft, Nvidia şi Linux Foundation, toate ocupate să repare ceea ce modelul găseşte înainte ca atacatorii să o poată face. Anthropic a alocat 100 de milioane de dolari în credite de model şi 4 milioane în donaţii directe către grupurile de securitate open source care fac această reparaţie.

Lansarea mai amplă urmează un calendar. Abonaţii planurilor Pro, Max, Team şi Enterprise pe loc ale Anthropic primesc Fable 5 fără cost suplimentar până pe 22 iunie; de pe 23 iunie, folosirea lui consumă credite. Dacă barierele vor rezista atunci când milioane de utilizatori noi vor împinge în ele rămâne partea încă nelămurită. Faptul mai uimitor nu rămâne. O maşină poate citi acum codul de sub viaţa modernă şi poate găsi fisurile care au scăpat tuturor vreme de o generaţie, iar întrebarea care urmează nu mai este dacă poate, ci cine are dreptul să i-o ceară.

Etichete: știri, Anthropic, tech-en1, securitate cibernetică, modele AI, Project Glasswing