Tehnologie

DeepSeek a ieftinit IA, iar bula americană mizează pe opusul ei

Susan Hill

DeepSeek, un laborator chinez ieșit dintr-un fond speculativ cantitativ, face cu încăpățânare exact ceea ce industria americană de IA considera imposibil. Construiește modele care se apropie de frontieră, le antrenează cu o fracțiune din ce cheltuiesc rivalii din Statele Unite și apoi publică ponderile, ca oricine să le descarce și să le ruleze. Fiecare lansare redeschide aceeași dezbatere: evaluarea întregului sector american de IA se sprijină pe o presupunere pe care DeepSeek o demontează încet, anume că inteligența trebuie să rămână scumpă.

Presupunerea nu e abstractă. Susține sute de miliarde de dolari în centre de date aflate în construcție, cotațiile producătorilor de cipuri și ale furnizorilor de cloud prezenți în aproape orice fond indexat și abonamentul lunar pe care mulți cititori îl plătesc deja pentru un chatbot. Dacă un rival oferă rezultate comparabile cu mult mai puțin și dăruiește software-ul, prima legată de o putere de calcul rară și costisitoare seamănă mai puțin a șanț de apărare și mai mult a pariu.

Argumentul DeepSeek ține de eficiență, nu de magie. Inginerii au mizat pe o arhitectură de tip amestec de experți care activează doar o parte din model la fiecare cerere, pe folosirea intensă a calculelor de precizie redusă și pe fluxuri de antrenare reglate să meargă cu mai puține cipuri, parțial restricționate la export. Cifra cel mai des repetată pentru una dintre rulările principale a rămas sub șase milioane de dolari. Rulările americane echivalente costă de multe ori mai mult, odată adunată nota completă.

Contează la fel de mult cum este publicat modelul și cât a costat. DeepSeek scoate ponderi deschise, așa că un programator din São Paulo, un laborator universitar din Varșovia sau un start-up din Seul pot descărca modelul și îl pot rula pe propriile mașini, fără să platească un furnizor american la fiecare cerere și fără să-și trimită datele peste hotare. Există o ironie aici: controalele la export menite să încetinească IA chineză tăindu-i cele mai puternice cipuri par să fi împins DeepSeek să stoarcă mai mult din mai puțin, iar aceste metode economice călătoresc acum oriunde ajung ponderile deschise.

Pentru cel care doar folosește aceste unelte, efectul imediat este alegerea. Modelele mai ieftine apasă în jos prețurile abonamentelor, aduc asistenți mai capabili pe laptopuri și telefoane obișnuite și slăbesc motivul de a te lega de un singur furnizor. Ceea ce părea un serviciu închiriat începe să semene cu un software pe care îl poți deține.

Discursul despre bulă cere rezerve mari. Cifra de sub șase milioane de dolari acoperă o singură rulare finală de antrenare, nu cercetarea, fundăturile, salariile sau hardware-ul care au făcut-o posibilă, așa că a o pune față în față cu cheltuiala totală a unui laborator american înseamnă a compara două lucruri diferite. Ponderile deschise nu sunt nici cod deschis; datele de antrenare și metoda completă rămân private. Iar argumentul eficienței taie în ambele sensuri. Întrebată despre DeepSeek, conducerea Microsoft a invocat paradoxul lui Jevons, vechea observație că, atunci când o resursă devine mai ieftin de folosit, consumul total tinde să urce, nu să scadă. Inteligența mai ieftină ar putea însemna pur și simplu că lumea cumpără mult mai multă, o veste bună pentru cei care vând putere de calcul, nu una proastă.

Nu e nici prima dată când bula e declarată moartă. Același laborator a provocat cândva cea mai mare pierdere de valoare bursieră într-o singură zi din istoria Statelor Unite, ștergând aproape șase sute de miliarde de dolari de la un producător de cipuri într-o după-amiază, apoi a privit cum acțiunea recupera aproape tot în câteva săptămâni. Marile companii americane de IA nu au răspuns cheltuind mai puțin. Au strâns mai mult și au construit mai mare. Orice afirmație că bula a spart în sfârșit trebuie să supraviețuiască faptului că tocmai cei cu cei mai mulți bani în joc își dublează miza.

Ceea ce a făcut DeepSeek de fapt este mai greu de dramatizat decât o bulă care se sparge. A luat confortul de a presupune că laboratoarele americane de frunte sunt apărate de un zid de capital pe care nimeni altcineva nu-l poate urca. Dacă o capacitate de frontieră poate fi aproximată ieftin și împărțită gratis, valoarea încetează să stea în a deține modelul. Se mută spre distribuție, spre produsele construite în jurul modelului și spre cine deține clientul. Următorul test e deja în calendar, chiar fără o dată trecută: fiecare nouă lansare DeepSeek redeschide aceeași întrebare și cade într-o piață care s-a angajat să cheltuiască mai mult, nu mai puțin, convinsă că scara încă învinge. Se va lămuri în rezultatele trimestriale și în prognozele de investiții din lunile următoare, nu într-un fir de forum care dă lupta drept încheiată.

Discuție

Există 0 comentarii.