Tehnologie

LongCat 2.0, modelul AI chinezesc care a depășit GPT-5.5 fără chip-uri Nvidia

Susan Hill

LongCat 2.0 are 1,6 trilioane de parametri, procesează o fereastră de context de un milion de token-uri și tocmai a depășit GPT-5.5 al OpenAI pe benchmark-ul de referință pentru inginerie software reală. A fost construit de Meituan — o companie pe care cei mai mulți oameni din afara Chinei o cunosc, dacă o cunosc, ca aplicație de livrare mâncare.

Modelul a obținut 59,5 pe SWE-bench Pro față de 58,6 al GPT-5.5. Marginea pare mică, dar contextul este cel care face realizarea remarcabilă. Meituan a antrenat LongCat 2.0 pe peste 50.000 de acceleratoare AI de fabricație chineză, fără hardware Nvidia, pe care China nu îl poate importa în cantitate din 2022. Producătorul nu a fost confirmat oficial, dar comunitatea tehnică indică seria Huawei Ascend 910B. Dacă e corect, ar fi prima dată când un model antrenat pe chip-uri Huawei atinge performanțe de frontieră în benchmark-uri publice verificabile.

LongCat 2.0 folosește o arhitectură Mixture-of-Experts: per interogare se activează între 33 și 56 de miliarde de parametri, ceea ce menține inferența rapidă. Fereastra de context de un milion de token-uri permite citirea unei baze de cod complete într-o singură sesiune. Pe SWE-bench Multilingual a obținut 77,3; pe Terminal-Bench, care testează navigarea într-un mediu Unix real, a atins 70,8.

Înainte de anunțul oficial, modelul a funcționat pe OpenRouter sub numele „Owl Alpha” timp de aproximativ două luni. Cei care l-au folosit au observat capacitățile neobișnuite de codificare fără să știe originea sa. Meituan a confirmat după lansare că Owl Alpha era LongCat 2.0 într-o fază anterioară de evaluare.

Licența MIT nu spune totul. Deși este una dintre cele mai deschise disponibile, greutățile modelului nu au fost încă publicate — atât GitHub cât și Hugging Face spun „în curând”. Deocamdată accesul se face doar prin API găzduită, fără descărcare sau ajustare locală.

Meituan procesează zilnic peste 50 de milioane de comenzi alimentare și a construit intern un model de limbaj numit Zhichi. LongCat 2.0 este primul model public al companiei și, prin performanțele de benchmark, unul dintre cele mai capabile sisteme de codificare disponibile sub licență deschisă.

Când greutățile vor fi disponibile, LongCat 2.0 va concura direct cu Llama 4.1 de la Meta și DeepSeek-V4 Pro. Răspunsul la întrebarea despre chip-urile domestice va conta mult dincolo de lumea AI.

Etichete: , , , , ,

Discuție

Există 0 comentarii.