UMJETNA INTELIGENCIJA
28. svibnja 2026.
Kineski AI se bore za peto mjesto
Najnoviji rezultati SuperCLUE evaluacije pokazuju da Gemini, GPT-5.5, Claude-Opus i Gemini-Flash čvrsto drže prve četiri pozicije. DeepSeek-V4-Pro, Qwen3.7-Max i Doubao Seed 2.0 Pro natječu se za peto mjesto, ali u generiranju koda, Kinezi su već drugi u svijetu.
SuperCLUE, vodeći kineski benchmark za evaluaciju velikih jezičnih modela, objavio je najnovije rezultate. Evaluacija je obuhvatila 21 glavni model iz domaćih i međunarodnih izvora, s 492 pitanja raspoređenih u šest zadataka: matematičko zaključivanje, znanstveno zaključivanje, generiranje koda, inteligentni agent (planiranje zadataka), precizno praćenje uputa i upravljanje iluzijom. Rezultati pokazuju da četiri inozemna modela Gemini, GPT-5.5, Claude-Opus i Gemini-Flash čvrsto drže prve četiri pozicije, tvoreći “nepokolebljivu prvu razinu”.
Četiri inozemna modela dominiraju
Prema najnovijim rezultatima, Gemini, GPT-5.5, Claude-Opus i Gemini-Flash četiri su modela koja čvrsto drže prve četiri pozicije. Ova četvorica tvore “nepokolebljivu prvu razinu” razmak između njih i petoplasiranog modela je značajan.
Šest evaluiranih zadataka:
- Matematičko zaključivanje – rješavanje složenih matematičkih problema
- Znanstveno zaključivanje – fizika, kemija, biologija
- Generiranje koda – programiranje u više jezika
- Inteligentni agent (Agent) – planiranje zadataka i korištenje alata
- Precizno praćenje uputa – točnost izvršavanja složenih instrukcija
- Upravljanje iluzijom (Hallucination) – sprječavanje izmišljanja činjenica
Kineski modeli: Borba za peto mjesto
DeepSeek-V4-Pro, Qwen3.7-Max i Doubao Seed 2.0 Pro tri su najbolja domaća modela. Njihovi rezultati vrlo su bliski, a globalni rangovi koncentrirani su oko petog mjesta. Ova trojka čini “najvišu razinu u Kini”, ali na globalnoj razini, mogu se natjecati samo za peto mjesto.
Svijetla točka: Kina druga u svijetu u generiranju koda
Iako domaći modeli zaostaju u ukupnom poretku, Qwen3.7-Max osvojio je drugo mjesto u projektu generiranja koda, odmah iza najboljeg inozemnog modela, s razlikom manjom od 2 boda. U projektima matematičkog i znanstvenog zaključivanja, domaći modeli su se također više puta svrstali među najbolje u svijetu.
Generiranje koda gdje Kina blista:
- Qwen3.7-Max – 2. mjesto u svijetu, razlika manja od 2 boda
- DeepSeek-V4-Pro – također u vrhu, posebno jak u Python i JavaScriptu
- Doubao Seed 2.0 Pro – izvrstan u složenim algoritamskim zadacima
Cijena vs. performanse: Kineski modeli povoljniji
Što se tiče isplativosti (cost-effectiveness), domaći modeli imaju značajnu prednost. Mnogi proizvodi ulaze u raspon visokih performansi i niske cijene, postižući gotovo vrhunske rezultate uz znatno nižu cijenu.
Međutim, što se tiče performansi (raw performance), inozemni modeli i dalje dominiraju u rasponu visokih performansi, dok su domaći modeli uglavnom u niskom do srednjem rasponu, što ukazuje na prostor za poboljšanje.
Trend: Jaz se smanjuje, ali vrh ostaje nedostižan
Gledajući trendove, domaća velika vozila brzo sustižu. Prema ranijim SuperCLUE izvješćima, jaz između najboljih kineskih i najboljih inozemnih modela smanjio se s 10.42% u svibnju 2025. na 7.78% u srpnju 2025.. Međutim, globalna vrhunska klasa zasad ostaje nepromijenjena Gemini, GPT-5.5, Claude-Opus i Gemini-Flash i dalje su nedostižni.
Povijesni podaci – smanjenje jaza:
- Svibanj 2025.: Razlika 10.42%
- Srpanj 2025.: Razlika 7.78%
- Ožujak 2026.: Doubao Seed 2.0 razlika samo 0.95 boda od GPT-5.4
- Svibanj 2026.: Qwen3.7-Max 2. mjesto u kodiranju, razlika <2 boda
Zašto je ovo važno?
Ova evaluacija pokazuje trenutno stanje globalne AI utrke. S jedne strane, američki modeli (OpenAI, Google, Anthropic) i dalje dominiraju vrhom. S druge strane, Kina ubrzano sustiže posebice u područjima poput generiranja koda, gdje su već drugi u svijetu.
Za krajnje korisnike, ovo znači:
- Niže cijene – kineski modeli nude konkurentne performanse po znatno nižoj cijeni
- Brži razvoj – konkurencija potiče inovacije i na Zapadu i na Istoku
- Više izbora – niste ograničeni samo na američke modele
SuperCLUE rezultati pokazuju realnu sliku globalne AI utrke. Četiri inozemna modela (Gemini, GPT-5.5, Claude-Opus, Gemini-Flash) i dalje dominiraju vrhom, dok se najbolji kineski modeli (DeepSeek-V4-Pro, Qwen3.7-Max, Doubao Seed 2.0 Pro) natječu za peto mjesto. Ipak, Kina ubrzano sustiže posebice u generiranju koda, gdje su već drugi u svijetu, s razlikom manjom od 2 boda. Dok se čeka “kineski ChatGPT trenutak”, jedno je sigurno utrka je daleko od gotove, a Kina ne namjerava odustati.
Izvori: SuperCLUE (cluebenchmarks.com)
Autor: Redakcija | : Sat-Multimedia & IT
📚 Najčitaniji članci:
Sat-Multimedia & IT portal Satelitska-IPTV-Multimedija od 2006
