13 lipnja, 2026 9:16 pm

SuperCLUE AI poredak, Gemini, GPT-5.5, Claude-Opus i Gemini-Flash

PREMIUM ANALIZA
UMJETNA INTELIGENCIJA
28. svibnja 2026.

Kineski AI se bore za peto mjesto

Najnoviji rezultati SuperCLUE evaluacije pokazuju da Gemini, GPT-5.5, Claude-Opus i Gemini-Flash čvrsto drže prve četiri pozicije. DeepSeek-V4-Pro, Qwen3.7-Max i Doubao Seed 2.0 Pro natječu se za peto mjesto, ali u generiranju koda, Kinezi su već drugi u svijetu.

SuperCLUE, vodeći kineski benchmark za evaluaciju velikih jezičnih modela, objavio je najnovije rezultate. Evaluacija je obuhvatila 21 glavni model iz domaćih i međunarodnih izvora, s 492 pitanja raspoređenih u šest zadataka: matematičko zaključivanje, znanstveno zaključivanje, generiranje koda, inteligentni agent (planiranje zadataka), precizno praćenje uputa i upravljanje iluzijom. Rezultati pokazuju da četiri inozemna modela Gemini, GPT-5.5, Claude-Opus i Gemini-Flash čvrsto drže prve četiri pozicije, tvoreći “nepokolebljivu prvu razinu”.

21
evaluiranih modela
492
testnih pitanja
4
inozemna modela u vrhu
5.
mjesto (najbolji kineski model)

Četiri inozemna modela dominiraju

Prema najnovijim rezultatima, Gemini, GPT-5.5, Claude-Opus i Gemini-Flash četiri su modela koja čvrsto drže prve četiri pozicije. Ova četvorica tvore “nepokolebljivu prvu razinu” razmak između njih i petoplasiranog modela je značajan.

 Šest evaluiranih zadataka:

  •  Matematičko zaključivanje – rješavanje složenih matematičkih problema
  •  Znanstveno zaključivanje – fizika, kemija, biologija
  •  Generiranje koda – programiranje u više jezika
  •  Inteligentni agent (Agent) – planiranje zadataka i korištenje alata
  •  Precizno praćenje uputa – točnost izvršavanja složenih instrukcija
  •  Upravljanje iluzijom (Hallucination) – sprječavanje izmišljanja činjenica

Kineski modeli: Borba za peto mjesto

DeepSeek-V4-Pro, Qwen3.7-Max i Doubao Seed 2.0 Pro tri su najbolja domaća modela. Njihovi rezultati vrlo su bliski, a globalni rangovi koncentrirani su oko petog mjesta. Ova trojka čini “najvišu razinu u Kini”, ali na globalnoj razini, mogu se natjecati samo za peto mjesto.

🇨🇳 DeepSeek-V4-Pro
Najbolji kineski model otvorenog koda, poznat po izvrsnim performansama u zaključivanju i ekonomičnosti
🇨🇳 Qwen3.7-Max
Alibabin vodeći model drugo mjesto u generiranju koda, manje od 2 boda zaostatka za prvoplasiranim
🇨🇳 Doubao Seed 2.0 Pro
ByteDanceov model, poznat po izvrsnim performansama u zadacima planiranja i korištenja alata

Svijetla točka: Kina druga u svijetu u generiranju koda

Iako domaći modeli zaostaju u ukupnom poretku, Qwen3.7-Max osvojio je drugo mjesto u projektu generiranja koda, odmah iza najboljeg inozemnog modela, s razlikom manjom od 2 boda. U projektima matematičkog i znanstvenog zaključivanja, domaći modeli su se također više puta svrstali među najbolje u svijetu.

 Generiranje koda gdje Kina blista:

  • Qwen3.7-Max – 2. mjesto u svijetu, razlika manja od 2 boda
  • DeepSeek-V4-Pro – također u vrhu, posebno jak u Python i JavaScriptu
  • Doubao Seed 2.0 Pro – izvrstan u složenim algoritamskim zadacima

Cijena vs. performanse: Kineski modeli povoljniji

Što se tiče isplativosti (cost-effectiveness), domaći modeli imaju značajnu prednost. Mnogi proizvodi ulaze u raspon visokih performansi i niske cijene, postižući gotovo vrhunske rezultate uz znatno nižu cijenu.

Međutim, što se tiče performansi (raw performance), inozemni modeli i dalje dominiraju u rasponu visokih performansi, dok su domaći modeli uglavnom u niskom do srednjem rasponu, što ukazuje na prostor za poboljšanje.

Trend: Jaz se smanjuje, ali vrh ostaje nedostižan

Gledajući trendove, domaća velika vozila brzo sustižu. Prema ranijim SuperCLUE izvješćima, jaz između najboljih kineskih i najboljih inozemnih modela smanjio se s 10.42% u svibnju 2025. na 7.78% u srpnju 2025.. Međutim, globalna vrhunska klasa zasad ostaje nepromijenjena Gemini, GPT-5.5, Claude-Opus i Gemini-Flash i dalje su nedostižni.

 Povijesni podaci – smanjenje jaza:

  • Svibanj 2025.: Razlika 10.42%
  • Srpanj 2025.: Razlika 7.78%
  • Ožujak 2026.: Doubao Seed 2.0 razlika samo 0.95 boda od GPT-5.4
  • Svibanj 2026.: Qwen3.7-Max 2. mjesto u kodiranju, razlika <2 boda

Zašto je ovo važno?

Ova evaluacija pokazuje trenutno stanje globalne AI utrke. S jedne strane, američki modeli (OpenAI, Google, Anthropic) i dalje dominiraju vrhom. S druge strane, Kina ubrzano sustiže posebice u područjima poput generiranja koda, gdje su već drugi u svijetu.

Za krajnje korisnike, ovo znači:

  •  Niže cijene – kineski modeli nude konkurentne performanse po znatno nižoj cijeni
  •  Brži razvoj – konkurencija potiče inovacije i na Zapadu i na Istoku
  •  Više izbora – niste ograničeni samo na američke modele

SuperCLUE rezultati pokazuju realnu sliku globalne AI utrke. Četiri inozemna modela (Gemini, GPT-5.5, Claude-Opus, Gemini-Flash) i dalje dominiraju vrhom, dok se najbolji kineski modeli (DeepSeek-V4-Pro, Qwen3.7-Max, Doubao Seed 2.0 Pro) natječu za peto mjesto. Ipak, Kina ubrzano sustiže posebice u generiranju koda, gdje su već drugi u svijetu, s razlikom manjom od 2 boda. Dok se čeka “kineski ChatGPT trenutak”, jedno je sigurno utrka je daleko od gotove, a Kina ne namjerava odustati.


 Izvori: SuperCLUE (cluebenchmarks.com)

Autor: Redakcija | : Sat-Multimedia & IT

📚 Najčitaniji članci:

 

O SatFun fanatik

Pročitaj i ovo

Podmorski podatkovni centri i Kina

 Podatkovni centri, AI infrastruktura, oceansko hlađenje Kina pionirski skalira AI infrastrukturu korištenjem oceanskog hlađenja Dok …