A Google DeepMind Gemini aranyérmet szerzett a 2025-ös Nemzetközi Matematikai Olimpián

Tavaly csak a DeepMind AlphaProof és AlphaGeometry 2 modellje érte el az ezüstérmet. A képen a Google absztrakt művészete. (Kép forrása: Google)

A Google DeepMind Gemini hat IMO 2025 problémából ötöt megoldott, és ezzel arany fokozatú elismerést kapott. A megoldásokat természetes nyelven adta meg a versenyre rendelkezésre álló 4,5 órás időablakon belül.

Anubhav Sharma (fordította Ninh Duy), Közzétett 07/22/2025 🇺🇸 🇪🇸 ...

A 66. nemzetközi matematikai olimpia (IMO) ausztráliában a mesterséges intelligencia szempontjából elég nagyszabású volt. A versenyen első alkalommal a Google DeepMind Gemini "Deep Think" modellje aranyérmes szintű teljesítményt ért el, hat kivételesen nehéz olimpiai feladatból ötöt megoldott, és 42 pontból 35 pontot szerzett, ami megfelel az IMO értékelő bizottsága által meghatározott arany küszöbértéknek.

Ez elég nagy előrelépés a tavalyi évhez képest, amikor a DeepMind AlphaProof és AlphaGeometry 2 csak az ezüstérmes szintet érte el négy probléma megoldásával és 28 ponttal. Az előbbi rendszereknél a természetes nyelv és a formális bizonyítási nyelvek közötti fordításra volt szükség, és a megoldások kiszámítása több napot vett igénybe.

Idén a Gemini végponttól végpontig csak természetes nyelvet használt, és a 4,5 órás versenyidőszakban közvetlenül a hivatalos IMO leírásokból teljes, szigorú megoldásokat állított elő. Az IMO hivatalos osztályozói - akik az emberi versenyzőket is értékelik - "világosnak" és "pontosnak" minősítették a Gemini válaszait A DeepMind ezt az előrelépést a fejlett megerősítő tanulási technikáknak, a matematikai megoldások kurátori adatbázisának és az új párhuzamos következtetési módszereknek tulajdonította, amelyek lehetővé teszik több megoldási útvonal egyidejű feltárását. Míg más mesterséges intelligencia rendszerek, köztük a OpenAIállítólag hasonló, nem hivatalos eredményeket értek el, a Gemini értékelését az olimpia koordinátorai hivatalosan is hitelesítették, ami világújdonság az autonóm matematikai rendszerek esetében.

A DeepMind azt tervezi, hogy a Deep Think modellt a szélesebb körű bevezetés előtt kiválasztott matematikusok számára teszi elérhetővé, miközben továbbra is a természetes nyelvű és a formális érvelő ágenseket is a matematikai kutatásokhoz használja.