A 66. nemzetközi matematikai olimpia (IMO) ausztráliában a mesterséges intelligencia szempontjából elég nagyszabású volt. A versenyen első alkalommal a Google DeepMind Gemini "Deep Think" modellje aranyérmes szintű teljesítményt ért el, hat kivételesen nehéz olimpiai feladatból ötöt megoldott, és 42 pontból 35 pontot szerzett, ami megfelel az IMO értékelő bizottsága által meghatározott arany küszöbértéknek.
Ez elég nagy előrelépés a tavalyi évhez képest, amikor a DeepMind AlphaProof és AlphaGeometry 2 csak az ezüstérmes szintet érte el négy probléma megoldásával és 28 ponttal. Az előbbi rendszereknél a természetes nyelv és a formális bizonyítási nyelvek közötti fordításra volt szükség, és a megoldások kiszámítása több napot vett igénybe.
Idén a Gemini végponttól végpontig csak természetes nyelvet használt, és a 4,5 órás versenyidőszakban közvetlenül a hivatalos IMO leírásokból teljes, szigorú megoldásokat állított elő. Az IMO hivatalos osztályozói - akik az emberi versenyzőket is értékelik - "világosnak" és "pontosnak" minősítették a Gemini válaszait A DeepMind ezt az előrelépést a fejlett megerősítő tanulási technikáknak, a matematikai megoldások kurátori adatbázisának és az új párhuzamos következtetési módszereknek tulajdonította, amelyek lehetővé teszik több megoldási útvonal egyidejű feltárását. Míg más mesterséges intelligencia rendszerek, köztük a OpenAIállítólag hasonló, nem hivatalos eredményeket értek el, a Gemini értékelését az olimpia koordinátorai hivatalosan is hitelesítették, ami világújdonság az autonóm matematikai rendszerek esetében.
A DeepMind azt tervezi, hogy a Deep Think modellt a szélesebb körű bevezetés előtt kiválasztott matematikusok számára teszi elérhetővé, miközben továbbra is a természetes nyelvű és a formális érvelő ágenseket is a matematikai kutatásokhoz használja.
Forrás(ok)
» A Top 10 multimédiás noteszgép - tesztek alapján
» A Top 10 játékos noteszgép
» A Top 10 belépő szintű üzleti noteszgép
» A Top 10 üzleti noteszgép
» A Top 10 notebook munkaállomása
» A Top 10 okostelefon - tesztek alapján
» A Top 10 táblagép
» A Top 10 Windows tabletje
» A Top 10 subnotebook - tesztek alapján
» A Top 10 300 euró alatti okostelefonja
» A Top 10 120 euró alatti okostelefonja
» A Top 10 phabletje (>5.5-inch)
» A Top 10 noteszgép 500 EUR (~160.000 HUF) alatt
» A Top 10 "pehelysúlyú" gaming notebookja