Notebookcheck Logo

Az MIT új rendszere lehetővé teszi, hogy a kis AI modellek felülmúlják az óriásokat komplex feladatokban

Egy dekoratív kép, amelyen az AI rövidítés látható (Kép forrása: Igor Omilaev via Unsplash; vágott kép)
Egy dekoratív kép, amelyen az AI rövidítés látható (Kép forrása: Igor Omilaev via Unsplash; vágott kép)
Az MIT kutatói olyan együttműködési keretrendszert fejlesztettek ki, amely lehetővé teszi, hogy egy nagy "főnök" modell irányítson egy kisebb mesterséges intelligencia-ügynökökből álló csapatot, és ezzel a vezető szóló modellekhez képest kiváló következtetési hatékonyságot és pontosságot érjen el.
AI Science

Míg a nagy nyelvi modellek olyan dolgokban jeleskednek, mint a kreatív írás és az alapvető matematika, gyakran megbotlanak, amikor olyan összetett, szabályos feladatokkal szembesülnek, mint a Sudoku vagy a szigorú útvonaltervezés. Ennek áthidalására az MIT Számítástudományi és Mesterséges Intelligencia Laboratóriumának (CSAIL) kutatócsoportja - Gabriel Grand vezetésével - egy új rendszert vezetett be DisCIPL (Distributional Constraints by Inference Programming with Language Models) néven.

A keretrendszer egy menedzser-munkavállaló hierarchián működik. Egy nagy "főnök" modell először tervezőként működik, és stratégiát dolgoz ki a felhasználó kérésének megoldására. Ezután a feladat egyes komponenseit kisebb, hatékonyabb "követő" modellekre bízza.

Annak érdekében, hogy a csapat a kijelölt úton maradjon, a főnök az LLaMPPL segítségével ad utasításokat, amely egy olyan speciális programozási nyelv, amelyet arra terveztek, hogy a modelleket pontos kimenetek felé irányítsa. Ha egy követő modell eltér a korlátozásoktól - például rossz megfogalmazást használ egy strukturált versben -, a főmodell közbelép, hogy korrigálja azt.

Ez a megközelítés lenyűgöző eredményeket hozott. A kutatók beszámolója szerint az olyan feladatokat tartalmazó tesztekben, mint például a támogatási javaslatok írása vagy a bevásárlólisták költségvetésének összeállítása, a DisCIPL rendszer pontosabb válaszokat adott, mint az OpenAI GPT-4o, és elérte az o1 speciális gondolkodási modell pontosságát. Ami még figyelemre méltóbb, hogy mindezt sokkal nagyobb hatékonysággal tette. Azáltal, hogy a nehéz feladatokat kisebb modellekre hárította, a rendszer a versenytársakhoz képest nagyjából 40%-kal csökkentette az érvelés hosszát és több mint 80%-kal a költségeket.

A csapat úgy véli, hogy ez a módszer fenntartható utat kínál a mesterséges intelligencia számára, bebizonyítva, hogy a kisebb modellek összehangolása sokkal hatékonyabb - és energiatakarékosabb - lehet, mint kizárólag a hatalmas, energiaigényes rendszerekre támaszkodni.

Forrás(ok)

arXiv.org via MIT News

A kép forrása: Igor Omilaev

Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Hírek > News Archive > Newsarchive 2025 12 > Az MIT új rendszere lehetővé teszi, hogy a kis AI modellek felülmúlják az óriásokat komplex feladatokban
Chibuike Okpara, 2025-12-16 (Update: 2025-12-16)