Míg a nagy nyelvi modellek olyan dolgokban jeleskednek, mint a kreatív írás és az alapvető matematika, gyakran megbotlanak, amikor olyan összetett, szabályos feladatokkal szembesülnek, mint a Sudoku vagy a szigorú útvonaltervezés. Ennek áthidalására az MIT Számítástudományi és Mesterséges Intelligencia Laboratóriumának (CSAIL) kutatócsoportja - Gabriel Grand vezetésével - egy új rendszert vezetett be DisCIPL (Distributional Constraints by Inference Programming with Language Models) néven.
A keretrendszer egy menedzser-munkavállaló hierarchián működik. Egy nagy "főnök" modell először tervezőként működik, és stratégiát dolgoz ki a felhasználó kérésének megoldására. Ezután a feladat egyes komponenseit kisebb, hatékonyabb "követő" modellekre bízza.
Annak érdekében, hogy a csapat a kijelölt úton maradjon, a főnök az LLaMPPL segítségével ad utasításokat, amely egy olyan speciális programozási nyelv, amelyet arra terveztek, hogy a modelleket pontos kimenetek felé irányítsa. Ha egy követő modell eltér a korlátozásoktól - például rossz megfogalmazást használ egy strukturált versben -, a főmodell közbelép, hogy korrigálja azt.
Ez a megközelítés lenyűgöző eredményeket hozott. A kutatók beszámolója szerint az olyan feladatokat tartalmazó tesztekben, mint például a támogatási javaslatok írása vagy a bevásárlólisták költségvetésének összeállítása, a DisCIPL rendszer pontosabb válaszokat adott, mint az OpenAI GPT-4o, és elérte az o1 speciális gondolkodási modell pontosságát. Ami még figyelemre méltóbb, hogy mindezt sokkal nagyobb hatékonysággal tette. Azáltal, hogy a nehéz feladatokat kisebb modellekre hárította, a rendszer a versenytársakhoz képest nagyjából 40%-kal csökkentette az érvelés hosszát és több mint 80%-kal a költségeket.
A csapat úgy véli, hogy ez a módszer fenntartható utat kínál a mesterséges intelligencia számára, bebizonyítva, hogy a kisebb modellek összehangolása sokkal hatékonyabb - és energiatakarékosabb - lehet, mint kizárólag a hatalmas, energiaigényes rendszerekre támaszkodni.
Forrás(ok)
A kép forrása: Igor Omilaev
» A Top 10 multimédiás noteszgép - tesztek alapján
» A Top 10 játékos noteszgép
» A Top 10 belépő szintű üzleti noteszgép
» A Top 10 üzleti noteszgép
» A Top 10 notebook munkaállomása
» A Top 10 okostelefon - tesztek alapján
» A Top 10 táblagép
» A Top 10 Windows tabletje
» A Top 10 subnotebook - tesztek alapján
» A Top 10 300 euró alatti okostelefonja
» A Top 10 120 euró alatti okostelefonja
» A Top 10 phabletje (>5.5-inch)
» A Top 10 noteszgép 500 EUR (~160.000 HUF) alatt
» A Top 10 "pehelysúlyú" gaming notebookja


