Notebookcheck Logo

A koreai startup azt állítja, hogy az "AI scientist" felülmúlja a Gemini 2.5 Pro és a Claude Opus 4 teljesítményét

Egy szemléltető kép, amely bemutatja, hogyan viszonyul a Scinapse a versenytársakhoz (Kép forrása: Google, Anthropic és Pluto Labs; szerkesztés)
Egy szemléltető kép, amely bemutatja, hogyan viszonyul a Scinapse a versenytársakhoz (Kép forrása: Google, Anthropic és Pluto Labs; szerkesztés)
Egy meglepő új fejlesztés keretében a Pluto Labs azt állítja, hogy a Scinapse AI a Google és az Anthropic modelljeit töredékáron felülmúlja. A bejelentés nagy port kavart az iparágban, mivel a világ a hivatalos bevezetésre és a független validálásra vár.
Business AI Science

A valódi "mesterséges intelligencia tudós" megalkotásáért folytatott versenyben egy koreai startup bejelentette új modelljét, amely állítása szerint a versenytársak számítási költségeinek mindössze tizedével nagyobb teljesítményt nyújt. A Pluto Labs Scinapse AI megkérdőjelezi azt a felfogást, hogy a fejlett mesterséges intelligencia sikeréhez hatalmas, nyers erővel működő számítási teljesítményre van szükség.

A Pluto Labs szerint a siker kulcsa a "stratégiai hatékonyságú" architektúra - a Scinapse AI az olyan adatintenzív feladatokat, mint a szakirodalmi áttekintések, a meglévő tudományos keresőplatformra delegálja. Ez a kialakítás lehetővé teszi, hogy az AI mag kizárólag a kreatív gondolkodásra és az újszerű, tesztelhető ötletek generálására összpontosítson.

Egy saját maga által végzett vak teszt alapján a vállalat azzal büszkélkedhet, hogy az AI 61 különböző tudományos témában folyamatosan az első helyen végzett a "Plauzibilitás" és a "Tesztelhetőség" terén a Google és az Anthropic csúcsmodelljeivel szemben. A Pluto Labs azt állítja, hogy ez azt bizonyítja, hogy a mesterséges intelligencia "megvalósítható tudományos kutatást" nyújt, nem pedig "hihető fikciót". A mesterséges intelligencia hallucinációja ellen a rendszer állítólag szigorúan egy 260 millió tudományos cikket tartalmazó adatbázisra támaszkodik. A vakteszteken 3 konkurens AI-modell bírálta el: Gemini 2.5 Pro, Clause Opus 4 és OpenAI o3.

Az a tény, hogy egy kis koreai startup egy objektív benchmarkban jobbnak bizonyult a Google-nél, több mint technikai teljesítmény - ez az innovatív vezetés szimbolikus eseménye. - Simon Kim, a Hashed vezérigazgatója.

A Pluto Labs még ebben a negyedévben tervezi a Scinapse AI globális bevezetését. A technológiai közösség szorosan figyeli majd a független benchmarkokat, amelyek igazolják a vállalat merész állításait.

Forrás(ok)

Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Newsarchive 2025 07 > A koreai startup azt állítja, hogy az "AI scientist" felülmúlja a Gemini 2.5 Pro és a Claude Opus 4 teljesítményét
Chibuike Okpara, 2025-07-17 (Update: 2025-07-17)