A koreai startup azt állítja, hogy az "AI scientist" felülmúlja a Gemini 2.5 Pro és a Claude Opus 4 teljesítményét

Egy szemléltető kép, amely bemutatja, hogyan viszonyul a Scinapse a versenytársakhoz (Kép forrása: Google, Anthropic és Pluto Labs; szerkesztés)

Egy meglepő új fejlesztés keretében a Pluto Labs azt állítja, hogy a Scinapse AI a Google és az Anthropic modelljeit töredékáron felülmúlja. A bejelentés nagy port kavart az iparágban, mivel a világ a hivatalos bevezetésre és a független validálásra vár.

Chibuike Okpara (fordította Ninh Duy), Közzétett 07/17/2025 🇺🇸 🇪🇸 ...

Business AI Science

A valódi "mesterséges intelligencia tudós" megalkotásáért folytatott versenyben egy koreai startup bejelentette új modelljét, amely állítása szerint a versenytársak számítási költségeinek mindössze tizedével nagyobb teljesítményt nyújt. A Pluto Labs Scinapse AI megkérdőjelezi azt a felfogást, hogy a fejlett mesterséges intelligencia sikeréhez hatalmas, nyers erővel működő számítási teljesítményre van szükség.

A Pluto Labs szerint a siker kulcsa a "stratégiai hatékonyságú" architektúra - a Scinapse AI az olyan adatintenzív feladatokat, mint a szakirodalmi áttekintések, a meglévő tudományos keresőplatformra delegálja. Ez a kialakítás lehetővé teszi, hogy az AI mag kizárólag a kreatív gondolkodásra és az újszerű, tesztelhető ötletek generálására összpontosítson.

Egy saját maga által végzett vak teszt alapján a vállalat azzal büszkélkedhet, hogy az AI 61 különböző tudományos témában folyamatosan az első helyen végzett a "Plauzibilitás" és a "Tesztelhetőség" terén a Google és az Anthropic csúcsmodelljeivel szemben. A Pluto Labs azt állítja, hogy ez azt bizonyítja, hogy a mesterséges intelligencia "megvalósítható tudományos kutatást" nyújt, nem pedig "hihető fikciót". A mesterséges intelligencia hallucinációja ellen a rendszer állítólag szigorúan egy 260 millió tudományos cikket tartalmazó adatbázisra támaszkodik. A vakteszteken 3 konkurens AI-modell bírálta el: Gemini 2.5 Pro, Clause Opus 4 és OpenAI o3.

Az a tény, hogy egy kis koreai startup egy objektív benchmarkban jobbnak bizonyult a Google-nél, több mint technikai teljesítmény - ez az innovatív vezetés szimbolikus eseménye. - Simon Kim, a Hashed vezérigazgatója.

A Pluto Labs még ebben a negyedévben tervezi a Scinapse AI globális bevezetését. A technológiai közösség szorosan figyeli majd a független benchmarkokat, amelyek igazolják a vállalat merész állításait.

Forrás(ok)

Business Wire

Kapcsolódó cikkek

⟨

Az Epic Games Store utolsó ingyenes játéka 2025 júliusára a hivatalos bejelentés előtt kiderült

A Realme megerősítette, hogy nem lesz Realme 15 Pro+

⟩

Add as a preferred source on Google

Editor of the original article: Chibuike Okpara - Tech Writer - 506 articles published on Notebookcheck since 2024

contact me via: @chibuikeokparaf, Facebook

Translator: Ninh Ngoc Duy - Editorial Assistant - 803566 articles published on Notebookcheck since 2008

contact me via: Facebook

> Magyarország - Kezdőlap > Hírek > News Archive > Newsarchive 2025 07 > A koreai startup azt állítja, hogy az "AI scientist" felülmúlja a Gemini 2.5 Pro és a Claude Opus 4 teljesítményét

Chibuike Okpara, 2025-07-17 (Update: 2025-07-17)