A DeepSeek bemutatta úttörő R1 AI nagy nyelvi modelljének legújabb verzióját, a DeepSeek-R1-0528-t. A vállalat a V3 és az R1 modellek bevezetésével tört be a mesterséges intelligencia világába, mindkettő a top tízes AI teljesítményével de olcsóbban és kevesebb idő alatt képezték ki őket, mint az olyan konkurens cégek modelljeit, mint az OpenAI és a Google.
A legújabb R1 modellt a következő AI benchmarkokkal tesztelték:
- Amerikai meghívásos matematikai vizsga (AIME) 2024
- American Invitational Mathematics Examination (AIME) 2025
- Google-Proof Q&A (GPQA)
- LiveCodeBench
- Aider AI kódolás
- Az emberiség utolsó vizsgája
Bár a DeepSeek-R1-0528 teljesítménye az eredeti R1-es kiadáshoz képest minden benchmarkban javult, a nehéz Humanity's Last Exam (Az emberiség utolsó vizsgája) kérdéseknek csak 17%-át válaszolja meg helyesen. Mivel a legjobb versenytársak is rosszul teljesítenek ezen a vizsgán, a DeepSeek R1 legújabb verziójának javulása valószínűleg inkább a mesterséges intelligencia képzésére fordított többletidőből és hangolásból származik, mintsem a mesterséges intelligencia létrehozásában elért áttörésből. Fontos, hogy a legújabb R1 csökkentette az AI hallucinációit, így kevésbé valószínű, hogy félrevezető vagy hamis válaszokat generál.
Azok az olvasók, akik a nyílt forráskódú R1 modellel szeretnének bütykölni, 24 GB memóriával rendelkező Nvidia 4090 GPU-val 24 GB memóriával rendelkező, desztillált, nyolcmilliárd paraméteres verziókat futtathatnak.
Forrás(ok)
» A Top 10 multimédiás noteszgép - tesztek alapján
» A Top 10 játékos noteszgép
» A Top 10 belépő szintű üzleti noteszgép
» A Top 10 üzleti noteszgép
» A Top 10 notebook munkaállomása
» A Top 10 okostelefon - tesztek alapján
» A Top 10 táblagép
» A Top 10 Windows tabletje
» A Top 10 subnotebook - tesztek alapján
» A Top 10 300 euró alatti okostelefonja
» A Top 10 120 euró alatti okostelefonja
» A Top 10 phabletje (>5.5-inch)
» A Top 10 noteszgép 500 EUR (~160.000 HUF) alatt
» A Top 10 "pehelysúlyú" gaming notebookja