Notebookcheck Logo

A Google bemutatja a Beam-et, egy 3D-s videóhívó platformot valós idejű fordítással az I/O 2025-ön

Egy felhasználó teszteli a Google Beam 3D-s videohívási élményét az I/O 2025-ön (Kép forrása: Google)
Egy felhasználó teszteli a Google Beam 3D-s videohívási élményét az I/O 2025-ön (Kép forrása: Google)
A Google bemutatta a Beam nevű, a Project Starline-on alapuló 3D-s videohívó platformot. A rendszer az AI-alapú fordítást és az élethű videóvetítést ötvözi, hogy remélhetőleg természetesebbé tegye a távbeszélgetéseket. A Beam várhatóan még az idén megjelenik a HP-vel együttműködve.
Launch Google Pixel AI Software

Az I/O 2025-ön a Google bemutatta a Beam-et, a következő generációs 3D-s videóhívó platformot, amelyet arra terveztek, hogy fejhallgató vagy szemüveg nélkül, szemtől-szembe történő interakciókat idézzen. Ez a Project Starline projektből fejlődött ki.

A Project Starline a Google által kifejlesztett kísérleti telepresence projekt volt, amelyet először 2021-ben jelentettek be, hogy élethű, 3D-s videohívásokat hozzon létre, amelyekkel olyan érzést kelt, mintha a beszélgetőpartner fizikailag is jelen lenne ugyanabban a szobában.

A Project Starline folytatásaként a Beam a mesterséges intelligencia által vezérelt mélységérzékelést egy kompakt fénymező-kijelzővel kombinálja, hogy valós időben fotorealisztikus, térbeli vetületeket hozzon létre a hívás résztvevőiről.

A Beam hat nagy felbontású kamerát, fénymező-renderelést és milliméterpontos fejkövetést használ 60 képkocka/másodperc sebességgel, hogy a valós jelenlét érzetét keltse. A cél az, hogy a felhasználók szemkontaktust teremtsenek, gesztusokat vegyenek észre, és értelmezzék az arckifejezéseket, mindezt headset viselése nélkül.

Az eredeti prototípus terjedelmes volt, de a Beamet azóta áttervezték egy vékonyabb, kereskedelmi forgalomban kapható eszközzé. A Google a HP-vel együttműködve 2025 végére szeretné piacra dobni, a Salesforce, a Deloitte és a Duolingo pedig már most korai alkalmazóként bejelentkezett.

A Beam egyik praktikusabb funkciója a valós idejű mesterséges intelligencia általi fordítás lesz. A Google Gemini modelljei által működtetett funkció lehetővé teszi, hogy az emberek különböző nyelveken beszéljenek, miközben megőrzi a beszélő hangját és hangszínét. Jelenleg angol és spanyol nyelven működik, hamarosan pedig olasz, német és portugál nyelven is. A Google szerint ugyanez a technológia kerül a Google Meetbe is, hogy a csapatok jobban tudjanak együttműködni a nyelvi korlátok között.

Sundar Pichai, a Google vezérigazgatója szerint a Beam illeszkedik a vállalat szélesebb körű törekvésébe, hogy a távoli kommunikációt természetesebbé tegye. A Google tervezi, hogy integrálja az olyan platformokkal, mint a Zoom, és végül a vállalati felhasználáson túlra is kiterjeszti.

Egy felhasználó teszteli a Google Beam 3D-s videohívási élményét az I/O 2025-ön (Kép forrása: Google)
Egy felhasználó teszteli a Google Beam 3D-s videohívási élményét az I/O 2025-ön (Kép forrása: Google)
Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Newsarchive 2025 05 > A Google bemutatja a Beam-et, egy 3D-s videóhívó platformot valós idejű fordítással az I/O 2025-ön
Anmol Dubey, 2025-05-21 (Update: 2025-05-22)