A Google Gemini 2.0 bemutatása: Az AI forradalma új szakaszba lép
2024-12-13
Szerző: Réka
A generatív mesterséges intelligencia piacán egyre élesedik a verseny a nagyvállalatok között. Alig egy héttel azután, hogy az OpenAI bemutatta új o1 modelljét és a Sora videógenerátort, a Google is előrukkolt a Gemini 2.0-ával, amely jelenleg még előzetes verzióban érhető el. Sundar Pichai, a Google vezérigazgatója bejelentette, hogy az új modell egyik legfőbb újítása a natív támogatás a kép- és audiokimenetek létrehozásához.
A Google megváltoztatta stratégiáját, és először nem a Gemini 2.0 legfejlettebb Pro verzióját indítja el, hanem a költséghatékonyabb és minden felhasználó számára elérhető 2.0 Flash modellt, amely mobilalkalmazáson és webes kliensen keresztül lesz elérhető. A Gemini 2.0 Flash kiemelkedő teljesítménnyel bír, a versenyszintű matematikai feladatok megoldásának képességét mérő HiddenMath teszten 63%-os értékelést kapott, ami jelentős előrelépés a Gemini 1.5 Flash 47,2%-ához képest.
Ez a fejlődés új lehetőségeket nyit meg a vállalatok számára a toborzási folyamatban is, ahol az AI alkalmazása már visszafordíthatatlan. Az új modell számos területen felülmúlja a korábbi Gemini 1.5 Pro-t, azonban egy területen gyengébben teljesít, ez pedig a hosszabb szövegek megértése és az automatikus beszédfordítás. A Google azért nem tervez leállítani a régebbi modell használatát, hiszen a Gemini 2.0 nem minden területen még elég fejlett.
A Gemini 2.0 emellett lehetőséget biztosít harmadik fél által fejlesztett alkalmazásokkal való együttműködésre, így például tervezéstől kezdve segíthet a felhasználóknak egy webes vásárlás lebonyolításában. A Google a saját termékein belül is integrálja az AI-technológiáját, és célja, hogy olyan eszközöket fejlesszen, melyeket más fejlesztők is használnának.
Versenytársai, mint az Amazon, Microsoft, Anthropic és OpenAI, milliárdokat fektetnek ebbe a szektorba, és a Google sem maradhat le. Az új Gemini 2.0 célja, hogy idővel az internetes keresést is hatékonyabbá tegye a Google keresőjében és az AI Overview funkció alatt, amely lehetővé teszi bonyolultabb kérdések, több lépcsős matematikai problémák és kódolási feladatok kezelését.
A Gemini 2.0 rendszerének megfelelő feldolgozási teljesítménye nagy alapot adhat további mesterséges intelligenciával kapcsolatos projekteknek is, például a Project Astra nevű AI-ügynöknek, amely a jövőben több nyelv támogatásával bővülhet.