Felrobbant az internet péntek este: Sam Altmanéknál bemutatták az o3 modellt
2024-12-22
Szerző: László
Jókor közelebb került a mesterséges általános intelligenciához (AGI) az OpenAI. A ChatGPT-t kifejlesztő amerikai cég pénteken bemutatta új, o3 nevű modelljét, amely eddig soha nem látott teljesítménnyel zárt le egy elismert, általános intelligenciát vizsgáló AI-teszten. Az o3 a szeptemberben debütált o1 második generációs verziója, amit a brit O2 mobilszolgáltató miatt kellett hármas számra jelölniük. Az új modellek képesek jobban "átgondolni" a válaszaikat, ezáltal matematikai, tudományos és programozási kihívásokra is eredményesebben tudnak reagálni.
Sam Altman bejelentései
Sam Altman, az OpenAI vezérigazgatója a bemutatón bejelentette: "Ezek az AI-fejlesztések következő fázisának kezdetét jelentik, ahol a modellek egyre komplexebb feladatok megoldására válnak alkalmassá." Az o3 modell családja két verzióból áll: a csúcskategóriás o3-ból és az olcsóbb o3 mini-ből. Altman megjegyezte, hogy a o3 mini-t január végére tervezik elérhetővé tenni, míg a teljes o3 modell nem sokkal később válik elérhetővé.
A bemutató és az újdonságok
Az o3 bemutatója koronázta meg az OpenAI 12 napos bejelentéssorozatát, amely december elején kezdődött. Az első napokban a havi 200 dolláros ChatGPT Pro előfizetés debütált. A bemutatón Altman a készülék képességeit emelte ki, a tesztelés során pedig kiderült, hogy az o3 40%-kal jobb pontszámokat ért el az o1-nél.
Izgalmas teszt eredmények
A bemutató legizgalmasabb pillanata, amikor a kutatási igazgató, Mark Chen, a modell képességeit igazoló teszt eredmények között osztotta meg, hogy az o3 kódolási versenyen 2727-es pontszámot ért el. Altman rámutatott, hogy hamarosan a legjobb programozók eredményeit is túlszárnyalhatják.
A tudományos teljesítmény
A bemutató során kiderült, hogy az o3 nemcsak a kódolásban kiemelkedő, hanem tudományos kérdésekre adott válaszai is pontosabbak, mint az o1-nél, amely már eleve jobban teljesített egy átlagos doktorandusznál is. A legnehezebb matematikai teszteken az o3 25,2%-os eredményt tudott elérni, ami jelentős előrelépésnek számít.
Kamradt és az emberi teljesítmény
Emellett Chen bemutatta az ARC Prize Foundation vezetőjét, Greg Kamradt-ot, aki elmondta, hogy az o3 normál számítási idő alatt 75,7%-os, maximális idő alatt pedig 87,5%-os teljesítményt nyújtott az AI-képes tesztek során. Kamradt kijelentette, hogy ez az eredmény jelentősen meghaladja az emberi teljesítményt. A média és tech világában máris jelentős feltűnést keltettek a bemutatott adatok, amiből arra következtethetünk, hogy a mesterséges intelligencia fejlődése új dimenzióba léphet.
Az AI-kutatók véleménye
Az AI-kutatók egyetértenek abban, hogy a bemutatott eredmények azt jelzik, hogy az o3 potenciálisan megváltoztathatja az MI jövőjét. Ethan Mollick, a Pennsylvaniai Egyetem szakértője is elismerte, hogy a legnehezebb teszteken indult a modell, míg Rowan Cheung az o3-at egy forradalmian új megoldásnak titulálta, amit a többi modell nem tudott elérni.
A jövőbeli várakozások
Mindezek után az o3 mini érkezése január végén várható, és a cég most arra készül, hogy ez a modell valós idejű képességfejlesztésre is képes lesz, amely várhatóan újabb izgalmakat hoz majd a mesterséges intelligencia fejlődésében.