Tech: Kép- és videógenerálás a Google új mesterséges intelligenciájával

Technológia

Tech: Kép- és videógenerálás a Google új mesterséges intelligenciájával – Miért nem tökéletes még?

2024-12-05

Szerző: Levente

A Google legújabb generatív mesterséges intelligencia modelljei, a Veo és az Imagen 3, mostantól a felhasználók egy szűk rétege számára elérhetők, lehetővé téve, hogy szöveges parancsokkal videókat és képeket készítsenek. Ez a lépés a vállalat részéről a legfrissebb trendek követését és az OpenAI-val való versenyt célozza. Az OpenAI hasonló szolgáltatása, a Sora egyelőre csak kiválasztott felhasználók számára érhető el, de hamarosan bővülhet a hozzáférés.

A Google Cloud Vertex AI platformján keresztül a szakemberek tesztelhetik és taníthatják a nagy nyelvi modelljeiket, így testre szabhatják azokat egy adott feladatra. A Veo segítségével a felhasználók Full HD felbontású, akár egy percnél hosszabb videókat is generálhatnak, amelyek a Google szerint koherens és megbízható eredményeket nyújtanak.

Bár a Veo által készített videók alapvetően jól működnek, a generálás során még akadnak problémák. Például egy lassított felvétel esetén, amiben éppen mályvacukrot sütnek tábortűznél, a hő hatására a mályvacukor színének megváltozása nem jelenik meg megfelelően, ami arra utal, hogy a rendszer nem teljesen pontos.

Az Imagen 3 modellt a Google azzal reklámozza, hogy mostanáig a legpontosabb és legrealisztikusabb képek generálására képes, azonban itt is vannak hiányosságok a részletek pontos ábrázolásában. Egy kép esetében, amelyen embereknek kellett volna látszaniuk vaku fényében, a rendszer nem tudta megjeleníteni ezt a részletet, és a végeredmény csak részben felel meg az elvárásoknak.

A Google célja, hogy minél több ügyfelét bevonja a mesterséges intelligencia használatába. A saját felmérésükre hivatkozva azt állítják, hogy az MI-t használó vállalatok 86%-a bevételnövekedést tapasztalt. Ezzel szemben az Apple piackutatása azt mutatja, hogy az MI-projektekből származó bevételek 2024-ben várhatóan 4,6%-kal csökkennek a 2023-as szinthez képest.

Ahogy a mesterséges intelligencia fejlődik, úgy a felhasználók is egyre inkább kíváncsiak arra, hogyan alkalmazhatják ezt a technológiát a saját területeiken, legyen szó marketingről, művészetekről vagy akár a napi élet számos aspektusáról. A Google és az OpenAI közötti verseny izgalmas jövőt vetít előre, ahol a technológia folyamatosan fejlődik, és egyre inkább integrálódik a mindennapi életbe.

Tech: Kép- és videógenerálás a Google új mesterséges intelligenciájával – Miért nem tökéletes még?

Azerbajdzsán zöldenergia importálási lehetőségei: Az álom valóra válhat?

Fradi megérkezett Görögországba - Varga Barnabás biztosan nem játszhat a PAOK ellen!

Heti horoszkóp 2024. december 2. – december 8. – Fedezd fel a titkokat és a lehetőségeket!

Jean Reno kijelentése Magyarországról: nagyon elgondolkodtató szavak

Rendkívüli magyar kutatás: Új módszer a betegségek korai felismerésére!

A kvantumszámítógép, amely megdönti a hagyományos gépek sebességi rekordját

Ártalmatlan tünet vagy komoly betegség jele?

Rekordév a napenergia termelésében Magyarországon!

Tech: Miért titkolózik a ChatGPT David Mayer neve elől? Itt a válasz!