Tech: Kép- és videógenerálás a Google új mesterséges intelligenciájával – Miért nem tökéletes még?
2024-12-05
Szerző: Levente
A Google legújabb generatív mesterséges intelligencia modelljei, a Veo és az Imagen 3, mostantól a felhasználók egy szűk rétege számára elérhetők, lehetővé téve, hogy szöveges parancsokkal videókat és képeket készítsenek. Ez a lépés a vállalat részéről a legfrissebb trendek követését és az OpenAI-val való versenyt célozza. Az OpenAI hasonló szolgáltatása, a Sora egyelőre csak kiválasztott felhasználók számára érhető el, de hamarosan bővülhet a hozzáférés.
A Google Cloud Vertex AI platformján keresztül a szakemberek tesztelhetik és taníthatják a nagy nyelvi modelljeiket, így testre szabhatják azokat egy adott feladatra. A Veo segítségével a felhasználók Full HD felbontású, akár egy percnél hosszabb videókat is generálhatnak, amelyek a Google szerint koherens és megbízható eredményeket nyújtanak.
Bár a Veo által készített videók alapvetően jól működnek, a generálás során még akadnak problémák. Például egy lassított felvétel esetén, amiben éppen mályvacukrot sütnek tábortűznél, a hő hatására a mályvacukor színének megváltozása nem jelenik meg megfelelően, ami arra utal, hogy a rendszer nem teljesen pontos.
Az Imagen 3 modellt a Google azzal reklámozza, hogy mostanáig a legpontosabb és legrealisztikusabb képek generálására képes, azonban itt is vannak hiányosságok a részletek pontos ábrázolásában. Egy kép esetében, amelyen embereknek kellett volna látszaniuk vaku fényében, a rendszer nem tudta megjeleníteni ezt a részletet, és a végeredmény csak részben felel meg az elvárásoknak.
A Google célja, hogy minél több ügyfelét bevonja a mesterséges intelligencia használatába. A saját felmérésükre hivatkozva azt állítják, hogy az MI-t használó vállalatok 86%-a bevételnövekedést tapasztalt. Ezzel szemben az Apple piackutatása azt mutatja, hogy az MI-projektekből származó bevételek 2024-ben várhatóan 4,6%-kal csökkennek a 2023-as szinthez képest.
Ahogy a mesterséges intelligencia fejlődik, úgy a felhasználók is egyre inkább kíváncsiak arra, hogyan alkalmazhatják ezt a technológiát a saját területeiken, legyen szó marketingről, művészetekről vagy akár a napi élet számos aspektusáról. A Google és az OpenAI közötti verseny izgalmas jövőt vetít előre, ahol a technológia folyamatosan fejlődik, és egyre inkább integrálódik a mindennapi életbe.