Tech: Az OpenAI váratlan adatvesztése a per közepén – véletlen vagy szándékos?
2024-11-22
Szerző: Éva
2023 végén a The New York Times és a Daily News beperelte az OpenAI-t, valamint a Microsoftot, amely szoros partnerségben áll a céggel. Azzal vádolták meg őket, hogy jogtalanul felhasználták az újságok cikkeit a nyelvi modellek betanításához.
A per részeként az OpenAI beleegyezett, hogy a kiadók ügyvédei és az általuk felbérelt szakértők átfésüljék a nyelvi modellek képzési adatait, hogy bizonyítékokat találjanak. November 1. óta több mint 150 órát töltöttek az adatok áttekintésével, amikor egy váratlan fordulat következett be.
Egy, a bírósághoz benyújtott levél szerint az OpenAI mérnökei november 14-én véletlenül törölték a kiadók összes keresési adatát az egyik számukra létrehozott virtuális gépen, amint azt a TechCrunch is jelentette.
Ennek következtében, hiába fektettek be sok időt a szakemberek a ChatGPT képzési adataiból származó információk összegyűjtésébe, az OpenAI minden részletével megszüntette azokat, állításaik szerint véletlenül. Bár a cég megpróbálta helyreállítani az adatokat, részben sikerült is, azonban a mappaszerkezet és a fájlnevek elvesztek, így a helyreállított adatok nem használhatóak fel bizonyítékként.
Ez a váratlan incidens nemcsak az OpenAI, hanem az egész AI ipar számára kihívást jelent, hiszen a jogi precedens megteremtése mellett a megbízhatóság kérdése is felmerül. Az érintett szakembereknek újra kell kezdeniük a munkát, rengeteg órát kockáztatva. A felperesek ügyvédje ugyanakkor megjegyezte, hogy nincs okuk feltételezni, hogy a törlés szándékos volt.
Egyes elemzők már arról spekulálnak, hogy ez a hiba egy nagyobb probléma része lehet az AI rendszerek adatkezelésében, és hogy a jövőben még több hasonló eset előfordulhat, ami tovább növelheti a nyilvánosság és a jogalkotók aggodalmait az AI fejlődésével kapcsolatban.