Tysiące widzów śledzi, jak sztuczna inteligencja gra w Pokemony
2025-03-01
Autor: Marek
Tysiące internautów z zapartym tchem obserwuje transmisję na żywo, podczas której sztuczna inteligencja Claude 3.7 Sonnet samodzielnie gra w klasyczną grę Pokemon Red na Gameboyu. Co więcej, radzi sobie znacznie lepiej niż jej poprzednia wersja, co twórcy z firmy Anthropic uważają za nowoczesny sposób na mierzenie postępów w rozwoju AI.
Najnowszy model AI od Anthropic, Claude 3.7 Sonnet, rozpoczyna swoją przygodę w wirtualnym świecie Pokemonów bez wcześniejszego treningu. Choć strona transmisji sugeruje, że jest to „projekt pasjonata Claude'a i Pokemonów”, to w rzeczywistości został on zainicjowany przez Anthropic. Ideą „wpuszczenia” Claude'a do gry Pokemon Red zajmowano się wewnętrznie od 2024 roku, korzystając wcześniej z modelu Claude 3.5 Sonnet. Projekt szybko zyskał popularność wśród pracowników, co zaowocowało decyzją o transmisji na żywo.
AI w akcji. Zaskakujące osiągnięcia!
Claude 3.7 przekracza możliwości swojego poprzednika. Podczas gdy Claude 3.5 potrafił łapać Pokemony i opuścić początkowe miasto Pallet Town, Claude 3.7 potrafi pokonywać różnorodne wyzwania, zdobywając trzy odznaki od liderów sal Pokemon – to zaledwie początek! Twórcy AI podkreślają, że to doskonały sposób na ocenę postępów w rozwoju sztucznej inteligencji.
Odejście od tradycyjnych benchmarków na rzecz bardziej dostępnych testów, które są zrozumiałe dla szerszej grupy, staje się kluczowe. Jak mówi Dianne Penn, menedżer produktu ds. badań w Anthropic: „Jesteśmy w punkcie, w którym standardowe oceny nie oddają pełnego obrazu możliwości każdej kolejnej wersji modeli.”
Mierzenie subtelnych różnic w postępach AI nie jest prostym zadaniem. W tym tygodniu OpenAI przyznało, że miało trudności z pomiarem ulepszeń swojego najnowszego modelu, GPT-4.5, z tego powodu firma musiała opracować własną skalę testową.
Podczas gry w Pokemon Red, Claude może wykonywać akcje za pośrednictwem głównych przycisków (A, B, Góry, Dół, Lewo, Prawo, Start, Select) oraz nawigować do określonych współrzędnych na ekranie. W międzyczasie robi zrzuty ekranu i przetwarza obrazy, aby lepiej zrozumieć swoje otoczenie. W miarę postępów w grze AI aktualizuje swoją bazę wiedzy o nowe informacje, co czyni jej występy jeszcze bardziej ekscytującymi.
Oczywiście Claude nie jest doskonały – czasem myli się w nawigacji, jednak z pewnością dostarcza widzom zupełnie nowych doświadczeń rozrywkowych. To zaproszenie do przyszłości, w której sztuczna inteligencja może nie tylko analizować, ale i tworzyć! Czy Claude 3.7 jest przyszłością gier wideo? Oglądajcie na żywo!