Technologia

Test ósmoklasisty obnażył luki w AI! ChatGPT i Gemini zawiodły na całej linii!

2025-07-10

Autor: Agnieszka

W niezwykle ciekawym eksperymencie, sztuczna inteligencja została wystawiona na próbę podczas testu ósmoklasisty z matematyki. W rywalizacji wzięły udział popularne chatboty: ChatGPT, Gemini oraz Claude Sonnet 4. Efekt? Wszystkie AI poległy na jednym, kluczowym pytaniu!

Na subreddicie r/poland użytkownik o nicku „opolsce” zamieścił wyniki, które potwierdzają, że nawet najbardziej zaawansowane algorytmy nie są nieomylne. W teście z matematyki, AI uzyskały imponujący wynik, ale nie poradziły sobie z zadaniem numer 12. Każdy z trzech modeli rozwiązał 14 z 15 pytań, z Claude Sonnet 4 w tyle z wynikiem 12 poprawnych odpowiedzi.

Eksperyment polegał na tym, aby ChatGPT i inne chatboty rozwiązywały pytania zamknięte, udając polskich uczniów zdających egzamin. Co ciekawe, przedmiotem kontrowersji wśród internautów stało się użycie słowa „student”, które w Polsce odnosi się do uczniów uczelni wyższych, zamiast „uczniowie” zdecydowanie pasujących do kontekstu edukacji podstawowej.

Pomimo imponujących wyników chatbotów, eksperyment nie dostarczył żadnych konkretnych wniosków na temat wydajności sztucznej inteligencji w porównaniu do rzeczywistych uczniów. Dyskusje skupiły się na problemach związanych z określeniem, na ile AI może symulować rzeczywiste myślenie uczniów, a także co to właściwie oznacza dla dalszego rozwoju technologii.

Osoby komentujące eksperyment, takie jak użytkownik Humble_Barnacle_2557, wskazują na brak klarownych wniosków z badań. Choć wyniki chatbotów w testach osiemnastki były wyraźnie lepsze od przeciętnych wyników uczniów, jakie wyciągnąć z tego wnioski? Czy nasze AI zbliża się do ludzkiego poziomu myślenia czy nadal jest daleko od ideału?

To wywołuje pytania o to, czym jest prawdziwa inteligencja oraz świadomość. Czy AI kiedykolwiek dorówna ludzkiemu umysłowi w zrozumieniu i rozwiązywaniu problemów?