Nauka

Czy OpenThinker-32B wyznacza nowy kierunek w AI? Zaskakujące osiągnięcia bez ogromnych inwestycji!

2025-02-14

Autor: Ewa

Świat sztucznej inteligencji stoi w obliczu rewolucji. Chiński DeepSeek oraz ChatGPT mogą mieć nowego, poważnego konkurenta. Międzynarodowy zespół badaczy z amerykańskich i europejskich uczelni oraz instytucji technologicznych zaprezentował OpenThinker-32B – model AI, który ambitnie rzuca rękawicę dotychczasowym liderom.

OpenThinker wyprzedza DeepSeek przy minimalnym nakładzie danych!

Najbardziej zaskakujące jest to, że OpenThinker osiągnął lepsze wyniki niż DeepSeek, korzystając jedynie z 14% danych, które wykorzystał chiński gigant. To przełom w świecie open-source AI, pokazujący, że miliardy dolarów i tysiące GPU nie są konieczne do stworzenia konkurencyjnego modelu.

OpenThinker-32B uzyskał 90,6% efektywności na benchmarku MATH500, przewyższając wynik DeepSeek, który wyniósł 89,4%. W teście GPQA-Diamond, oceniającym wiedzę naukową, OpenThinker zdobył 61,6 punkta, pozostawiając DeepSeek z wynikiem 57,6.

Chociaż chiński model wciąż przoduje w zakresie kodowania (71,2 wobec 68,9 dla OpenThinkera), warto podkreślić, że nowy projekt jest open-source. Społeczność ma możliwość jego ciągłego rozwoju i ulepszania, czego zamknięte systemy nigdy nie zdołają osiągnąć.

Zaskakująca efektywność w pracy AI

Najbardziej szokujące? OpenThinker został wytrenowany na jedynie 114 000 przykładach, podczas gdy DeepSeek pochłonął 800 000. Zespół zastosował jedynie cztery węzły obliczeniowe z ośmioma kartami H100, finalizując całość w zaledwie 90 godzin. W obliczu nieproporcjonalnych ilości energii i mocy obliczeniowej poszukiwanych przez modele OpenAI i Google, to osiągnięcie wydaje się być mistrzostwem optymalizacji.

W projekcie zastosowano innowacyjny system walidacji danych – Curator Framework, sprawdzający poprawność kodu i rozwiązań matematycznych w czasie rzeczywistym. Model oparty jest na Qwen2.5-32B-Instruct od Alibaby, ale otwartość tego projektu pozwala na jego modyfikację i rozwijanie w nieskończoność.

Czy OpenThinker zrewolucjonizuje rynek AI?

Model charakteryzuje się pełną transparentnością, w przeciwieństwie do DeepSeek, który trzyma swoje dane treningowe w tajemnicy. Tutaj każdy może przeanalizować kod i dokładnie prześledzić proces uczenia.

W świecie AI, gdzie giganci tacy jak OpenAI, Google czy xAI Elona Muska rywalizują ze sobą przy użyciu zamkniętych i kosztownych modeli, OpenThinker zademonstrował, że można stworzyć coś konkurencyjnego bez ogromnych nakładów finansowych na infrastrukturę. Wielu ekspertów zadaje sobie teraz pytanie: czy OpenThinker zrewolucjonizuje rynek i otworzy nowe możliwości dla mniejszych zespołów badawczych? Czas pokaże!