Czy OpenThinker-32B wyznacza nowy kierunek w AI? Zaskakujące osiągnięcia bez ogromnych inwestycji!
2025-02-14
Autor: Ewa
Świat sztucznej inteligencji stoi w obliczu rewolucji. Chiński DeepSeek oraz ChatGPT mogą mieć nowego, poważnego konkurenta. Międzynarodowy zespół badaczy z amerykańskich i europejskich uczelni oraz instytucji technologicznych zaprezentował OpenThinker-32B – model AI, który ambitnie rzuca rękawicę dotychczasowym liderom.
OpenThinker wyprzedza DeepSeek przy minimalnym nakładzie danych!
Najbardziej zaskakujące jest to, że OpenThinker osiągnął lepsze wyniki niż DeepSeek, korzystając jedynie z 14% danych, które wykorzystał chiński gigant. To przełom w świecie open-source AI, pokazujący, że miliardy dolarów i tysiące GPU nie są konieczne do stworzenia konkurencyjnego modelu.
OpenThinker-32B uzyskał 90,6% efektywności na benchmarku MATH500, przewyższając wynik DeepSeek, który wyniósł 89,4%. W teście GPQA-Diamond, oceniającym wiedzę naukową, OpenThinker zdobył 61,6 punkta, pozostawiając DeepSeek z wynikiem 57,6.
Chociaż chiński model wciąż przoduje w zakresie kodowania (71,2 wobec 68,9 dla OpenThinkera), warto podkreślić, że nowy projekt jest open-source. Społeczność ma możliwość jego ciągłego rozwoju i ulepszania, czego zamknięte systemy nigdy nie zdołają osiągnąć.
Zaskakująca efektywność w pracy AI
Najbardziej szokujące? OpenThinker został wytrenowany na jedynie 114 000 przykładach, podczas gdy DeepSeek pochłonął 800 000. Zespół zastosował jedynie cztery węzły obliczeniowe z ośmioma kartami H100, finalizując całość w zaledwie 90 godzin. W obliczu nieproporcjonalnych ilości energii i mocy obliczeniowej poszukiwanych przez modele OpenAI i Google, to osiągnięcie wydaje się być mistrzostwem optymalizacji.
W projekcie zastosowano innowacyjny system walidacji danych – Curator Framework, sprawdzający poprawność kodu i rozwiązań matematycznych w czasie rzeczywistym. Model oparty jest na Qwen2.5-32B-Instruct od Alibaby, ale otwartość tego projektu pozwala na jego modyfikację i rozwijanie w nieskończoność.
Czy OpenThinker zrewolucjonizuje rynek AI?
Model charakteryzuje się pełną transparentnością, w przeciwieństwie do DeepSeek, który trzyma swoje dane treningowe w tajemnicy. Tutaj każdy może przeanalizować kod i dokładnie prześledzić proces uczenia.
W świecie AI, gdzie giganci tacy jak OpenAI, Google czy xAI Elona Muska rywalizują ze sobą przy użyciu zamkniętych i kosztownych modeli, OpenThinker zademonstrował, że można stworzyć coś konkurencyjnego bez ogromnych nakładów finansowych na infrastrukturę. Wielu ekspertów zadaje sobie teraz pytanie: czy OpenThinker zrewolucjonizuje rynek i otworzy nowe możliwości dla mniejszych zespołów badawczych? Czas pokaże!