Polski ChatGPT już dostępny! Oto LLM, który wkrótce zrewolucjonizuje komunikację
2024-08-24
Autor: Piotr
ChatGPT zaskoczył nas swoją nagłą obecnością, wprowadzając sztuczną inteligencję do codziennego życia. Choć wiele osób korzysta z rozwiązań amerykańskich, Polacy pokazują, że potrafią stworzyć własne alternatywy. W Polsce powstały już trzy alternatywne modele językowe: Trurl, Qra i Bielik, a czwarty, nad którym intensywnie pracują naukowcy i inżynierowie z różnych dziedzin, jest w drodze.
Modele te, będące przykładami LLM (Large Language Model), są zaawansowanymi systemami zaprojektowanymi do rozumienia i generowania tekstu w języku polskim. Zastosowanie takich rozwiązań może być szerokie — od automatycznego tłumaczenia tekstów po pomoc w tworzeniu kodu programistycznego.
Dr inż. Marek Kozłowski, kierownik AI LAB w Ośrodku Przetwarzania Informacji, podkreśla, że tworzenie polskiego LLM odbywa się w trzech krokach: trenowanie na zbiorach danych, strojenie modelu oraz optymalizacja na podstawie ludzkich ocen. Kluczowe znaczenie ma poprawna kalibracja i dostarczanie odpowiednich danych. Polska posiada ogromne zasoby tekstów, które mogą posłużyć jako materiał do nauki dla tych modeli. Przykładowo, projekt Gutenberg, który oferuje książki o wygasłych prawach autorskich, może być znakomitym źródłem informacji.
Bielik, jeden z najnowszych modeli, został opracowany przez społeczność pasjonatów, którzy na co dzień korzystają z takich technologii w biznesie. Trening Bielika odbył się na potężnym superkomputerze Helios, co zapewniło mu dużą wydajność operacyjną.
Czemu stawiamy na polski LLM? Koszty oraz możliwości są kluczowe. Obecne modele, takie jak Llama czy Mistral, opracowywane są w 95% na danych angielskich, co ogranicza ich efektywność w kontekście polskim. Dlatego powstanie polskiego modelu może nie tylko zwiększyć jakość generowanego tekstu w naszym języku, ale także doprowadzić do utworzenia ekosystemu, w którym Polska stanie się nie tylko użytkownikiem, ale również producentem zaawansowanych technologii.
Prace nad PLLuM (Polskim Dużym Modelem Językowym) są realizowane przez zespół naukowców z sześciu instytucji, a ich celem jest stworzenie modelu, który będzie dostępny na otwartej licencji. Ma on przynieść korzyści w różnych dziedzinach, takich jak edukacja, administracja publiczna czy opieka zdrowotna. Co więcej, instytucje będą miały pełną kontrolę nad wykorzystaniem modelu w kontekście RODO i innych regulacji prawnych.
Na rynku rzeczywiście może być miejsce na więcej niż jeden polski model. Specjalizowane modele, takie jak Bielik i Qra, różnią się od siebie, co pozwala na efektywne wykorzystanie ich specyfik w różnych sektorach. Możliwość dostosowania modelu do konkretnej branży staje się kluczowa, co pokazuje potencjał na rozwój w kierunku medycyny, prawa czy finansów.
Wnioskując, polski LLM ma przed sobą ogromne możliwości. Jeśli innowacyjne podejście oraz współpraca między sektorem naukowym a biznesowym zostaną utrzymane, Polska może stać się ważnym graczem w dziedzinie sztucznej inteligencji.