Polacy nie gęsi, swoje AI mają. "Narzędzie na trudne czasy"

Bielik AI - budowany weekendami przez grupę pasjonatów, trenowany na polskim języku, to pierwszy tak zaawansowany polski model językowy. Fundacja Spichelrz działająca non-profit ma jeden cel: suwerenność technologiczna Polski. Zobacz najnowszy odcinek "Biznes Klasy" z Sebastianem Kondrackim.

SebastianSebastian Kondracki gościem "Biznes Klasy"
Źródło zdjęć: © YouTube, bielik.ai | -
Łukasz Kijek

"Biznes Klasa" to program money.pl dostępny na YouTube. Szef redakcji Łukasz Kijek prowadzi w nim rozmowy z przedsiębiorcami - o ich życiu, biznesie, zarobkach i wielu innych sprawach. Gościem ostatniego odcinka był Sebastian Kondracki, współtwórca Bielik AI, prezes Fundacji Spichlerz.

Dalsza część artykułu pod materiałem wideo

Zanim zaufasz ChatGPT, zobacz jak działa polski Bielik - Sebastian Kondracki w Biznes Klasie

Polacy nie gęsi, swoje AI mają

W czasach, gdy prym w rozwoju sztucznej inteligencji wiodą giganci technologiczni, w Polsce powstał projekt inny niż wszystkie. Bielik AI - duży model językowy wyszkolony głównie na danych w języku polskim - został zbudowany nie w Dolinie Krzemowej, oddolnie, w ramach działań Fundacji Spichlerz. - Nie sądzę, że powstanie w Polsce drugi OpenAI, ale dzięki Bielik AI może powstać dużo zwinnych, sprytnych firm, które zrobią swoje i w niszy będą globalnym liderem - mówi Sebastian Kondracki, współtwórca Bielika.

Wyróżnikiem Bielika jest jego narodowe zakorzenienie i możliwość uniezależnienia się od tzw. bigtechów. Aż 90 proc. danych treningowych stanowią teksty w języku polskim. Dla porównania, w globalnych modelach ten udział sięga ledwie 8 proc. Efekt? Model rozumie język potoczny, emocjonalny, a nawet mowę z błędami. - Mówisz "chleb i margaryna", a model wie, że chodzi o ciężką sytuację ekonomiczną - tłumaczy Kondracki.

Suwerenność technologiczna Polski

Ale Bielik to nie tylko lepsze zrozumienie polskiego kontekstu. To także realna odpowiedź na problemy związane z przetwarzaniem danych. W przeciwieństwie do chmurowych modeli takich jak GPT, Bielika można uruchomić lokalnie, całkowicie offline. - Nie interesuje nas nic, on nigdzie nic nie wyśle, nigdzie nic nie przetworzy na zewnętrznych serwerach - tłumaczy Kondracki. To kluczowe przy pracy z danymi wrażliwymi, np. w sektorze zdrowia, bankowości czy administracji.

Model liczy 11 miliardów parametrów - stosunkowo mało w porównaniu z gigantami pokroju GPT-3.5, ale wystarczająco dużo, by skutecznie przetwarzać język i działać na jednej karcie graficznej. - To jak z samochodami - nie zawsze potrzebujesz limuzyny, czasem wystarczy zwinna furgonetka do zadań specjalnych - wyjaśnia obrazowo Kondracki.

Dzięki otwartej licencji, Bielik jest darmowy nawet do zastosowań komercyjnych. To, co kosztuje, to sprzęt - czyli GPU - ale już samo korzystanie z modelu nie generuje kosztów tokenowych, które w przypadku globalnych rozwiązań mogą sięgać tysięcy dolarów miesięcznie. - Każdą dokumentację, log czy transakcję można "dobielić", ile tylko karta graficzna obsłuży - mówi Kondracki.

Niemcy uczą się od Polaków AI

Ambicje twórców Bielika sięgają także poza granice Polski.

Polacy kojarzą się z dobrą technologią, Bielik dobrze wymawia się po niemiecku, to stwierdziliśmy, że stworzymy projekt "Der Bielik". Teraz mamy taki oddzielny zespół natywnych Niemców, którzy właśnie bardzo mocno przygotowują testy Bielika w języku niemieckim, ale już pod kątem właśnie kulturowych, różnic między niemieckim z różnych landów, czy też pomiędzy Austrią a Niemcami, Szwajcarią. Chcemy troszeczkę mocniej zająć się tym językiem niemieckim - zdradza Kondracki.

Dodatkowo polski model językowy (LLM) stworzony przez grupę pasjonatów pracujących głównie weekendami i po godzinach, trafi do jednego z najpopularniejszych systemów AI na świecie - Perplexity. Zapowiedział to CEO Nvidii Jensen Huang. Nvidia, pierwsza spółka na świecie z wyceną powyżej 4 bilionów dolarów i SpeakLeash podpisały też list intencyjny dotyczący współpracy. - Już trenujemy model wnioskujący (z ang. reasoning - przyp. red.), trenujemy też model multimodalny. Nawet Niemcy nie są tak zaawansowani w swoich pracach - wskazuje Sebastian Kondracki.

Polskie firmy i urzędy już korzystają z Bielik AI

Projekt już dziś znajduje zastosowanie w praktyce. Testy przeprowadził m.in. Zakład Ubezpieczeń Społecznych, gdzie Bielik okazał się najlepszym rozwiązaniem. Korzystają z niego także banki - w tym do anonimizowania danych przesyłanych do zewnętrznych modeli, a także upraszczania komunikacji z klientem. Z Bielika korzystano również podczas polskiej prezydencji w UE, a nawet w eksperymentalnym projekcie związanym z Międzynarodową Stacją Kosmiczną.

Choć Fundacja Spichlerz nie działa dla zysku, to model biznesowy wokół Bielika zaczyna się klarować. - Chcemy iść drogą Linuxa - oddolnie, z pomocą społeczności i sponsorów, ale z otwartym kodem i licencją. Na tej bazie mogą powstawać tysiące komercyjnych rozwiązań - ocenia Kondracki. Marzeniem zespołu jest, by w Polsce rozwijały się specjalizowane modele dla poszczególnych branż - od medycyny po media.

W tym duchu powstał projekt Obywatel Bielik - obywatelska inicjatywa mająca na celu zbieranie zdjęć polskich potraw, zabytków czy przyrody, które posłużą do stworzenia pierwszego polskiego modelu multimodalnego. - Nie potrzebujemy zdjęć artystycznych, potrzebujemy polskich - podkreśla Kondracki.

Choć Fundacja nie korzysta z finansowania rządowego, współpracuje z instytucjami publicznymi, m.in. w zakresie danych, wdrożeń i edukacji. - Chcę mieć na plecach wiele marek, ale żeby nikt nie mówił mi, jak trenować - zastrzega Kondracki, porównując sytuację do niezależnych sportowców.

Dziś Bielik to efekt pracy wolontariuszy, realizowany po godzinach. - Myślę, że w tym modelu ta karma wraca - mówi współtwórca. I dodaje: - Bielik to archiwum języka, ale też narzędzie, które zostanie z nami na trudne czasy.

W poprzednich odcinkach "Biznes Klasy" Łukasz Kijek rozmawiał z:

Wybrane dla Ciebie
"Miliony domów pozamykane na zardzewiałe kłódki". Eksperci alarmują
"Miliony domów pozamykane na zardzewiałe kłódki". Eksperci alarmują
Drogi prąd problemem USA. Trump zapowiada zwrot
Drogi prąd problemem USA. Trump zapowiada zwrot
Służby przeszukały biuro Tymoszenko. Media: podejrzenie o korupcję
Służby przeszukały biuro Tymoszenko. Media: podejrzenie o korupcję
Miliony zaległych faktur. Firmy mają problem. "Kiedy będzie ta kasa?"
Miliony zaległych faktur. Firmy mają problem. "Kiedy będzie ta kasa?"
Odchodzimy od pomp ciepła. Oto na co stawiają teraz Polacy
Odchodzimy od pomp ciepła. Oto na co stawiają teraz Polacy
Co dalej z reformą PIP? Jest głos z rządu
Co dalej z reformą PIP? Jest głos z rządu
Wielka fuzja gigantów w Polsce. Jest znak zapytania. Minister ujawnia
Wielka fuzja gigantów w Polsce. Jest znak zapytania. Minister ujawnia
Już dziś wpływają na przekształcanie umów. Mało kto o tym wie
Już dziś wpływają na przekształcanie umów. Mało kto o tym wie
Kołodziejczak ocenia protesty. "Skompromitowały polskich rolników"
Kołodziejczak ocenia protesty. "Skompromitowały polskich rolników"
99 mld zł i wciąż za mało. Prawie 700 gmin nie spełnia norm
99 mld zł i wciąż za mało. Prawie 700 gmin nie spełnia norm
Konflikt w Iranie wisi na włosku. Rynek ropy reaguje
Konflikt w Iranie wisi na włosku. Rynek ropy reaguje
Gary Neville i długi podatkowe. Pół miliona funtów straty dla budżetu
Gary Neville i długi podatkowe. Pół miliona funtów straty dla budżetu