Polacy nie gęsi, swoje AI mają. "Narzędzie na trudne czasy"

Bielik AI - budowany weekendami przez grupę pasjonatów, trenowany na polskim języku, to pierwszy tak zaawansowany polski model językowy. Fundacja Spichelrz działająca non-profit ma jeden cel: suwerenność technologiczna Polski. Zobacz najnowszy odcinek "Biznes Klasy" z Sebastianem Kondrackim.

SebastianSebastian Kondracki gościem "Biznes Klasy"
Źródło zdjęć: © YouTube, bielik.ai | -
Łukasz Kijek

"Biznes Klasa" to program money.pl dostępny na YouTube. Szef redakcji Łukasz Kijek prowadzi w nim rozmowy z przedsiębiorcami - o ich życiu, biznesie, zarobkach i wielu innych sprawach. Gościem ostatniego odcinka był Sebastian Kondracki, współtwórca Bielik AI, prezes Fundacji Spichlerz.

Dalsza część artykułu pod materiałem wideo

Zanim zaufasz ChatGPT, zobacz jak działa polski Bielik - Sebastian Kondracki w Biznes Klasie

Polacy nie gęsi, swoje AI mają

W czasach, gdy prym w rozwoju sztucznej inteligencji wiodą giganci technologiczni, w Polsce powstał projekt inny niż wszystkie. Bielik AI - duży model językowy wyszkolony głównie na danych w języku polskim - został zbudowany nie w Dolinie Krzemowej, oddolnie, w ramach działań Fundacji Spichlerz. - Nie sądzę, że powstanie w Polsce drugi OpenAI, ale dzięki Bielik AI może powstać dużo zwinnych, sprytnych firm, które zrobią swoje i w niszy będą globalnym liderem - mówi Sebastian Kondracki, współtwórca Bielika.

Wyróżnikiem Bielika jest jego narodowe zakorzenienie i możliwość uniezależnienia się od tzw. bigtechów. Aż 90 proc. danych treningowych stanowią teksty w języku polskim. Dla porównania, w globalnych modelach ten udział sięga ledwie 8 proc. Efekt? Model rozumie język potoczny, emocjonalny, a nawet mowę z błędami. - Mówisz "chleb i margaryna", a model wie, że chodzi o ciężką sytuację ekonomiczną - tłumaczy Kondracki.

Suwerenność technologiczna Polski

Ale Bielik to nie tylko lepsze zrozumienie polskiego kontekstu. To także realna odpowiedź na problemy związane z przetwarzaniem danych. W przeciwieństwie do chmurowych modeli takich jak GPT, Bielika można uruchomić lokalnie, całkowicie offline. - Nie interesuje nas nic, on nigdzie nic nie wyśle, nigdzie nic nie przetworzy na zewnętrznych serwerach - tłumaczy Kondracki. To kluczowe przy pracy z danymi wrażliwymi, np. w sektorze zdrowia, bankowości czy administracji.

Model liczy 11 miliardów parametrów - stosunkowo mało w porównaniu z gigantami pokroju GPT-3.5, ale wystarczająco dużo, by skutecznie przetwarzać język i działać na jednej karcie graficznej. - To jak z samochodami - nie zawsze potrzebujesz limuzyny, czasem wystarczy zwinna furgonetka do zadań specjalnych - wyjaśnia obrazowo Kondracki.

Dzięki otwartej licencji, Bielik jest darmowy nawet do zastosowań komercyjnych. To, co kosztuje, to sprzęt - czyli GPU - ale już samo korzystanie z modelu nie generuje kosztów tokenowych, które w przypadku globalnych rozwiązań mogą sięgać tysięcy dolarów miesięcznie. - Każdą dokumentację, log czy transakcję można "dobielić", ile tylko karta graficzna obsłuży - mówi Kondracki.

Niemcy uczą się od Polaków AI

Ambicje twórców Bielika sięgają także poza granice Polski.

Polacy kojarzą się z dobrą technologią, Bielik dobrze wymawia się po niemiecku, to stwierdziliśmy, że stworzymy projekt "Der Bielik". Teraz mamy taki oddzielny zespół natywnych Niemców, którzy właśnie bardzo mocno przygotowują testy Bielika w języku niemieckim, ale już pod kątem właśnie kulturowych, różnic między niemieckim z różnych landów, czy też pomiędzy Austrią a Niemcami, Szwajcarią. Chcemy troszeczkę mocniej zająć się tym językiem niemieckim - zdradza Kondracki.

Dodatkowo polski model językowy (LLM) stworzony przez grupę pasjonatów pracujących głównie weekendami i po godzinach, trafi do jednego z najpopularniejszych systemów AI na świecie - Perplexity. Zapowiedział to CEO Nvidii Jensen Huang. Nvidia, pierwsza spółka na świecie z wyceną powyżej 4 bilionów dolarów i SpeakLeash podpisały też list intencyjny dotyczący współpracy. - Już trenujemy model wnioskujący (z ang. reasoning - przyp. red.), trenujemy też model multimodalny. Nawet Niemcy nie są tak zaawansowani w swoich pracach - wskazuje Sebastian Kondracki.

Polskie firmy i urzędy już korzystają z Bielik AI

Projekt już dziś znajduje zastosowanie w praktyce. Testy przeprowadził m.in. Zakład Ubezpieczeń Społecznych, gdzie Bielik okazał się najlepszym rozwiązaniem. Korzystają z niego także banki - w tym do anonimizowania danych przesyłanych do zewnętrznych modeli, a także upraszczania komunikacji z klientem. Z Bielika korzystano również podczas polskiej prezydencji w UE, a nawet w eksperymentalnym projekcie związanym z Międzynarodową Stacją Kosmiczną.

Choć Fundacja Spichlerz nie działa dla zysku, to model biznesowy wokół Bielika zaczyna się klarować. - Chcemy iść drogą Linuxa - oddolnie, z pomocą społeczności i sponsorów, ale z otwartym kodem i licencją. Na tej bazie mogą powstawać tysiące komercyjnych rozwiązań - ocenia Kondracki. Marzeniem zespołu jest, by w Polsce rozwijały się specjalizowane modele dla poszczególnych branż - od medycyny po media.

W tym duchu powstał projekt Obywatel Bielik - obywatelska inicjatywa mająca na celu zbieranie zdjęć polskich potraw, zabytków czy przyrody, które posłużą do stworzenia pierwszego polskiego modelu multimodalnego. - Nie potrzebujemy zdjęć artystycznych, potrzebujemy polskich - podkreśla Kondracki.

Choć Fundacja nie korzysta z finansowania rządowego, współpracuje z instytucjami publicznymi, m.in. w zakresie danych, wdrożeń i edukacji. - Chcę mieć na plecach wiele marek, ale żeby nikt nie mówił mi, jak trenować - zastrzega Kondracki, porównując sytuację do niezależnych sportowców.

Dziś Bielik to efekt pracy wolontariuszy, realizowany po godzinach. - Myślę, że w tym modelu ta karma wraca - mówi współtwórca. I dodaje: - Bielik to archiwum języka, ale też narzędzie, które zostanie z nami na trudne czasy.

W poprzednich odcinkach "Biznes Klasy" Łukasz Kijek rozmawiał z:

Wybrane dla Ciebie
Ropa po 150 dol.? Skandynawia kreśli czarne scenariusze
Ropa po 150 dol.? Skandynawia kreśli czarne scenariusze
Ataki Iranu obejmują Katar. To zagrożenie dla dostaw gazu do Polski? Minister Energii odpowiada
Ataki Iranu obejmują Katar. To zagrożenie dla dostaw gazu do Polski? Minister Energii odpowiada
Atak na Iran zamyka niebo. Loty masowo wstrzymywane
Atak na Iran zamyka niebo. Loty masowo wstrzymywane
Polska sprowadza LNG z Kataru. "Źródło ogromnej niestabilności"
Polska sprowadza LNG z Kataru. "Źródło ogromnej niestabilności"
Czy USA mają gotowy plan politycznej transformacji Iranu? [OPINIA]
Czy USA mają gotowy plan politycznej transformacji Iranu? [OPINIA]
Izrael i USA atakują Iran. Ministerstwo Infrastruktury reaguje
Izrael i USA atakują Iran. Ministerstwo Infrastruktury reaguje
USA i Izrael uderzają w Iran. Stawką jest bomba atomowa
USA i Izrael uderzają w Iran. Stawką jest bomba atomowa
Połączenia do Izraela. LOT podjął decyzję. Jest komunikat
Połączenia do Izraela. LOT podjął decyzję. Jest komunikat
Świat patrzy na Ormuz. Iran może uderzyć w światowy handel ropą
Świat patrzy na Ormuz. Iran może uderzyć w światowy handel ropą
Iran to potęga naftowa. Atak Izraela może wstrząsnąć cenami ropy i paliw
Iran to potęga naftowa. Atak Izraela może wstrząsnąć cenami ropy i paliw
Wojna w Iranie uderzy w polskie firmy? Chodzi o ceny paliw
Wojna w Iranie uderzy w polskie firmy? Chodzi o ceny paliw
Izrael uderza na Iran. "Atak w sobotę rano nie jest przypadkowy"
Izrael uderza na Iran. "Atak w sobotę rano nie jest przypadkowy"