Polski AI w Paryżu. Model językowy Bielik zadebiutował
Podczas konferencji GOSIM AI Paris zadebiutowała nowa rodzina otwartych modeli językowych Bielik, rozwijanych przez społeczność SpeakLeash we współpracy z Cyfronetem AGH. Wśród premierowych modeli znalazły się wersje o rozmiarach 1.5B, 4.5B i 11B, wszystkie zoptymalizowane pod język polski - czytamy.
Podczas międzynarodowej konferencji GOSIM AI Paris społeczność SpeakLeash zaprezentowała nową rodzinę otwartych modeli językowych Bielik, stworzonych we współpracy z ACK Cyfronet AGH. Modele są w pełni otwarte, zoptymalizowane pod język polski i gotowe do komercyjnego wykorzystania.
Debiut obejmuje trzy wersje:
- Bielik 3.0 – 1.5B
- Bielik 3.0 – 4.5B
- Bielik 2.5 – 11B
Modele 3.0 bazują na architekturze Qwen 2.5 i zostały wyposażone w nowy tokenizer – mechanizm, który dzieli tekst na jednostki zrozumiałe dla modelu (np. słowa, frazy lub ich fragmenty). Został on zoptymalizowany specjalnie pod język polski, co przekłada się na szybsze i trafniejsze generowanie wypowiedzi. Z kolei Bielik 2.5 – 11B, oparty na architekturze Mistral, obsługuje formaty strukturalne (np. JSON), potrafi wnioskować (choć na razie w fazie eksperymentalnej) i współpracuje z zewnętrznymi narzędziami – a wszystko to w pełni otwarcie i dostępnie - czytamy.
Dalsza część artykułu pod materiałem wideo
Polak buduje satelity i systemy kwantowe - wprowadza Polskę do kosmicznej elity - Grzegorz Brona
Tool use i zalążek modelu wnioskującego to bardzo ważny element w rozwoju Bielika. Dzięki temu agent do zadań specjalnych może być dziś dostępny dla każdego – mówi Remigiusz Kinas, szef R&D projektu Bielik.
Z Polski do Europy
– W małych modelach przetestowaliśmy nową architekturę, w większych wdrożyliśmy wnioskujące komponenty. To dopiero początek – komentuje Krzysztof Ociepa, lider zespołu trenującego modele.
Premiera odbywa się pod honorowym patronatem Ministerstwa Cyfryzacji, a projekt wspierają m.in. PFR, Credit Agricole, PZU, Deviniti i Google Cloud Poland. Udział w GOSIM AI, jednej z najważniejszych konferencji open source AI w Europie, ma podkreślić aspiracje twórców do budowy rozpoznawalnej marki na poziomie kontynentalnym.
Modele Bielik powstały na danych z wolnych licencji i są publikowane na licencji Apache 2.0, co oznacza pełną otwartość – również komercyjną.