Article content illustration

Polsk AI-modell: Vad är PLLuM?

04/03/2025

Den polska teknologiscenen har berikats med en ny, avancerad språkmodell – PLLuM (Polish Large Language Model). Detta öppna projekt, initierat av ett konsortium av sex ledande polska vetenskapliga institutioner, syftar till att stödja offentlig förvaltning, näringsliv och akademiska miljöer i bearbetning och generering av texter på polska.

PLLuM: En ny era av polsk artificiell intelligens

PLLuM presenterades officiellt den 24 februari 2025 av Ministeriet för digitalisering, och dess implementering har tillkännagivits på portalen gov.pl. Modellen utmärker sig genom sin flexibilitet och skalbarhet och fungerar inom strukturer från 8 till 70 miljarder parametrar, vilket möjliggör exakt generering av innehåll på polska. Dess grund är en omfattande textkorpus med cirka 150 miljarder tokens, noggrant utvalda och rengjorda för språklig korrekthet och tematisk mångfald.

Projektet PLLuM är ett resultat av samarbetet mellan följande institutioner:

  • Tekniska universitetet i Wrocław (projektledare) – engagerat i utvecklingen av algoritmer för moderna språkmodeller.
  • NASK – Nationellt forskningsinstitut
  • Institutet för grundläggande informatik vid Polska vetenskapsakademien – bedriver forskning om de etiska aspekterna av artificiell intelligens i Polen.
  • Centrum för informationsbehandling – Nationellt forskningsinstitut
  • Universitetet i Łódź
  • Institutet för slavistik vid Polska vetenskapsakademien

Målet med projektet är att skapa ett verktyg som inte bara möter behoven hos offentlig förvaltning utan också är tillgängligt för en bred användarbas, vilket stöder innovation inom den privata sektorn.

BielikAI: En pionjär inom polska språkmodeller

En annan viktig polsk språkmodell är BielikAI, utvecklad av SpeakLeash Foundation i samarbete med Akademiska datorcentret Cyfronet AGH, som också är verksamt inom artificiell intelligens. Den första versionen av Bielik, baserad på Mistral-7B-arkitekturen, presenterades 2024 och innehöll 7 miljarder parametrar. Modellen tränades på en polsk språk-korpus bestående av över 70 miljarder tokens.

I augusti 2024 släpptes den andra versionen – Bielik v2, som medförde betydande förbättringar inom naturlig språkbehandling. Modellen utökades till 11 miljarder parametrar och har ett brett kontextfönster som hanterar upp till 32 768 tokens. Detta gör att Bielik v2 kan bearbeta längre och mer komplexa texter, vilket gör den till en av de mest kraftfulla språkmodellerna som skapats i Polen.

Jämförelse av nyckelfunktioner i polska språkmodeller

Nedan presenteras en jämförelse av de viktigaste egenskaperna och användningsområdena för modellerna PLLuM och BielikAI:

Funktion/AnvändningsområdePLLuMBielikAI
Antal parametrar8–70 miljarder11 miljarder
TräningsdataCirka 150 miljarder tokensÖver 70 miljarder tokens
Huvudsakliga användningsområdenOffentlig förvaltning, näringsliv, forskningInnehållsgenerering, textanalys och AI-applikationer
TillgänglighetÖppen licens, tillgänglig för allaOpen-source, tillgänglig på Hugging Face
Unika egenskaperSkalbarhet, anpassning till polsk språkstruktur och administrativ terminologiBred kontext (32 768 tokens), förmåga att bearbeta längre och mer komplexa texter

Båda modellerna representerar ett betydande framsteg inom utvecklingen av polsk artificiell intelligens. De erbjuder avancerade verktyg för bearbetning av naturligt språk och stöder olika sektorer inom ekonomi och offentlig förvaltning.

Utvecklingen av artificiell intelligens i Polen

Polska språkmodeller som PLLuM och BielikAI utgör en milstolpe i utvecklingen av artificiell intelligens för det polska språket. PLLuM, utvecklad av ett konsortium av ledande forskningsinstitutioner, erbjuder hög skalbarhet och precision, vilket stödjer offentlig förvaltning, näringsliv och akademisk forskning. BielikAI, utvecklad av SpeakLeash Foundation och Cyfronet AGH, fokuserar på innehållsgenerering och textanalys, med öppen tillgänglighet för forskarsamhället och tekniksektorn.

Modellerna skiljer sig åt i fråga om parametrar, träningsdata och användningsområden, men de delar ett gemensamt mål – att utveckla innovativa språkverktyg som kan förbättra kommunikation, automatisering och tillgång till avancerad AI-teknologi på polska. Den växande mängden av sådana initiativ visar att Polen aktivt deltar i den globala kapplöpningen om AI-utveckling och skapar sina egna avancerade lösningar anpassade till landets språkliga och kulturella behov.

Ka
Author of the article
Karolina
Account Manager

Latest articles

Single article preview

Innovations | 04/03/2025

Polsk AI-modell: Vad är PLLuM?

Karolina

Den polska teknologiscenen har berikats med en ny, avancerad språkmodell – PLLuM (Polish Large Language Model). Detta öppna projekt, initierat av ett konsortium av sex ledande polska vetenskapliga institutioner, syftar till att stödja offentlig förvaltning, näringsliv och akademiska miljöer i bearbetning och generering av texter på polska.

Read more
Single article preview

Innovations | 26/02/2025

EU vs USA AI: Vem kommer att leda racet med artificiell intelligens?

Bernhard

Artificiell intelligens håller på att omforma ekonomier, industrier och samhällen över hela världen. I konkurrensen om att leda denna tekniska revolution har tre stora aktörer vuxit fram: Europeiska unionen, USA och Kina. Varje region har antagit en unik strategi för AI-utveckling och balanserar innovation, reglering och ekonomiska intressen på olika sätt, med särskild hänsyn till riskerna för dataskydd.

Read more
Single article preview

Business | 21/02/2025

Minska risker i IT-personalökning

Agata

Personalförstärkning har blivit en nyckelstrategi för IT-chefer som snabbt vill skala upp utvecklingsteam, få tillgång till specialkompetens och optimera kostnaderna utan att behöva anställa på heltid. Men med dessa fördelar kommer också specifika risker - från ineffektivitet i verksamheten till sårbarheter i datasäkerheten och utmaningar med efterlevnad.

Read more