Text och bild: Sebastian Dahlström
– Många språk, eller språkvarieteter, som inte hänger med i den digitala utvecklingen kommer att ha svårt att överleva. Därför tycker jag att Finland nu borde satsa på finlandssvensk AI-utveckling, säger Jörg Tiedemann.
När stora språkmodeller, som exempelvis ChatGPT, tränas på ett visst språk krävs enorma mängder text. Då är det naturligt att man utgår från standardvarianten av ett språk eftersom det är där mest träningsmaterial finns. För svenskans del kan det innebära att rikssvenskan tar över på finlandssvenskans bekostnad.
– Finlandssvenskar är ofta stolta över sina dialekter. En österbottning vill gärna låta lite annorlunda än en stockholmare. Språket bygger social gemenskap och man vill gärna ha vissa avgränsningar för att känna sig som en del av en grupp.
Om man inte tränar AI-modellerna på finlandssvenskt språkbruk och dialektala drag riskerar den språkliga avgränsningen att försvinna och leda till språklig likriktning.
– Om en språklig varietet försvinner tappar de människor som hör till den språkliga gruppen en del av sin identitet. Därför är en satsning på finlandssvensk AI-utveckling i grunden en politisk fråga, säger Jörg Tiedemann.
Språk utvecklas ständigt – men AI kan driva likriktning
Till språkens natur hör att de ständigt förändras. Ett språk som används aktivt utvecklas konstant. En allt större del av vår språkanvändning sker i dag i interaktion med stora språkmodeller som bygger på artificiell intelligens. Om vi anpassar vårt språkbruk för att passa modellerna riskerar vi att förlora regionala särarter.
Om man vill att vissa språk ska bevaras måste man satsa på att utveckla teknologin så att språket används i den digitala världen.
– Eftersom vi vill att språkmodellen ska förstå vad vi menar kanske vi undviker typiskt finlandssvenska ord och uttryck och i stället använder ett språk som ligger närmare rikssvenskan. Då blir vårt språkbruk mer likriktat och finlandssvenska nyanser försvinner.
Jörg Tiedemann påpekar att samma fenomen inte enbart gäller språkliga uttryck och ordval, utan även vilka associationer och referenser AI-modellerna utgår från. Svaren man får kan vara anpassade för Sverige och inte nödvändigtvis passa in i en finländsk kontext. Det kan handla om allt från myndighetsnamn till begrepp om skola och samhälle.
Att hålla finlandssvenskan ”offline” är inget alternativ
Ett ännu större hot mot små språk och språkvarieteter är att inte alls använda språken i moderna digitala miljöer.
– Därför är det viktigt att ett språk är attraktivt för yngre personer som aktivt använder digitala medier och AI. Om man vill att vissa språk ska bevaras måste man satsa på att utveckla teknologin så att språket används i den digitala världen.
För svenskans del gäller det att se till att den finns tillgänglig som språkval i populära appar och program. Om alla svenskspråkiga lever hela sitt digitala liv på engelska utgör det i slutändan ett hot mot svenskan, säger Tiedemann.
– Om små språk inte finns med i populära appar och program så används de inte.
Jörg Tiedemann, professor i språkteknologi vid Helsingfors universitet, säger att vi borde satsa mer på finlandssvenskan i våra AI-modeller.
Satsningar kan locka internationella aktörer
I sin forskning vid Helsingfors universitet koncentrerar sig professor Jörg Tiedemann främst på utvecklingen av AI-verktyg för översättning. Han är ursprungligen från Tyskland, men har forskat och arbetat länge i Uppsala. När han flyttade till Finland 2015 satsade Helsingfors universitet mycket på maskinöversättning mellan finska och engelska.
– Vi arbetade hårt för att göra finskan synlig i internationella tävlingar för maskinöversättning. Satsningen gjorde att stora internationella AI-laboratorier lockades att utveckla ny teknik för översättning med fokus på små, icke-indoeuropeiska språk som finska. Under de senaste tio åren har maskinöversättningen mellan finska och engelska förbättrats avsevärt, eftersom det har varit ett attraktivt forskningsområde.
Oberoende av om maskinerna klarar en översättning bättre, sämre eller lika bra som en mänsklig översättare är ansvarsfrågan den springande punkten.
– Om en mänsklig översättare gör ett fel är det den som publicerar informationen som har ansvaret.
Ofta tar avsändaren inte samma ansvar för automatöversättning, även om man enligt Tiedemann borde göra det.
– Om utgivaren inte tar ansvar för översättningen är det enda sättet för en användare att kontrollera om informationen är korrekt att själv gå till källan. Det betyder i praktiken att hela ansvaret ligger på användaren och att man egentligen inte erbjudit någon översättning.
AI kan bevara vår språkliga rikedom – om vi så vill
Vi återkommer till hoten mot finlandssvenskan i en språkmiljö som allt mer präglas av artificiell intelligens och stora språkmodeller. För även om dessa kan driva en utveckling där små språkvarieteter utarmas och likriktas kan de också vändas till en möjlighet för lokala språk.
Inget hindrar att vi exempelvis lär AI-modellerna finlandssvenska dialekter. En sådan utveckling kunde stärka finlandssvenskans förutsättningar att överleva.
Det laboratorium som Tiedemann leder vid Helsingfors universitet arbetar med att utveckla AI-modeller för översättning mellan små språk. Han nämner särskilt många mindre språk i Afrika och Asien som saknar den kommersiella tyngd som gör dem attraktiva för vinstdrivande AI-företag. Tiedemanns team strävar också efter att göra AI-modellerna mer resurssnåla.
– Stora modeller kräver enorma mängder energi. Därför har vi satsat en hel del på att effektivisera verktygen så att de kan köras lokalt på en dator eller mobiltelefon. Det är både en fråga om energiförbrukning och om datasäkerhet, säger Tiedemann.
AI-teamet vid Helsingfors universitet är också involverat i paneuropeiska forskningsprojekt, som exempelvis OpenEuroLLM, med målsättningen att skapa europeiska alternativ till de kommersiella amerikanska AI-jättarna.
– Europa vill inte vara beroende av globala företag. De här modellerna har öppen källkod och tanken är att de ska kunna användas av europeiska företag i framtiden.
Vem tar ansvaret?
Även om de stora språkmodellerna hela tiden blir bättre är de inte felfria. Trots det förlitar sig allt fler företag och myndigheter på maskinöversättning, eftersom den är billigare än mänskliga översättare. Professor Jörg Tiedemann ser ansvarsfrågan som det största problemet i den här utvecklingen.
– Oberoende av om maskinerna klarar en översättning bättre, sämre eller lika bra som en mänsklig översättare är ansvarsfrågan den springande punkten.
– Möjligheten att göra modellerna mer känsliga för regionala språkvarianter finns absolut. Det krävs förstås att det finns tillräckligt med träningsdata för att anpassa en modell för en språkvarietet, säger Jörg Tiedemann.
Nyckelorden här är om man så vill. För det här arbetet kräver medvetna satsningar, i stil med den för ett tiotal år sedan då Finland lockade många internationella forskare för att stärka maskinöversättning mellan finska och engelska.
– Nu finns behov av en liknande satsning på finlandssvenska, som kunde locka internationella AI-laboratorier som vill hitta nya sätt att bevara olika språkliga varieteter.
