NTNU og UiO etablerer egen språkmodellklynge sammen med Nasjonalbiblioteket
Klyngen opprettes ut fra hva partene er enige om at er et skrikende behov for bedre koordinering av FoU på språkmodeller i Norge.
Jon Atle Gulla begrunner samarbeidet med at her er tre institusjoner med kompetanse som utfyller hverandre.
Arkivbilde fra Arendalsuka: Tore Oksholen
Klyngen skal ledes på omgang av UiO, NTNU og NB. Stephan Oepen fra UiO leder klyngen i 2026 – for 2027 blir det enten en leder fra NB eller fra NorwAI.
Jon Atle Gulla, professor og
leder for NorwAI ved NTNU, sier til Universitetsavisa at initiativet møter et erkjent
behov for å synliggjøre forskningsmiljøet på kunstig intelligens. Samarbeidet
vil også virke gjensidig styrkende.
- Vi ser jo
at vi har kompletterende kompetanse. Nasjonalbiblioteket er god på prosessering og tilrettelegging av data for språkmodelltrening, også på storskala trening av språkmodeller, mens Universitetet i Oslo har høy kompetanse på det med grunnforskning
på språkmodell og evaluering. Vi på NorwAI er veldig gode på å lage
språkmodeller for industriell bruk med finjustering og tilpasning, sier Gulla.
MIMIR-prosjektet
Språkgruppa
ved UiO og NorwAI har ifølge Gulla samarbeidet godt i det såkalte
MIMIR-prosjektet der Kulturdepartementet bad de tre teste om norske
språkmodeller ble bedre ved bruk av opphavsrettsbeskyttet materiale. Det har vist seg å være en riktig hypotese, sier
han – særlig nyhetsstoff fra avisene var verdifullt for norske modeller.
Det har
ført til at Kulturdepartementet har bevilget 45 millioner kroner årlig i kompensasjon
til norske journalister for bruk av nyhetsmateriale til trening av norske
språkmodeller.
Utover det
har UiO og NTNU begge fått ekstra bevilgninger for å satse på framvoksende
teknologier – 25 millioner til hvert
universitet i år og 50 millioner fra 2027 utover.
Gulla understreker at bevilgningene på framvoksende teknologier ikke er øremerket til språkmodeller.
- Det er opp til UiO og NTNU å bestemme hva disse midlene skal brukes til. Men håpet er at noen av disse midlene allokeres til dette felles initiativet på forskning på norske språkmodeller, sier han.
Seks KI-sentra etablert
Regjeringen
har etablert seks nasjonale sentre for KI. Ingen av disse har forskning på kunstig
intelligens som del av sitt prosjekt, forklarer Gulla.
- De nye nasjonale sentrene for KI vil nok bruke språkmodeller i sin forskning. Men ingen av dem har forskning på selve språkmodellene og hvordan de trenes som fokus.
Nasjonalbiblioteket har fått bevilgninger på 20 millioner til å trene språkmodeller for det norske samfunnet, men dette inkluderer ikke forskning.
- Det mangler altså en satsing på - og midler for - språkmodellforskning slik situasjonen er i dag, sier professor Jon Atle Gulla.