Ytring

Ikke oversett til samisk med ChatGPT

Flere ønsker å ta i bruk samisk, og ny teknologi gjør det tilsynelatende enkelt. Resultatet blir ofte et språk som er uforståelig eller misvisende.

For små språk er det fortsatt manuell skriving som gjelder, slår Kjærstad og Murray fast.
Publisert

Dette er en ytring. Inn­holdet i teksten uttrykker forfatterens mening.

I det siste har flere kolleger vist interesse for å bruke samiske språk i forskningsformidlingen sin. Det er gledelig å se at stadig flere får øynene opp for samisk og ønsker å bruke det, men jobben må gjøres manuelt. Det er fortsatt store utfordringer i maskinoversettelse for små språk. 

For store språk finnes det digitale oversettelseshjelpemidler: Google Translate, ChatGPT og lignende verktøy kan gi brukbare oversettelser av korte tekster. Nordsamisk er nylig lagt til i Google Translate, med varierende resultat. Situasjonen er enda verre for sørsamisk og lulesamisk, som fortsatt mangler gode oversettelsestjenester. 

Flere av dem som tar kontakt, har forsøkt å bruke ChatGPT til oversettelser. Problemet er at ChatGPT alltid er programmert til å gi et svar – også når den ikke kan. Den har ingen mulighet til å si at den ikke behersker språket du spør om, og prøver derfor å «lage» et språk basert på mønstre den har sett i kilder. Resultatet kan virke overbevisende for den som ikke kan språket, men det har ofte lite til felles med ekte samisk. 

Eksempler: 

Setning som oversettes: Mitt navn er Helen og jeg bor i Trondheim.


ChatGPT (sørsamisk): Mov naamne Helen jïh bijjem Trondheimisne.
Riktig sørsamisk: Mov nomme Helen jïh manne Tråantesne årroeminie.

ChatGPT (lulesamisk): Mån namma li Helen ja mån várrám Trondheimin .
Riktig lulesamisk: Muv namma l Helen ja årov Roandemin .

Enig eller uenig?

Send oss din ytring på

Det sørsamiske ordet «bijjem» eksisterer ikke, men er lagd med assossiasjon til «jeg bor», fordi slike setninger ofte har samsvar mellom -r i norsk og -em i sørsamisk. Men det hjelper ikke når ordet er oppfunnet for anledningen. Det ganske artige ordet «naamne» viser også hvordan ChatGPT helt på egen hånd lager et sørsamisk ord av et norsk ord. 

I begge eksemplene ser vi at ChatGPT klarer å finne enkelte riktige ord, men bommer totalt på andre. Den gjenkjenner noen grammatiske former, men bruker dem ikke korrekt. Ved mer komplekse setninger blir resultatet enda dårligere – ofte til det punktet at teksten blir uforståelig eller villedende. 

For mer avanserte setninger er resultatet så dårlig at vi lar være å ta dem med her, for å unngå å få det på trykk. Man kan i noen tilfeller komme nærmere en korrekt oversettelse ved å utfordre ChatGPT, for eksempel ved å be den forklare ordvalg eller grammatiske former, men dette krever at brukeren allerede har gode kunnskaper i språket. Som oftest vil ChatGPT forsvare sine egne valg, selv om de mangler rot i virkeligheten. 

For kvensk ser det ut til å være litt annerledes. Her finner ChatGPT langt oftere et ord som gir mening, i hvert fall på finsk. Det ser ut til å være verre med grammatikken og det kvenske bøyingssystemet. 

Skriv manuelt 

For små språk er det derfor fortsatt manuell skriving som gjelder. Giellatekno og Divvun ved UiT har utviklet ordbok, stavekontroll og grammatikkontroll som gjør det enklere å skrive for dem som allerede kan språket. 

Oversettelsestjenesten Giellatekno Apertium ble utviklet med mål om å gjøre det enklere for folk å skrive på nordsamisk, for eksempel i sosiale medier. – Den som ikke forstår, kan bruke oversetteren for å få teksten oversatt fra nordsamisk til norsk, men ikke motsatt vei. 

Giellatekno har bevisst latt være å publisere oversettere som produserer dårlig samisk. Store mengder tullespråk på internett kan være ødeleggende. Nylig ble den grønlandske Wikipedia-siden foreslått nedlagt fordi velmenende brukere oversvømte sidene med dårlige maskinoversatte tekster. 

Det finnes likevel maskinoversettere til sørsamisk og lulesamisk, som den estiske oversettelsestjenesten Neurotõlge, utviklet av Universitetet i Tartu. Den oversetter med noe bedre resultat enn ChatGPT. Men for alle samiske språk gjelder fortsatt den gamle regla: Få alltid noen til å sjekke over at det du skriver er riktig, om du ikke kan språket!