VÄLJ SPRÅK:

Modern technology with bright lights

Mer effektiv MT med rankning som visar hur enkelt det är att maskinöversätta olika språk

Dra nytta av insikter om vilka språk det är enklare för maskiner att översätta innan du använder maskinöversättning

I dag upplever företag sig mer och mer pressade att översätta mer innehåll snabbare. Då har maskinöversättning (MT) visat sig vara en viktig del av lösningen. Det är väl värt mödan att jämföra prestanda hos stora MT-motorer – Google NMT, Bing NMT, Amazon, DeepL och Yandex – för att se vilken motor som bäst kan tillgodose dina behov. Vi analyserar faktiskt MT-motorers prestanda varje månad via MT Tracker. Lionbridges bedömningsverktyg för maskinöversättning har använts under lång tid för att mäta resultaten från stora MT-motorer. Däremot är det viktigt att göra ytterligare utvärderingar, särskilt som vår analys pekar på att motorerna för närvarande har likartad prestanda. 

För att få ut mesta möjliga av MT bör du även fundera över hur enkelt det är för olika MT-motorer att översätta vissa språkkombinationer och ta hänsyn till olika språks översättningsbarhet. För att du enklare ska kunna jämföra språk har vi tagit fram en lista med de 28 vanligaste målspråken från engelska. I tabell 1 kan du se hur lätta de är att maskinöversätta.

Varför är det viktigt att ta reda på språkkombinationers maskinöversättnings­­barhet?

Genom att ta reda på hur maskinöversättningsbara språkkombinationer är kan du enklare avsätta rätt budget när du planerar översättningskostnader för olika språk. På så sätt får du en bättre uppfattning om vilka språkkombinationer som kräver mer resurser att översätta. 

Insikter om språkens komplexitet kan hjälpa dig att fatta bättre affärsbeslut och hjälpa dig att besvara följande frågor:

  • Bör en större del av budgeten användas till efterredigering av språkkombinationer som är mer komplexa?
  • Är enkel efterredigering eller fokuserad efterredigering (där efterredigeringen enbart är inriktad på viktiga delar av innehållet) tillräcklig för vissa språk, om budgeten är snäv? Till vilka språk bör jag använda de här efterredigeringsmetoderna?
  • Bör mitt företag lägga till språkrankning bland de affärsmässiga och kulturella faktorer som påverkar hur vi bäst fördelar budgeten, framför allt i projekt med liten budget? Om en kultur godtar en lägre kvalitetsnivå, bör mitt företag översätta till ett språk som är svårt att maskinöversätta enligt rankningslistan?
Digital stream of information

Hur beräknas ett språks maskinöversättningsbarhet?

Det är inte helt enkelt att ta reda på hur lätt det är att maskinöversätta språk. Det finns en rad olika utmaningar som skiljer sig åt mellan språk. Och det som betraktas som ett bra resultat för ett språk anses otillräckligt för ett annat. Vi kan dock använda vissa mått för att göra en bedömning. 

Till exempel kan redigeringsavstånd användas. Det är ett mått för hur många ändringar en efterredigerare gör för att se till att den färdiga texten håller lika hög kvalitet som efter manuell översättning. Det kan ge oss en uppfattning om hur komplext språket är, så att vi enklare kan avgöra hur svårt det är att maskinöversätta olika språkkombinationer – även om måttet vanligtvis inte används för att jämföra språk. 

Lionbridges rankningslista: Hur enkelt är det att maskinöversätta olika språk och varför?

Lionbridge har rankat hur lätt det är att maskinöversätta 28 målspråk från engelska, baserat på vår behandling av miljontals meningar. 

Resultaten visar att det finns ett samband mellan hur komplex maskinöversättningen är och vilken familj språket tillhör.  

Romanska språk

De flesta romanska språk, som portugisiska, spanska, franska och italienska, kräver färre ändringar för att uppnå hög kvalitet vid översättning från engelska. Vi har fastställt att de här målspråken är enklast för maskiner att hantera, och de knep de fyra första platserna i vår lista över språk som är lättast att maskinöversätta till. 

Det är värt att notera att rumänska, det femte språket på listan som tillhör den romanska språkfamiljen, hamnar längre ner på rankningslistan, nämligen på plats tio. Det här resultatet, för det romanska språk som översätts minst, beror förmodligen på att det finns ett mindre förråd av tvåspråkiga träningsdata som används för att träna MT-motorer. En annan förklaring är att rumänska har en komplicerad grammatik som delar vissa likheter med latin.   

Förenklad kinesiska

Förenklad kinesiska – ett språk som skiljer sig avsevärt från engelska – hamnar på femte plats på vår lista, direkt efter de fyra romanska språken i topp. Vi tillskriver den här höga placeringen återkommande uppdateringar och förbättringar av MT för den här språkkombinationen de senaste fem åren, något vi har kunnat se i vår kontinuerliga MT-spårning under den här tiden. MT-företag investerar mer i den här språkkombinationen för att uppnå bättre prestanda, eftersom det finns så starka affärsintressen här. 

Komplexa språk

Ungerska och finska – två uraliska språk – är mer komplicerade. De hamnade sist på vår lista med plats 27 respektive 28. Estniska, ett komplext språk i samma familj, hamnar på 24:e plats på listan. 

Koreanska rankades nästan lägst och ligger på 25:e plats på vår lista.

Person working on computer with analytical data

Vad kan vi lära oss av att analysera språkens maskinöversättnings­barhet?

Jämförelser mellan språk har visserligen sina begränsningar, men rankningen och sambanden mellan komplexitet och språkfamiljer kan ändå ge intressanta insikter som kan hjälpa dig att hantera flerspråkiga projekt bättre.

Tabell 1

Rankning av språks maskinöversättningsbarhet

Plats Språk (från engelska) Plats Språk (från engelska) Plats Språk (från engelska)
1 Portugisiska 11 Thailändska 20 Kinesiska (traditionell)
2 Spanska 12 Norska 21 Litauiska
3 Franska 13 Tyska 22 Tjeckiska
4 Italienska 14 Svenska 23 Arabiska
5 Kinesiska (förenklad) 15 Turkiska 24 Estniska
6 Nederländska 16 Slovakiska 25 Koreanska
7 Danska 17 Hebreiska 26 Ryska
8 Japanska 18 Lettiska 27 Ungerska
9 Grekiska 19 Polska 28 Finska
10 Rumänska        

Tabell 1

Rankning av språks maskinöversättningsbarhet

Plats Språk (från engelska)
1 Portugisiska
2 Spanska
3 Franska
4 Italienska
5 Kinesiska (förenklad)
6 Nederländska
7 Danska
8 Japanska
9 Grekiska
10 Rumänska
11 Thailändska
12 Norska
13 Tyska
14 Svenska
15 Turkiska
16 Slovakiska
17 Hebreiska
18 Lettiska
19 Polska
20 Kinesiska (traditionell)
21 Litauiska
22 Tjeckiska
23 Arabiska
24 Estniska
25 Koreanska
26 Ryska
27 Ungerska
28 Finska

Hör av dig

Om du vill lära dig mer om hur Lionbridge kan hjälpa dig att ta fram en effektiv MT-strategi för att tillgodose dina översättningsbehov, kontakta oss i dag.

linkedin sharing button
  • #technology
  • #blog_posts
  • #translation_localization

Rafa Moral med Janette Mandell
FÖRFATTARE
Rafa Moral med Janette Mandell