Besök Lionbridge Games

VÄLJ SPRÅK:

Two separate sets of couples collaborate in a work setting

Anpassning och träning av maskinöversättning

När ska du använda respektive metod för att förbättra resultatet från maskinöversättning?

Företag förlitar sig i allt högre grad på maskinöversättning (MT) och vi räknar med att användningen kommer att fortsätta öka. Den här trenden har sin förklaring i teknikens alltmer förutsägbara resultat och ett ökat tryck på marknaden för att producera mer innehåll snabbare och på många språk – med samma eller till och med lägre budget. MT-tekniken levererar snabba och kostnadseffektiva översättningar på ett sätt som mänskliga översättare inte mäktar med, men företagen måste också tänka på kvalitetsfrågan. För att lyckas på de alltmer digitaliserade marknaderna behöver de tillhandahålla innehåll på flera språk som är anpassat till ämnesområdet, har rätt tonläge och talar med en konsekvent varumärkesröst i alla kanaler.

Hur kan du få ut mesta möjliga av dina MT-projekt för att bättre uppnå dessa mål? Det finns två sätt att effektivisera resultatet från maskinöversättning: anpassning och träning av maskinöversättning. Båda metoderna kan höja MT-kvaliteten och minska behovet av efterredigering, men företag får inte tro att MT-anpassning och MT-träning är samma sak.

Läs vidare för att ta reda på hur metoderna fungerar, vilka skillnaderna mellan dem är och hur du väljer rätt metod utifrån det aktuella användningsfallet.

Varför kan ett företag inte bara förlita sig på generisk MT?

Företag uppnår vanligtvis önskade resultat när de använder MT till allmänt, enkelt innehåll från generiska, otränade maskinöversättningsmotorer, till exempel Google NMT, Bing NMT, Amazon, DeepL och Yandex. Men det finns också en risk att resultatet inte håller måttet.

Hur kommer det sig? En generisk maskinöversättningsmotor har ofta svårt att översätta högspecialiserat innehåll, till exempel inom Life Sciences eller juridik, och ord som används inom de här specifika områdena. Den kan inte räkna ut när den ska använda en viss, korrekt definition av ett ord som har två betydelser. Och den kan inte bevara din unika varumärkesröst eller avgöra när det passar bäst med ett formellt eller informellt språk för att få bra kontakt med din målgrupp.

MT-anpassning och MT-träning hanterar de här bristerna för att möjliggöra bättre översättningsresultat när du har specifika krav som de generiska motorerna inte kan tillgodose.

Vad är MT-anpassning?

MT-anpassning innebär att en befintlig maskinöversättningsmotor anpassas med hjälp av en ordlista och en lista med termer som inte ska översättas för att förbättra precisionen i de maskingenererade översättningarna. (En ordlista är en samling viktiga termer med översättningar, som ett företag har sammanställt. En lista med ord som inte ska översättas är en samling termer som ett företag vill behålla på källspråket.)

MT-anpassning görs genom att lägga in en lista med dessa källtermer med översättningar i motorn innan den utför sitt arbete. Listan ger MT-motorn instruktioner om hur termerna ska översättas – eller hindrar att de översätts alls. Genom ingreppet förbättras förslagen från motorn och företaget kan bibehålla sitt varumärkesnamn, följa terminologi och tillgodose regionala variationer. Ju bättre översättningarna är, desto mindre blir behovet av efterredigering.

MT-anpassning är vanligtvis enklare att utföra än MT-träning, även om det finns vissa fallgropar vid användning av metoden. Termer överförs till ett maskinöversättningssystem i en förhållandevis enkel process, men det kan vara svårt att välja rätt termer. Hur bra MT-anpassningen blir är i hög grad beroende av MT-expertens kompetens och förmåga att hantera normaliseringsregler för in- och utdata, listor med termer som inte ska översättas samt ordlistor. Alla dessa faktorer kan förbättra resultatet – om de hanteras på rätt sätt. Oerfarna skribenter kan oavsiktligt få MT-motorn att ge dåliga förslag och försämra hela översättningskvaliteten.

Vad är MT-träning?

MT-träning är en process för att bygga upp och träna en MT-motor genom att använda stora mängder tvåspråkiga data från textsamlingar och översättningsminnen (tidigare översättningar) i syfte att förbättra precisionen hos maskingenererade översättningar.

Träningen utförs genom att den generiska MT-motorn matas med en tvåspråkig textsamling (korpus) som är specifik för företaget. Motorn godtar indata via olika exporter, vanligtvis i ett översättningsminnesformat (TM). Översättningsminnet innehåller inte bara tidigare översatt och godkänt innehåll, utan även värdefulla, metaaktiga data som när meningen översattes, av vem och om det är en exakt träff eller en mindre exakt matchning. Med hjälp av dessa data kan motorn lära sig vad företaget förväntar sig av översättningen. I stället för att ge ett allmänt översättningsförslag baserat på vad den tror att källtexten ska översättas till, genererar motorn ett anpassat resultat baserat på korpusen.

Med hjälp av MT-träning kan ett företag finjustera resultatet för att skapa en specifik varumärkesröst eller stil, tack vare motorns förmåga att producera mer konsekventa översättningar. Det går att kringgå standardinställningarna i generiska MT-motorer som producerar innehåll med en formell ton, och i stället välja en informell ton. Precis som med MT-anpassning uppnår företaget önskat resultat med mindre efterredigering, eftersom motorn blir bättre på att generera korrekta översättningar med färre fel.

Under MT-träning förser företaget motorn med så mycket kunskap som möjligt, i form av segment med kvalitetsinnehåll som ger resultat av högre kvalitet. För att MT-träningen ska lyckas krävs att företaget tränar den med minst 15 000 unika, tvåspråkiga segment, som håller hög kvalitet och är fria från inkonsekvenser och flera översättningar av samma källinnehåll. Om företaget inte uppfyller minimikraven kommer träningen förmodligen inte att påverka resultatet på något avgörande sätt – eller över huvud taget.

Vad är det för skillnad på MT-anpassning och MT-träning?

Även om båda metoderna används för att förbättra MT-resultat och minska behovet av efterredigering, slutar likheterna där. De kan inte ersätta varandra.

Metoderna skiljer sig åt på följande sätt: Vid MT-anpassning skräddarsys en befintlig MT-motor genom att lägga till ordlistor och listor med ord som inte ska översättas. MT-träning handlar å andra sidan om att bygga och träna motorn från grunden med hjälp av stora mängder tvåspråkiga data från korpusar och översättningsminnen.

Anpassning är mer mångsidig än MT-träning och genererar förslag som uppfyller kraven hos de flesta företag. Anpassning görs till en engångskostnad för att uppdatera profilen som matas in i MT-motorn. Det tillkommer också vissa andra kostnader för att underhålla en ordlista över tid.

MT-träning är den mest lämpliga metoden för sofistikerade företag med högspecialiserat innehåll och komplexa användningsfall. När MT-träningen genomförs uppstår kostnader för den första träningen och eventuellt också kostnader för ytterligare träning som kan behövas längre fram om övervakningen av MT-resultatet tyder på att det finns utrymme för förbättringar.

A geographic pattern overlays a cityscape at night

När bör mitt företag överväga att använda MT-träning respektive MT-anpassning?

Behöver ditt företag översätta vetenskapligt material eller väldigt tekniska handböcker? Behöver du bevara er unika varumärkesröst? Svaren på dessa frågor kan visa om det är bäst att använda MT-anpassning eller MT-träning.

Då passar MT-anpassning bäst

Det finns två viktiga användningsfall för MT-anpassning. Använd det om du behöver uppnå följande:

  • Korrekt översättning av terminologi
  • Regionala varianter, t.ex. engelska (USA) respektive engelska (Storbritannien), men du har för lite data för att träna motorn

MT-anpassning är ett bra alternativ till tekniskt och detaljerat innehåll, eftersom det är väldigt viktigt att terminologi översätts på rätt sätt i den här sortens innehåll. MT-anpassning är den bästa metoden när du inte har tillräckligt med data för att MT-träning ska bli effektiv.

Då passar MT-träning bäst

Det finns två viktiga användningsfall för MT-träning. Använd det om du behöver uppnå följande:

  • En specifik varumärkesröst, ton eller stil och samtidigt vill minska behovet av efterredigering
  • Regionala varianter av ett målspråk, t.ex. franska (Schweiz) respektive franska (Frankrike) och har tillräckligt med data för att träna motorn

MT-träning är ett bra alternativ vid översättning av marknadsföring och kreativt innehåll, eftersom det ofta kräver en viss varumärkesröst, ton eller språklig stil. Däremot måste du se till att du har tillräckligt med data för att träna motorerna ordentligt.

En hybridmetod

Ibland kan en hybridmetod ge det bästa resultatet. Till exempel kan maskinöversättningen ge bättre förslag om företag kompletterar MT-träningen med viss anpassning.

Lionbridge kan enkelt hjälpa sina kunder att införa en hybridmetod. Kunderna kan anpassa sin maskinöversättning via Lionbridges MT-lösning för företag, Smart MT™ Portal. Samtidigt kan de välja att köpa professionella träningstjänster av Lionbridges duktiga team. Företag som samarbetar med de här teamen tar vanligtvis mer av ett helhetsgrepp om MT och brukar använda en kombination av MT-träning och MT-anpassning för att uppnå bästa möjliga resultat. Med hjälp av olika tester kan de bli bättre på att förstå vad som ger bäst resultat och utforma en skräddarsydd MT-metod.

MT-anpassning respektive MT-träning: Vilken strategi är bäst?

Vilken metod du ska välja för att förbättra dina MT-resultat beror på situationen. När du undersöker olika alternativ kan det vara lockande att se MT-träning som den första och enda metoden för att få ut mesta möjliga av din maskinöversättning. Eller så blir du kanske fascinerad av hajpen kring kontinuerlig träning. Här är några saker att tänka på när du undersöker olika alternativ.

Undvik fallgrop 1: När MT-träning säljs in som den enda lösningen

MT-träning kan vara ett otroligt effektivt verktyg för att förbättra MT-resultatet, men bara när den löser identifierade och utvalda problem.

När användningen av maskinöversättning ökar har många leverantörer använt MT-träning som standardlösning för att försöka erbjuda sina kunder ett mervärde. Men i vissa fall kan den här metoden slå slint. Vissa företag som enbart har använt träning i förhoppning om att det ska ge bättre MT-resultat har senare använt Lionbridges tjänster och uttryckt besvikelse över träningen efter att ha gjort en analys av kostnader och fördelar. De tyckte inte att motorns genererade förslag var någon kostnadseffektiv lösning. Varför var de missnöjda? Kort sagt fanns det bättre metoder att ta till utifrån just deras omständigheter.

Innovativa MT-leverantörer, som Lionbridge, använder MT-träning där så är lämpligt, men förlitar sig i hög grad på anpassning för att uppnå önskade MT-resultat – till en lägre kostnad än MT-träning.

Undvik fallgrop 2: Hajpen kring kontinuerlig träning under MT-träning

När du undersöker olika MT-lösningar hittar du kanske leverantörer som föreslår kontinuerlig träning av motorer efter att enskilda projekt har slutförts. Det är bäst att ta sådana påståenden med en nypa salt. Kontinuerlig träning är bara möjlig om du arbetar med skräddarsydda motorer som hela tiden behöver uppdateras.

Vi vill understryka att MT-träningen bara lyckas om du i ett enskilt projekt har minst 15 000 unika segment som kan användas för att träna motorn. När företag inte har tillräckligt mycket data använder de ibland projektinnehåll för att uppdatera anpassningsfunktioner och kallar det då i många fall för ”träning”.

Sammanfattning

Anpassning är ett mer mångsidigt verktyg än MT-träning. Den genererar MT-förslag som uppfyller behoven hos de flesta företag. Med anpassning kan du förbättra MT-förslag tillräckligt mycket för att bevara ditt varumärkesnamn och följa terminologi. På så sätt behöver efterredigeraren inte lägga lika mycket tid på att kontrollera dem. En engångskostnad för att uppdatera profilen som läggs in i MT-motorn och vissa löpande kostnader för att underhålla en ordlista över tid kostar vanligtvis mindre än MT-träning.

A geographic pattern overlays a cityscape at night

Vilka metoder passar bäst vid MT-anpassning?

Vid MT-anpassning ska du vara noga med att använda de bästa metoderna.

Normaliseringsregler för in- och utdata

Skapa ett bibliotek med normaliseringsregler för in- och utdata för de språk som används mest. På så sätt kan du styra indata till MT och förbättra resultaten. Med hjälp av reglerna kan du enklare uppfylla specifika krav.

En normaliseringsregel för indata kan till exempel instruera MT-motorn att använda dubbla vinkelcitattecken [« … »] i stället för dubbla citattecken [“...”]  i översättningar till franska. Den här regeln förbättrar resultatet vid översättning till franska, eftersom fransktalande läsare förväntar sig dubbla vinkelcitattecken i stället för dubbla citattecken. Företag kan tillämpa normaliseringsregler för in- och utdata för att möjliggöra liknande ändringar utifrån regionala språkvarianter av ett moderspråk, exempelvis franska (Belgien), franska (Kanada), franska (Afrika) och så vidare.

Regler och listor med ord som inte ska översättas

Skapa en lista med termer som du inte vill ska översättas och en regel som ersätter alla identifierade termer som inte ska översättas med en token innan innehållet skickas till motorn. På så sätt blir termen osynlig för motorn och du förhindrar att den blir översatt. När översättningen är utförd och MT-förslaget kommer tillbaka, kan du använda en normaliseringsregel för att ersätta token med termen som inte ska översättas.

Sammanställa en ordlista

Sammanställ noggrant en ordlista för att se till att översättningarna blir korrekta och konsekventa. Tänk på de viktiga faktorerna i tabell 1 för att avgöra om en term ska stå med i ordlistan eller inte.

Allmänna riktlinjer när du sammanställer en ordlista

Att betänka Frågeställning Bör termen stå med i ordlistan?*
Frekvens Hur ofta förekommer termen i källtexten? Om termen förekommer sällan, ta inte med den.
Tvetydighet Har termen flera betydelser eller kan den lätt förväxlas med andra ord? Om termen är tvetydig ska du ta med den. (Obs! Kontrollera att olika betydelser av termen är sällsynta i källtexten.)
Specialiserad terminologi Är termen specifik för ett visst område eller ämnesområde? Om ja, ta med den.
Konsekvens Har termen översatts konsekvent förut? Om ja, ta inte med den.
Betydelse Hur viktig är termen för textens övergripande betydelse? Om den är central för textens betydelse, ta med den.
Komplexitet Är termen komplicerad och kommer det bli svårt för maskinöversättningssystemet att översätta den korrekt? Om ja, ta med den.

Tabell 1. Faktorer att ta hänsyn till när du skapar en ordlista.

* Det kan finnas undantag till de här allmänna riktlinjerna.

Rätt och fel

Vi rekommenderar också att du utgår från följande lista med vad som är rätt och fel när du skapar en ordlista:

  • Fel: Ta inte med allmänna termer, som enstaka ord, verb och adjektiv. Det fungerar inte bra med MT och kan påverka den allmänna kvaliteten negativt, liksom meningsbyggnad, kongruens och ordföljd
  • Fel: Dela inte upp långa termer
  • Fel: Ta inte med motstridiga termer
  • Fel: Ta inte med termer som är dubbletter
  • Rätt: Använd bara en termpost per källspråk
  • Rätt: Ta med termfraser
  • Rätt: Ta med specifika produktnamn
  • Rätt: Ta med termer som inte ska översättas

Hur arbetar Lionbridge med MT-anpassning och MT-träning?

Med Lionbridges Smart MT-portal kan våra kunder enkelt börja använda MT-anpassning och tack vare vår teknik kan anpassningen tillämpas på flera MT-motorer samtidigt. Du sammanställer dina MT-ordlistor och listor med ord som inte ska översättas och lägger in dem i systemet. Sedan används de i samtliga MT-motorer. Med hjälp av den här tekniken undviker du att bli låst till en viss motor och kan varje gång välja den motor som ger bäst resultat.

Dessutom är det enkelt att komplettera vår MT-teknik med relevanta tjänster från våra MT-experter. När företag anlitar oss hjälper vi dem att hitta den mest effektiva MT-strategin och välja hur den bäst kan genomföras.

Vi har en lösning som tillgodoser dina behov, oavsett om du precis har börjat undersöka maskinöversättningens möjligheter, vill förbättra MT-användningen genom anpassning eller har insett att MT-träning är en lämplig metod på grund av att ditt företag skapar allt mer innehåll.

Vad är det för skillnad på MT-träning och MT-anpassning?

Jämför enkelt MT-träning och MT-anpassning i tabell 2, där du kan se vilken metod som lämpar sig bäst för ditt innehåll.

Anpassning och träning av maskinöversättning

  MT-anpassning MT-träning
Vad är det och hur fungerar det? Anpassning innebär att en befintlig maskinöversättningsmotor anpassas med hjälp av en ordlista och en lista med termer som inte ska översättas för att förbättra precisionen i maskingenererade översättningar En MT-motor byggs och tränas genom att använda stora mängder tvåspråkiga data från korpusar och översättningsminnen (TM) i syfte att förbättra precisionen hos maskingenererade översättningar
Vad gör den? Den förbättrar MT-motorns förslag för att ge mer korrekta resultat och minska behovet av efterredigering Den förbättrar MT-motorns förslag för att ge mer korrekta resultat och minska behovet av efterredigering
Specifika fördelar Ger företag möjlighet att bevara sitt varumärkesnamn och sin terminologi och skapa regionala varianter Ger företag möjlighet att utforma en specifik varumärkesröst, ton och stil och skapa regionala varianter
Risken med att använda det Om den inte utförs på rätt sätt kan MT-motorn ge dåliga förslag och försämra hela översättningskvaliteten Om det inte finns tillräckligt med kvalitetsdata för att träna motorn kan MT-träningen misslyckas med att förbättra resultatet. MT-motorn kan ge dåliga förslag och försämra hela översättningskvaliteten om oerfarna författare överanvänder terminologi
När ska det användas? Perfekt till tekniskt och detaljerat innehåll och innehåll som kräver:
* Korrekt översatt terminologi
* Regionala varianter, men du inte har tillräckligt med data för att utföra MT-träning
Perfekt till högspecialiserat innehåll, marknadsföring och kreativt innehåll och allt innehåll som kräver:
* En specifik varumärkesröst, ton eller stil
* Regionala varianter och om du har tillräckligt med data för att utföra MT-träning
Framgångsfaktorer En erfaren MT-expert som kompetent kan hantera normaliseringsregler för in- och utdata, ordlistor och listor med ord som inte ska översättas Minst 15 000 unika segment för tillräcklig träning av motorn
Kostnadsaspekter Det uppstår en engångskostnad för att uppdatera profilen som läggs in i MT-motorn och vissa löpande kostnader för att underhålla en ordlista över tid. Kostnaden är dock förhållandevis låg sett till potentiella fördelar och är vanligtvis lägre än för MT-träning Det uppstår kostnader för den första träningen och eventuellt också kostnader för ytterligare träning som kan behövas längre fram om övervakningen av MT-resultat tyder på att det finns utrymme för förbättringar. MT-träning kan vara väl investerade pengar i vissa fall när de potentiella fördelarna är tillräckligt stora

Tabell 2. Jämförelse av MT-anpassning och MT-träning

Hör gärna av dig!

Om du vill veta mer om hur vi kan hjälpa dig att få ut mesta möjliga av maskinöversättning, kontakta oss i dag.

linkedin sharing button

Thomas McCarthy med Janette Mandell
FÖRFATTARE
Thomas McCarthy med Janette Mandell
  • #ai
  • #blog_posts
  • #translation_localization