Neural maskinöversättning: så här fungerar artificiell intelligens vid översättning

Senast uppdaterad: 2017-02-17 17:43

Som de flesta i marknadsföringsbranschen vet har de stora datamängderna revolutionerat hur företagen arbetar med drifteffektivitet och innovation – och det kommer bara att fortsätta. Experter förutspår att datamängderna kommer att fortsätta öka med 40 procent från år till år.

Allteftersom företagen hittar effektiva sätt att använda data på har de naturligtvis ställts inför utmaningar när det gäller att hantera överbelastning av information. Men stora datamängder ger också stora möjligheter – varav en är att göra ett företag globalt genom lokalisering.

Tillsammans med enorma ökningar av datamängder finns det två andra faktorer som skapar en förändring i lokaliseringsbranschen. För det första är det den exponentiella tillväxten av datorkraft och för det andra, ökat intresset för så kallad djupinlärning, en typ av maskininlärning som används av Google i dess bild- och röstigenkänningsalgoritmer.

Med tanke på dessa faktorer är det ingen överraskning att djupinlärning nyligen rörde om i översättning och lokalisering och skapade det vi nu känner till som neural maskinöversättning (NMT). När allt kommer omkring ökar ju även det översättningsbara materialet när datavolymerna ökar och teknikutvecklingen går framåt. Men vad exakt är NMT och hur ökar det lokaliseringseffektiviteten?

I ett webbinarium nyligen diskuterade Lionbridges Director of Machine Translation, Jay Marciano, tillämpningen av den här nya och mer precisa översättningsmetoden och hur den har lett till framsteg i branschen.

Så fungerar neural maskinöversättning

Neural maskinöversättning är en relativt ny gren, som först utforskades i slutet av 2014. Innan dess fungerade maskinöversättning enligt en statistisk modell där maskininlärning förlitar sig på en databas med tidigare översättningar, så kallade översättningsminnen.

Även om NMT fortfarande tränar på översättningsminnen så som statistisk maskinöversättning gör, använder den också djupinlärning – och möjligen en högre volym träningsdata – för att bygga ett artificiellt neuralt nätverk.

Marciano använder sig av ett schackspel för att illustrera hur statistisk maskinöversättning fungerar. I ett schackprogram finns det en begränsad värld där ett begränsat antal drag kan göras. Programmet beräknar helt enkelt alla möjliga drag för att hitta det bästa. På samma sätt fungerar maskininlärningen som sker i ett SMT-system genom att jämföra n-gram – eller grupperingar om sex ord i en mening – från en källmening med de som förekommer på målspråket för att hitta korrelationer.

Å andra sidan kan neural maskinöversättning beskrivas som att ”uppfostra” ett neuralt system, vilket Marciano förklarar. Det är som att spela piano; när du gör ett misstag backar du, försöker igen och övar tills du sätter det. System för neural maskinöversättning försöker hitta vägen genom neurala nätverk på samma sätt.

I denna mening är neural maskinöversättning mycket effektivare än den begränsade och ofta felaktiga n-gram-baserade modellen. Till att börja med körs NMT-system på kraftfulla grafikprocessorer (GPU:er) snarare än centrala processorer (CPU:er) som SMT-system gör. Och även om neural maskinöversättning tar längre tid för att översätta en mening på grund av den stora datamängd som är inblandad – och SMT-systemen tog mycket längre tid än äldre regelbaserade system – uppvisar statistisk maskinöversättning stora problem med språk där reglerna förekommer utanför sexordsenheten.

Naturligtvis stöter NMT fortfarande på en del problem, till exempel när man översätter mycket tekniskt innehåll. Men källmaterial som innehåller okända tekniska förkortningar skulle inte översättas bra av något maskinöversättningssystem, inklusive neural maskinöversättning. För språkriktningar som inte har så mycket träningsdata – till exempel tyska till koreanska – öppnar djupinlärning upp möjligheten att använda indirekta eller ”pivoterade” träningsdata från källmaterialet för ett annat språk.

Den största skillnaden mellan NMT och SMT? När du presenterar utbildningsmaterial för djupinlärningsalgoritmerna talar du inte nödvändigtvis om vad de ska leta efter. Du låter systemet hitta mönster själv, till exempel kontextuella ledtrådar kring källmeningen. Processens detaljer förblir dock mystiska på många sätt.

Neural MT och stora datamängder: isolera begränsade förmågor

Neurala nätverk användes först i bild- och taligenkänningsprogram, genom träningssystem med övervakad data – till exempel en bild av en hund med bifogade metadata. När systemet läser dessa metadata skulle det kunna identifiera bildens innehåll som en hund.

Sedan skulle systemet försöka hitta det bästa sättet genom det neurala nätverket för att göra den kopplingen, få stöd för den och hitta bättre vägar om det kommer fram till fel svar och så småningom utveckla en neural väg som resulterar i rätt svar. Detta är den väg som skulle betonas framöver.

För taligenkänning finns det för en given inspelad mening på ett visst språk vanligtvis bara en korrekt transkribering som hittas i djupinlärningen, vilket gör träningen ganska enkel. Översättning involverar ”brusigare” träningsmaterial och är en mer komplex uppgift.

Ändå tillåter djupinlärning och stora datamängder oss att kasta bort våra begränsade förmågor att uppfatta och analysera världen, beskriver Marciano. Eftersom stora datamängder ger så mycket information kan vi identifiera komplicerade mönster och föreningar mellan dessa mönster på ett sätt som går bortom den mänskliga förmågan att känna igen.

Men det är svårt att bygga en mental bild av NMT-processen. Mycket av bearbetningen sker i dolda lager med komplicerade data, vilket betyder att det är svårt att se hur det neurala nätverket fattar sina beslut.

Därför kan vi bara presentera träningsmaterialet, låta algoritmerna göra sitt och justera träningsmaterialet om översättningarna inte är korrekta. Lionbridge använder GeoFluent för att rensa upp fel i NMT-resultaten.

Att använda metoder för kvalitetsutvärdering, som BLEU, blir en gråzon. Om ett NMT-system väljer en översättning som av okänd orsak skiljer sig åt från referensöversättningen, kan det straffas för sitt val av ordförråd – även om det är helt korrekt.

Framtiden för neurala nätverk och kommunikation

Även om det är knepigt att felsöka ett neuralt nätverk och förstå dess beslutsfattande, är förbättringen av flytet i språket som vi ser från NMT tillräckligt uppmuntrande för att det ska vara något att ta i beaktande. Så, finns det andra maskinöversättningsleverantörer som tillhandahåller NMT nu?

Det korta svaret är nej. Det finns tre system för neural maskinöversättning som du just nu kan prova på internet: Google Translate (som kan integreras i CAT-verktyg), Microsoft Translator och Systran Pure Neural Machine Translation. Vi är dock fortfarande väl förberedda när det gäller produktionsklara system som har kompletta träningsverktygssatser. Håll utkik efter meddelanden om kommande NMT-system i år från Microsoft, Google, Systran, Baidu, Facebook, Amazon och andra.

NMT-utrullningen kommer att ske först på de språk som visar den största förbättringen jämfört med SMT-systemen. På Lionbridge planerar vi att utvärdera tillgängliga system för neural maskinöversättning för att se till att dessa verktyg passar in i våra lokaliseringsprocesser och uppfyller våra kunders behov innan vi själva rullar ut verktyget. Besök vår sida för tankeledarskap om maskinöversättning för de senaste trenderna inom maskinöversättning.

Men en sak är säker, neural maskinöversättning är ett avgörande framsteg. Med tanke på hur ung den här modellen är har förbättringarna i översättningen varit enorma jämfört med de senaste tio åren. Skillnaden mellan traditionell översättning och maskinöversättning kommer att fortsätta minska – och vi tänker ta reda på hur långt det kan nå.

Vill du veta mer om fördelarna med neural maskinöversättning och våra förväntningar på framtiden för maskininlärning, kan du se hela webbinariet: Neural maskinöversättning: vad är det och hur påverkar det översättningseffektiviteten

#blog_posts
#translation_localization

FÖRFATTARE

Lionbridge

VAD VI GÖR

BRANSCHER

RESURSER

OM OSS

Neural maskinöversättning: så här fungerar artificiell intelligens vid översättning

Så fungerar neural maskinöversättning

Neural MT och stora datamängder: isolera begränsade förmågor

Framtiden för neurala nätverk och kommunikation

LANGUAGE CLOUD™

BRANSCHER