Microsoft demonstrerer engelsk-til-kinesisk universell oversetter som holder stemmen din og aksenten

En Star Trek universell oversetter

Under et arrangement i Kina har Microsoft Research-sjef Rick Rashid demonstrert en sanntids engelsk-til-mandarin-tale-til-tale-oversettelsesmotor. Ikke bare er oversettelsen veldig nøyaktig, men programvaren bevarer også brukerens aksent og intonasjon. Vi snakker ikke bare om en digitalisert, robotoversetter her - dette ligger helt innenfor Doctor Who eller Star Trek universell oversettelse.

Den beste måten å sette pris på denne teknologien er å se videoen nedenfor. De første seks minuttene forklarer Rick Rashid de grunnleggende vanskeligheter med datamaskinoversettelse, og de siste minuttene demonstrerer faktisk programvarens engelsk-til-mandarin-tale-til-tale-oversettelsesmotor. Dessverre snakker jeg ikke kinesisk, så jeg kan ikke bevitne at oversettelsen er sann, men publikum - rundt 2000 kinesiske studenter - virker ganske imponert. En profesjonell engelsk / kinesisk tolk bemerket meg også at datamaskinoversettelsen er overraskende god; ikke helt opp til nivået for menneskelig oversettelse, men det nærmer seg.





Det er selvfølgelig mye teknologisk trolldom som skjer bak kulissene. Til å begynne med må programvaren trenes - både med noen få timer med innfødt, muntlig kinesisk og en time med Rick Rashids talte engelsk. Fra dette deler programvaren i hovedsak talen din ned i de minste komponentene (fonemer), og deretter muses dem sammen med den kinesiske ekvivalenten, og skaper et stort kart over engelsk til mandarinlyder. Så, under selve presentasjonen på scenen, konverterer programvaren talen til tekst (som du ser på venstre skjerm), teksten til mandarin-tekst (høyre skjerm), og deretter Rashid / kinesisk mash-up opprettet under treningen prosessen brukes til å gjøre teksten til talte ord.

Sluttresultatet har definitivt et sterkt hint av digitalisert, robotisk Microsoft Sam, men det er overraskende hvor mye av Rashids aksent, klang og intonasjon som er bevart.



Når det gjelder nøyaktighet, sier Microsoft at hele systemet har en feilrate på omtrent ett ord på åtte - en forbedring på 30% sammenlignet med det forrige best av ett ord på fem. En slik dramatisk forbedring ble muliggjort av bruken av Deep Neural Networks , en maskinlæringsteknikk utviklet av Geoffrey Hinton fra University of Toronto. Et dypt nevralt nettverk er i utgangspunktet et kunstig nevralt nettverk (programvare som modellerer tusenvis av sammenkoblede 'nevroner'), men med noen tilpasninger slik at den mer etterligner oppførselen til den menneskelige hjerne.

Fremover er det store spørsmålet når Microsoft Researchs tale-til-tale-oversettelsesprogramvare faktisk vil finne veien til markedet - og ja, hvis du lurte på, er programvaren ikke bare begrenset til engelsk og kinesisk; alle de 26 språkene som støttes av Microsoft Speech Platform, kan brukes, inkludert mandarin-til-engelsk. Den mest åpenbare brukssaken ville være på din Windows Phone 8 (eller 9?) Smarttelefon eller Skype: Du kan ringe et selskap i Kina eller Tyskland eller Brasil, snakke normalt på engelsk, og de vil høre stemmen din på sitt lokale språk. . Du kan også bruke smarttelefonen din som en universell oversetter mens du reiser. Som du kan se nedenfor, lekte Microsoft med telefon-til-telefon-oversettelse i sanntid helt tilbake i 2010:

Antagelig jobber Microsoft med slike applikasjoner - men det blir sannsynligvis holdt tilbake av praktiske hensyn, som prosesseringskraften som kreves for å gjøre tale-til-tale-oversettelse, eller gir et brukervennlig grensesnitt for opplærings- / læringsprosessen. Opplæringsprosessen i seg selv kan kreve mer prosessorkraft enn en hjemmebruker også kan tilby. Det er imidlertid alltid skyen!

Copyright © Alle Rettigheter Reservert | 2007es.com