То, что показали исследователи из тамошней лаборатории, – первый прототип, но он уже работает. Система изучает, как звучит голос пользователя, а затем воссоздаёт именно его звук при синтезе речи. Понятно, что некоторые интонации и паузы между словами, которые она делает, с потрохами выдают в ней машинный разум. Но в целом – и специалисты это подтвердили – даже в этом случае сохраняются особенности речи пользователя, а это облегчает понимание сказанных им слов для другого человека. Именно поэтому первое место, где надеются найти применение своей разработке исследователи Microsoft – это специальные устройства для автоматического перевода, которые очень оценят путешественники. Ведь не секрет, что во многих странах далеко не всякий встречный сносно владеет английским, в то же время большинству приезжих недоступно местное наречие. А уж сколько на свете так называемых "одноязычных туристов"… Другая сфера применения разработки – изучение иностранных языков. По мнению исследователей, образцы иностранной речи, которые пользователь слышит в исполнении собственного голоса, делают проще повторение фраз, заучивание слов и прочие процессы обучения. Наконец, в странах, где много мигрантов, не знающих местного языка, для общения с ними технологию могут использовать официальные лица, врачи, да кто угодно, собственно.
Проект реализован в пекинском отделении Microsoft. В своём теперешнем состоянии система тратит час на то, чтобы изучить голос пользователя и построить его модель для последующего синтеза речи. Она понимает 26 языков и может, как сказано, осуществлять преобразование между двумя любыми из них. Качество перевода, конечно, не самое высокое, но простые фразы из туристического лексикона уже удаются ей очень неплохо.