总之和你看到的演示视频不太一样
前两天,微软Skype Translator进行公开试用,Windows 8.1和Windows10内测用户不需要申请就可以在应用商店下载试用。
于是在办公室,我们找到了两台运行Windows 8.1系统的电脑,并装上Skype Translator预览版进行测试(Windows 10测试版下载后无法打开,一直在转圈圈)。
然而,从最终的结果看来,Skype Translator的实时翻译没有演示视频那么令人惊艳,效果也远远没达到我们的预期。但Skype将语音识别、文字翻译和语音合成三个步骤进行压缩所达到的“实时”效果,对跨语言沟通意义非凡,微软在产品的打磨上仍然需要时间,毕竟这还牵涉到机器学习的问题。
在应用商店安装、打开应用后,通话对象的头像下面会有一个翻译的按钮,打开后便可以设置双方的语言。
在进行语音/视频对话时,翻译文本会实时呈现在右侧的对话框内,然后语音播放,就和同声传译一样。此外,Skype Translator会把整个对话内容记录下来,用于机器学习以不断提高语音识别和文本翻译的质量。
首先我们使用了新概念教材朗读、雷军媒体见面的录音进行测试,由于Skype Translator对一大段话的识别效果太差,后来我们采取了播一句,按一次暂停的办法。准确性的结果如下(括号内为最终翻译出来的英文):
雷军采访:雷军:排得太长的了呢,我们团队都疏导了,就说你们还是在网上买。
Skype:还在网上买(Buy it on the Internet.)
雷军:那么在小米网预约的人呢也超过了100万人。
Skype:超过了1000000.(More than 1000000.)
雷军:所以呢我觉得作为顶配的首发第一站来看的话,我觉得这个结果超出我想象。
Skype:我觉得作为.(I think, as.)
其实我们也试了Are you OK?但完全没法识别。
新概念:
新概念:Did the detective saved the diamond?
Skype:To look at this PRoblem(给看我这只笔问题)
新概念:The plane was late, and the detective were waiting at the airport all morning.
Skype:Call caofeidian game called my friends(打给曹妃甸赛打给我的网友)
新概念:A few hours earlier, someone had told the police that the thieves were try to steal the diamond.
Skype:Phone card shopping mall(手机卡商场)
从目前的翻译结果来看,SkypeTranslator语音识别的准确性不稳定。我和同事的日常对话也很难正常记录,基本上语速稍快就会丢字。
即便是识别率较高的中文,也会闹出一些笑话,例如在我与另一位作者的日常对话中,“不在办公室”,却识别成了“我在办公室”,所以一字一句地发音,识别的准确性就会显著提高,截图最后一句话充分表达了我的心情——几乎是崩溃的,:)。
假如你两种语言夹杂着用,它依然会按照之前设置的“使用语言”进行识别,即使你说的是中文,它也会以为你讲的是英语,识别结果自然大相径庭。
经过各种测试之后,我们得出Skype Translator预览版的大致效果如下:
短句子>长句子
环境安静>环境嘈杂
中文识别>英文识别
文本对话>视频语音对话
尽管测试结果不是特别让人满意,但毕竟它还只是个预览版。Google说现在的语音识别准确性已经可以达到92%,所以测试中出现的语音识别问题从技术上来说问题不大,而且相比普遍配有两三个麦克风过滤噪音的智能手机,电脑的效果也差得多。也许我们可以期待一下移动版的效果。
但即便解决了识别,以今天Bing翻译、Google翻译的水平,谈笑风生怕是也有点难。
新闻热点
疑难解答