办事指南

AI已经学会了如何从人群中挑出一个声音

点击量:   时间:2017-08-02 13:14:01

Christopher Anderson / Magnum照片作者:Richard Gray像亚马逊的Echo和Google Home这样的设备通常可以处理来自单独一个人的请求,但是像我们一样,他们在诸如嘈杂的鸡尾酒会等情况下挣扎,有几个人同时说话现在,一个能够实时分离多个扬声器声音的人工智能有望为自动语音识别提供一个很大的推动力,很快就可以进入你附近的电梯该技术由马萨诸塞州剑桥市三菱电机研究实验室的研究人员开发,这是本月在东京举行的先进技术联合展览会上首次公开展示它使用机器学习技术,团队称之为“深度聚类”,以识别多个扬声器的“声纹”中的独特功能然后它将每个说话者的声音中的不同特征组合在一起,使其能够解开多个声音,然后重建每个人所说的内容三菱电机的发言人Niels Meinke说:“它使用了100个英语使用者进行了培训,但即使说话者是日语,它也可以分离声音” Meinke表示,该系统可以分离和重建两个人对单个麦克风讲话的语音,准确率高达90%如果有三个扬声器,准确度下降,但仍然高达80%在这两种情况下,这都是系统从未遇到的扬声器解决这个问题的常规方法 - 例如使用两个麦克风来复制听众耳朵的位置 - 只能达到51%的准确率在克服几十年来困扰人工智能研究的“鸡尾酒派对效应”中,新技术可以帮助家庭和汽车中的智能助手更好地工作它还可以改善自动语音转录,并用于帮助执法机构重建音乐混乱的对话录音在初步测试中,系统能够同时分离多达五个人的声音 “该系统可用于分离各种产品的语音,包括升降机,空调机组和家用产品,”Meinke说实际上,三菱目前正在将其语音识别技术构建到升降机和空调等产品中参考:arxiv.org/abs/1508.04306有关这些主题的更多信息: