谷歌宣布实现人与AI的全双工语音通话 但微软两年前就干过
- +1 你赞过了
【天极网网络频道】5月8日,2018谷歌I/O开发者大会在加州山景城拉开帷幕。作为一家科技巨头,谷歌今年带来了AI、Android P、谷歌地图、谷歌相册、谷歌邮箱以及无人驾驶汽车Waymo。
值得一提的是,谷歌披露了谷歌助手的新功能Duplex,你可以要求谷歌助手代你打电话。在大会上,谷歌现场展示了人类与人工智能的Full Duplex电话。可以说,这意味着人工智能语音方面的重大进步。
于是,这被一些媒体称为人类历史上第一次与人工智能的Full Duplex。
很快,微软(亚洲)互联网工程院发布声明:今年4月4日,我们正式在美国和中国发布了Full Duplex感官,并预言行业将意识到这一技术的价值,加快向这一方向集中。
同时,声明称,“其实,人类历史上第一次与人工智能进行全双工语音电话,并不是发生在美国,而是发生在中国。我们很荣幸能将这一桂冠奉献给祖国。自2016年8月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,已让小冰与人类用户累计完成了超过60万通电话。”
谷歌在I/O大会上演示的事,国内的微软小冰两年前已经干过。
那么,全双工语音技术到底是啥?3月22日,微软宣布推出新一代语音交互技术:全双工语音交互感官(Full-duplex Voice Sense),并且完成产品化落地——小冰。
根据官方介绍,与既有的单轮或多轮连续语音识别不同,全双工技术可以实时预测人类即将说出的内容,实时生成回应并控制对话节奏,从而让长程语音交互成为可能。
在使用时,用户不必多次说出唤醒词,一次唤醒,即可轻松实现连续对话。这大大提高和改善了用户体验,并且把语音交互的自然度推进到新层次。
实际上,全双工技术的出现,代表着语音交互的新阶段。
据微软(亚洲)互联网工程院副院长、微软小冰全球负责人李笛表示,语音交互底层有两种框架,第一种是Turn-oriented,以Facebook的M、苹果Siri、亚马逊Alexa、微软小娜为代表;第二种是Session-oriented,以微软小冰为代表。用中文来解释两种框架,第一种就是面向单个任务,第二种称之为面向对话全程。
可以看到,全双工语音技术(Full Duplex)的意义在于,它能够使“人机交互”进化为“人机交流”!
附:微软声明
最新资讯
热门视频
新品评测