本篇文章2309字,读完约6分钟
苹果公司最近宣布,它已经收购了英国人工智能语音技术公司。虽然具体收购价格尚未公布,但业内人士表示,此次收购可能有助于苹果改进其虚拟语音助手siri,并有望进一步推动苹果的汽车项目。
近年来,尼桑、凯迪拉克和其他汽车公司已经探索了后视镜的智能,并依靠声音来操作它们。这些智能语音解决方案是大讯叶巍和科达讯飞深度合作的产物。在热门的智能家居市场中,基于语音交互的人机交互模式逐渐成为一种标准的功能配置。
继人机交互之后,语音交互领域成为智能领域的又一个入口,被各大巨头抢占。
巨人继续投资
元音起源于剑桥大学的对话系统小组,专注于自然语言理解。它使用深度学习来提高语言识别能力,试图在《钢铁侠》中创造贾维斯,在《她》中创造萨曼莎。因此,声乐学技术可以改进一系列虚拟语音助手,如siri、google now、cortana和alexa。
目前,苹果的siri和其他语音助手主要依靠脚本对话来回应具体指令。然而,有了发声技术,用户可以用对话的方式与设备互动,而不是用设备能理解的暗示性语言。苹果收购声乐家显然可以通过这项技术提高siri。
更重要的是,收购元音也能促进苹果汽车项目的发展。据报道,今年年初,声乐学在官方博客中说,“车内语音对话系统”可以防止司机在开车时因为看窗外的风景而分心。早些时候,声乐学和通用汽车联合开发了一个汽车语音识别项目。
事实上,声乐家是苹果“进入”汽车市场收购的第二家公司。今年9月,苹果公司以2500万美元收购了地图可视化公司mapsense。它的主要业务是创建分析和可视化位置数据的工具。例如,与苹果的siri和微软的cortana越来越人性化的反应不同,谷歌现在的“ok,google”语言搜索引擎一直专注于更准确地分析用户的词汇。谷歌最近在其官方博客中向我们解释了应用于其语言搜索功能的最新算法,该算法可以通过预测用户的音素来提高准确性。
巨人在智能语音领域花了很多钱。从语音智能生态系统的角度来看,主要有三个领域:基于nuance的苹果siri和三星s-voice、谷歌android的谷歌now和微软windows phone的cortana。
争夺新的智能入口
老大哥的布局是竞争情报领域的另一个入口。近年来,科技创新带来了人机交互终端智能化程度的不断提高,使得传统的交互方式难以满足用户全方位的需求。基于语音交互的第三代人际交互模式,包括图像和身体感觉,正在发挥越来越重要的作用。
然而,智能语音技术的技术壁垒很高,这就要求企业在统计学、声学、语言学、计算机科学等领域具有较强的综合实力。同时,智能语音技术的研究周期长,投资大。例如,ibm已经研究和开发语音技术将近30年了。在全球范围内,只有少数制造商在语音市场上具有很强的竞争力,包括跨国it公司如nuance、ibm、微软和谷歌。国内语音技术市场正处于市场引入期。
目前,智能语音还不够智能,准确率低、网络依赖等一系列问题仍然在很大程度上影响着用户的语音交互体验。当你输入语音时,你必须说清楚。显然,这有较高的识别率,但当人们相互交流时就不是这样了。有时他们说话很快,有时他们的声音很低。同时,在噪音和方言的情况下,识别率将会显著降低。
同时,智力水平不高,更难理解和思考。目前,语音技术很难实现对语义的深入理解。只有平台的语音识别模块被移植到软件中,没有解决语音识别后如何将内容“翻译”成机器理解的指令的问题。如果这个问题得不到解决,语音技术只能发挥听写引擎的作用。
幸运的是,目前语音技术的应用范围正在扩大,衍生出一系列对语音交互有严格要求的场景。例如,以可穿戴设备和便携式终端交互为代表的小型化;远程、大屏幕终端交互,如智能电视、智能家居、消费机器人(报价300024,咨询)等。;手不方便使用的场景中的人机交互,如汽车。也就是说,应用程序将技术进步推向了相反的方向。
该行业即将进入一个爆炸性时期
因为智能可穿戴设备的屏幕一般不会太大,即使没有触摸屏,也有必要用语音来控制更方便的人机交互。例如,可穿戴设备的先驱谷歌眼镜就配备了智能语音系统。用户可以通过说fiok glassfl开始一个智能对话,然后通过语音得到通知和提醒。在网络环境中,他们可以通过语音向他人发送短信。此外,索尼发布的swr30语音手环和世界首款中国智能手表操作系统moto 360智能手表都将语音互动作为卖点。随着未来可穿戴设备的普及率不断提高,语音交互的应用领域将不断扩大。
大屏幕领域的应用主要集中在智能电视上,包括康佳、长虹、tcl、lg、乐视等。,所有这些都配备了非常强大的语音交互功能,可以实现各种实用功能,如查看影视剧、听歌、发送微博、通过语音输入打开和关闭电视。在智能家居中,也需要携带语音解决方案,例如苹果公司发布的智能家居工具包,它也采用了与siri合作的方式。用户可以用自然的句子发出各种命令,比如“关上我的前门”和“打开厨房的灯”。Siri还可以告诉用户家中物品的状态,并回答诸如“我的车库开门了吗?”这样的问题。未来国内消费者崛起后,语音技术将面临更大的市场。
汽车领域是另一个争论的焦点。由于在驾驶汽车的过程中使用按键或触摸容易造成安全问题,所有主要的汽车制造商都在前端装载控制系统中配备了语音控制方案。
分析人士指出,语音技术的改进与其商业价值的释放并没有表现出完全的线性关系。虽然语音技术的发展已经走过了几十年,但是还没有突破大规模商业使用的节点,所以目前的市场规模仍然停留在十亿左右。近年来,随着技术的不断沉淀和语音交互场景的不断扩大,也预示着语音的商业价值得到了显著提升,语音产业的发展即将进入爆发期。