麦肯锡《人工智能,下一个数字前沿》报告中,不意外地,语音领域被麦肯锡重点划线了。
报告估计2016年,AI的年度外部投资总额在80亿美金到120亿美金之间,其中机器学习占了近60%的投资。机器人和语音识别是两个最受欢迎的投资领域,投资占比如图所示。此外,报告中在解释人工智能(AI)的投资在世界领先的科技公司之间引起专利和知识产权(IP)的竞赛时,也引用了很多亚马逊对机器人和语音识别的投资案例。
亚马逊对语音方面的部署的确是令世界瞩目的。同时间麦姆斯咨询公司也放出了两则智能语音领域的动向,XMOS推出适用于远场应用、面向亚马逊Alexa语音服务的VocalFusion 4麦克风开发套件。世界上最先进的压电式声学传感器开发商Vesper宣布与人机接口解决方案领导者Synaptics公司建立合作。
这两则消息围绕的核心公司,其实是亚马逊。亚马逊的策略貌似杂乱无章,不过我们可以来抽丝剥茧,根据其目前前端的产业链条进行分析,对每个链条的公司以及每个公司的位置进行详细的排布整理。
链条1: 今日麦姆斯咨询披露出消息,称‘英飞凌高信噪比MEMS麦克风助力XMOS,推出的亚马逊AVS远场开发套件,这则消息涉及数个厂商,其中实际暗含着一个链条。
英飞凌是著名的半导体厂商,其前身是西门子集团的半导体部门,这里作为麦克风供应商,XMOS是制作开发套件和解决方案的厂商,Alexa这是起到窗口的作用。所以简单来讲,这条链条的流动模式是XMOS集成从英飞凌的麦克风做成开发板,集成套件,再推给亚马逊的第三方生态。近日,XMOS推出适用于远场应用、面向亚马逊Alexa语音服务的Vocal Fusion 4麦克风开发套件。
图为XMOS推出的Vocal Fusion 4麦克风开发板
链条2:“Synaptics以提供世界一流的音频开发套件闻名,可以加速Alexa功能产品的开发,”Vesper的CEO Matt Crowley表示,“我们非常激动能与Synaptics合作,为亚马逊Alexa语音服务提供高度优化的开发解决方案,从而大大缩短具有语音界面的设备的上市时间。”
这一合作将提升开发人员为亚马逊Alexa语音服务(AVS)设备创建超耐用、高性能和高稳定度的语音接口能力。Synaptics已经选择了Vesper压电式MEMS麦克风用于其双麦克风和四麦克风亚马逊Alexa语音服务开发套件。
Syaptics与XMOS都是做开发套件的厂商,从这个角度说这两个链条是相似的,但不同的是,这次的合作挂上了Vesper这个公司。Vesper是一家位于马萨诸塞州波士顿的先进级传感器的私人控股公司。起源于密歇根大学,Vesper屡获殊荣的麦克风通过专有的压电MEMS技术推动了语音接口普及和声学事件检测产品的新纪元。但当然它不只是这个身份,大家没有看到的,是它也是亚马逊Alexa Fund投资的公司,意味着亚马逊控制着部分Vesper公司。所以这条链条实际是Synaptics采用Vesper(亚马逊控股)的麦克风,做好开发套件,再推给亚马逊的流动模式。
链条3:是自主提供解决方案制作生产开发套件的模式。从亚马逊控制以及重视程度来讲,三条线部署的第一条重视程度小于第二条小于第三条,毕竟掌控度最大的还是内部出产的链条。
亚马逊也曾与Conexant 、SoundAI等第三方厂商合作推出套件,走的是类似第一条链条的模式。2017年4月,声智科技(SoundAI)发布了支持Alexa的4麦和6麦智能音箱开发套件,以极快的响应速度赢得了业界口碑。2017年5月,科胜讯(Conexant)也发布了一款整合支持亚马逊Alexa的4-mic开发套件,以便开发者们进行原型设计。
图为声智科技Alexa开发套件
但是,由于Amazon当前的策略是全力打造自家的Echo家族系列,其技术和流量对于生态几乎没有实质性帮助,严重伤害了硬件生态厂商的积极性,反而让Alexa的第三方生态厂商保持观望的态度。
同样在开发套件下功夫的还有谷歌,谷歌也有内部链条,与亚马逊链条3相似,谷歌首款开源AI硬件产品“Voice Kit”就是谷歌自主研发的语音开发套件。Voice Kit语音开发套件可利用树莓派来创建基于语音的虚拟语音助手,但是其并不包含树莓派,需要用户自备,用户可以使用Pi 3 Model B,Pi 2以及PiZero来设计和测试。
图为谷歌Voice Kit开发套件
比起国外巨头们纷纷部署开发套件这一开发专用产品,国内的产业动作便小了很多,相较于亚马逊的全面部署,在国内能够做到将整个链条揽下来的公司实际并没有突出,不过可以我们从百度等巨头的部署类比来看。
百度AI开发者大会(Create2017)上推出了DuerOS平台,发布DuerOS软硬件一体化解决方案,提供多样化开发套件与完全开放的参考设计,包括套件的个人版、轻量版、标准版以及开放电路板设计、开放结构设计等完整一体化参考设计,旨在给每一个开发者赋能以达到更高效的研发。
其中百度提到了与业界领先公司科胜讯、MTK、高通、声智等公司合作推出开发板。根据内部消息,为加快产品验证时间和满足个人开发者的需求,百度与声智科技即将联合推出DuerOS专用版本。
目前,国内市场上供应开发板的还有科大讯飞、思必驰以及Rokid,Rokid最近也刚刚发布All in one的开发套件。根据各家网站公布的开发板套件信息,我们具体统计如下:
备注:开源指必须提供所有源文件,开放指仅提供原理和开发说明,绑定指必须采用指定模块,加密指必须采用加密芯片,定制指不能自由公开购买
首先,这应该得益于智能音箱在全球的持续增长,亚马逊和小米、阿里分别验证了欧美和大陆市场的用户需求,国内外产品厂商基本认可了未来几年智能音箱的市场规模。这个时候若期望市场全面爆发,特别是带动一些新兴产品厂商的加入,以开发板来做智能语音的产品开发教育就显得非常重要。
其次,亚马逊、谷歌、百度、小米和阿里都希望成为未来智能语音的主流平台,思必驰、云知声和Rokid也在平台建设方面发力。但是毕竟智能语音市场刚刚兴起,用户、场景、开发等体系都不完善,这直接导致产品定义的模糊以及产品开发周期的不确定性,因此,基于现有的开发板方案帮助产品快速验证,也成为了巨头们非常重要的一个突破点。
最后,任何一个新兴的领域,对于生态和平台公司来说,基于自己的平台教育更多的开发者,将对未来产生极其关键的影响,否则生态或者平台很难产生非常强的粘性。这从微软和谷歌,甚至苹果的策略中也能窥得一二,当然,作为技术领域的新起之秀,亚马逊深深领悟了这一点,国内的百度也以战略的眼光来对待这小小的开发板。
(来源:雷锋网)