在今年的国际消费电子展(CES 2018)上,语音(voice)、连接(connectivity)和人工智能(AI)成为最受关注的焦点。如果说今年的CES能为我们带来什么指标,那么这三项建构模块将是组成2018年及未来消费电子设备缺一不可的神圣“三位一体”。
语音助理已经准备好进入可穿戴设备、耳机、婴儿监视器、灯具、电视遥控器和车辆。DSP Concepts创办人兼首席技术官Paul Beckmann在接受《EE Times》时说:“我们似乎正见证着一场围绕着语音的‘寒武纪大爆发’。”
DSP Concepts首席技术官Paul Beckmann
在CES上,被称为“中国Google”的百度大力向开发商展示并开放其基于Duer OS的平台。无论是其声控台灯或挂在天花板上的投影机和屏幕,都不需要Alexa或Google Assist。就像百度常挂在嘴边的“中国速度”,越来越多的厂商开始朝向语音发展。
百度展示了一款整合台灯功能的声控智能喇叭(来源:Baidu)
消费设备必须具备连接能力已经是不争的事实。Silicon Labs首席执行官Tyson Tuttle强调,接下来的必备功能是“混搭”不同的无线网络。他解释说,直接将原本为智能手机设计的连接芯片加进物联网(IoT)设备,已经无法满足要求了。系统需要动态的多协议软件,以及为不同的无线网络划分时间的能力。
尽管AI在高度自动化汽车中占据主导地位,但Ceva首席执行官Gideon Wertheizer告诉我们:“我看到AI开始摆脱幻想世界。”供应商如今正试着“设置参数,在随机环境中使用AI来解决特定问题。”
Ceva首席执行官Gideon Wertheizer
换句话说,许多公司开始学习在小规模应用中导入AI,并将其用于特定任务,而非依靠AI来解决世界上的问题。
无论是在家庭或开车行驶中,语音都将至关重要。
博世(Robert Bosch)在CES宣布计划将其语音助理设计在方向盘后方。博世管理董事会成员Dirk Hoheisel表示:“我们正致力于让驾驶舱内的按钮乱象划下句点。”Elektrobit在CES上承诺,该公司将成为亚马逊(Amazon) Alexa的第一批汽车软件整合商之一。
Bosch开发“自然语言”车内语音辅助系统(来源:Bosch)
百度宣布其基于Duer OS的Apollo 2.0平台被称为“自动车辆的Android”,并称语音辅助系统将成为该平台的一部份。百度总裁兼COO陆奇表示:“家庭与车辆之间已经不存在界限了。无论你在家中做什么,应该也都可以在车子里实现。”
Wertheizer则指出,无论是在家中还是车内,隔离声音以及直接向云端发送清晰的讯号都非常困难。“我们的周遭充斥着噪音和噪声着。”很自然地,家庭和汽车的解决方案必须能够因应一连串完全不同的嘈杂环境。
让问题变得更复杂的原因在于业界还没有任何标准的语音算法。Wertheizer表示:“每一家公司都有自家处理语音的专有算法。”
系统业者开始求助于学术界发表的技术论文,竞相找出如何最有效隔离语音的解决之道。而当他们使用不同的麦克风和扬声器类型时,还必须优化其算法,以因应不同的设置要求。
而在Ceva,Wertheizer说:“我们必须建立一个类似原子庇护所的工作室”,用于研究所有的选择,并开发波束成形、远场和近场、回声消除和环境降噪等算法。
Beckman也呼应了这个观点。就像人们喜欢语音作为自然的用户接口一样,他说:“遗憾的是,对于实际执行的产品设计人员来说,它是最具挑战的技术之一。”他已经看到了太多的语音项目出错了,最终得回到草图阶段重新开始。
Beckman曾经在Bose Corp.担任研究工程师长达9年,在2000年初成立了他的咨询业务。当他与客户讨论语音项目时,他发现业界需要一套有效执行的“完整软件解决方案,以及能为其实现差异化的底层技术”。但是,最主要的关键在于赋予其能够自行调整系统的能力。
随着语音市场爆发,Beckman的业务也随之成长。DSP Concepts不再只是一家咨询公司,现在还提供了一套完整的算法作为软件库和除错工具,有助于客户调整系统。Beckman说:“我们提供调整、整合和验证工具。”
语音UI解决方案需要一套完整的算法(来源:DSP Concepts)
DSP Concepts的语音用户接口(UI)技术称为Audio Weaver,它是第一家获得亚马逊(Amazon) Alexa产品认证的第三方软件公司。DSP Concepts共同创办人兼首席执行官Chin Beckmann展示一款Audio Weaver语音助理产品——相较于亚马逊Echo使用了7支麦克风,Audio Weaver仅用了2支麦克风,据称就能够“听”得比Echo或Google Home更清楚。
Wertheizer说,隔离语音是第一步,但接下来还有其他步骤:语音助理必须辨识语音的位置,而且必须能够追踪语音。而且,它必须能侦测以及辨识谁在房间里说话。
直到最近,云端才刚被认为是处理和学习的地方。如今,这个假设将在2018年发生改变。
Wertheizer解释说:“我看到人们对于AI的态度越来越务实。他们希望在边缘设备执行AI而非在云端进行,以避免隐私、延迟和成本等问题。”
联发科技(MedaTek)首席财务官顾大为对此表示认同。相较于亚马逊在其Echo设备中推动云端到云端的服务,联发科看到了“边缘和云端”融合模式的可能性。他在CES时告诉我们,语音助理竞赛如今已经着重于在本地增加“智慧”、区别人类与非人类的声音分开、消除背景音乐、辨识声音模式等。
Petcube Wi-Fi宠物照相在远程进行机监测并与宠物互动(来源:Petcube)
Wertheizer说:“以Petcube设计的交互式Wi-Fi宠物相机为例,它能在主人不在家时,透过双向音讯和1080p高分辨率(HD)视频摄影机进行监控,以及与狗或猫互动”。Wertheizer说:“我不确定Petcube是否意识到这是一家物联网公司。但是,像这样的连网产品中,语音识别系统显然必须能够辨识狗吠声,并且确定狗是处于压力还是处于危机之中。换句话说,系统需要有智能才能进行学习。”
虽然Ceva为语音系统的设计者提供了名为ClearVox的语音算法,但它也知道系统厂商需要的更多。系统制造商希望在其物联网设备中整合学习和推论的能力,使其产品能够持续变得更加智能化。
目前的市场上亟需AI处理器。为了满足这一需求,Ceva在CES上推出了Neupro,这是一款“专用的低功耗AI处理器系列,用于在边缘进行深度学习”。Neupro是一款独立的专用AI处理器,可广泛用于物联网、智能手机、安全监控、汽车、机器人、医疗和工业等市场。
Ceva推出AI处理器(来源:Ceva)
值得注意的是,Ceva并非深度学习领域的新手。据报导,NeuPro是以Ceva在计算机视觉应用深层神经网络方面的经验为基础。
Wertheizer说,NeuPro AI处理器是Ceva从头开始研发的第一款“非DSP”技术。他在发布Neupro时说:“我有点紧张。但是你必须知道AI并不是讯号处理方面的问题。”
NeuPro处理器搭载两个硬件——NeuPro引擎和NeuPro VPU (向量处理单元)。Wertheizer指出,虽然引擎处理定义良好的人工智能算法,如CNN、启动和规范层,但是,可编程的向量引擎NeuPro VPU是执行专有AI算法的一种延伸。“我们选择了这种硬联机的建置方式,而不是使用GPU或CPU,让我们能够增加AI处理器的利用率。”
Ceva声称,这款新的专用AI处理器系列带来了“相当高的性能提升,从入门级处理器的2TOPS到为最高阶配置的12.5TOPS”。
NeuPro硬件模块;Ceva首席执行官Gideon Wertheizer强调,“NeuPro VPU和NeuPro引擎之间的无缝切换至关重要”。 (来源:Ceva)
Ceva表示,NeuPro AI处理器将于2018年第二季向客户提供授权,并计划在第三季全面发布。
同样地,联发科准备推出一款由意腾科技(Intelligo Technology)设计的AI处理器和算法。Intelligo是2016年时从联发科独立而出的新创公司。
Intelligo设计的这款AI SoC被称为“智能DNN语音处理器”应用范围较有限。联发科表示,该处理器提供“可配置的深度神经网络和高效率推论引擎(每秒每瓦特1 TOPS运算性能)”。
顾大为表示,联发科正在寻找一种小型的AI加速器,为辨识20到30个关键词而设计。另一方面,联发科也正推广其“分布式处理”的观念,期望语音和AI功能不只是整合于像Echo或Google Home的智能音箱,而是更落实于广泛的小型设备——如电灯开关。
(原文发表于Aspencore旗下EDN姐妹媒体EETimes,参考链接:Voice and AI Explosion Rocks CES;Susan Hong编译)