认知技术能让终端和事物根据环境凭直觉感知(像人类一样地看和听)、推理(通过分析所处环境并进行预测需求)和行动。认知技术受人类大脑的启发可作为人类感觉的自然延伸,扩展人类的能力。这些技术还将根据环境为我们提供个性化体验,同时在终端和事物之间创造出更类似于人类的互动。
简单的说,认知技术能让智能手机/机器人等根据所处的位置和环境、以往习惯,甚至是语音识别和物体识别来提取信息,以及预测我们的需求,并在恰当的时间为我们提供相关信息。也许有些人觉得该技术与我们相距甚远,尤其是机器人领域的,现在不妨从生活应用说起。
手机扫描二维码是移动互联网时代的标志,过去我们扫描二维码都是通过专用APP去识别,这是非智能的被动识别,本质是用户告诉手机你拍到的是二维码,请帮我解析。但最近笔者使用三星Galaxy S7手机拍摄照片时候发现,如果被摄物有二维码或者条形码,手机会自动在取景时候会直接进行对象识别(无任何延迟),并提醒笔者查看内容:
点击查看信息的时候直接跳到百度搜索界面并准确搜索到了相关产品,这就是主动识别。这一功能运用得当会有意想不到的效果,比方说外出游玩时候,拍摄照片时如果含有警告字样会自动提出警告就是相当有用的功能。
认知技术包括机器学习、仿真计算机视觉、智能连接以及永久感测等,赋予机器更强大的直觉,能够更了解我们的喜好和所处环境(摄像头拍到的内容被识别为含有条形码),然后预测我们的需求(需要搜索产品的详细信息以及价格),并在恰当的时间为我们提供相关信息。认知技术受人类大脑的启发可作为人类感觉的自然延伸,扩展人类的能力。这些技术还将根据环境为我们提供个性化体验,同时在终端和事物之间创造出更类似于人类的互动。
认知技术的宽广舞台
前文中介绍手机摄像头根据拍到的内容识别条形码只是认知技术应用的冰上一角,认知技术在智能手机、汽车自动驾驶、机器人等领域还有更广阔的空间,比如我们在介绍Zeroth计算平台时提到的计算机视觉。计算机视觉是智能终端感知的重要成分,其重要性等同于人类视觉。
高通平台下的计算机视觉由Qualcomm Spectra ISP、Qualcomm Hexagon DSP、Qualcomm Adreno GPU以及CPU组成的异构运算铁三角负责。这些计算模块分别扮演了特殊的角色,能够在非常低的功耗下实现智能识别。
高通智能捕捉功能(Clever Capture)可以检测人的动作或面部微笑,然后触发照片连拍功能,自动选择最心仪的照片。下图就是运用此功能自动捕捉到的水球破裂瞬间的照片。
在过去手机摄影最难的就是瞬间捕捉,美妙的瞬间往往在毫秒间流逝,捕捉的方法只有实时感测,将按下快门之前的图像也记录下来,这就需要Hexagon DSP的鼎力协助,否则功耗将变得难以接受,所幸当今平台已经可以实现这一功能。
摄影只是计算机视觉的一部分,高通骁龙文本激活功能(Snapdragon Text Activation)可以读取和解释现实世界中的文字,并提出适当操作或应用建议。比如说当名片出现在手机的取景器中时,骁龙文本激活功能将会识别网址,并询问你是否想在浏览器中打开它;也可以识别地址,您可以选择是否直接在地图应用中打开。
环境感知是认知技术又一重要组成,这一前提就是不同的传感器会持续记录数据,并在观察我们的行为后将其智能地与数据组合在一起。这是Hexagon DSP的传感器融合技术的拿手好戏,它配备着“始终开启”的传感器。
以车载骁龙处理器为例,“始终开启”的传感器让汽车能够不断了解其周围环境,提升驾驶体验。骁龙820 Automotive芯片组具有驾驶辅助功能,能提供车道偏离警告、车辆前方碰撞探测警告,以及交通标志识别功能以避免错过那些不易看到的停车标志。增强型3D导航可进行实时更新,将车道和交通标志在地图上标识出来,提供从A点到B点的最便捷路线。
(骁龙820 Automotive芯片组)
先进的摄像头和传感器处理能持续提供“始终开启”的预警和应急服务。芯片上的图像信号处理器能同时支持连接4到8个汽车摄像头传感器,而智能后视摄像头在倒车时可使用先进的计算机视觉来探测对象。同时,包括在V2X(车辆与万物互联)类别中的车辆与移动终端连接,以及V2V(车辆与车辆连接)警告,可以通过向汽车、智能手机应用或连接可穿戴设备发出警报来避免碰撞。
这些终端处理的关键就是高通骁龙的异构运算设计。异构架构是移动终端在有限温度、体积以及功耗要求下实现认知技术的保障,也是未来机器人和无人机平台实现更强大功能的保证,通过机器学习和计算机视觉技术,它们能够适应我们的需求,避开环境中会遇到的问题。
再来看看智能手机方面,Zeroth平台能够在连接方面带来稳定的移动体验。新一代骁龙820处理器,集成X12 LTE调制解调器,其通过使用IP多媒体子系统(IMS),支持下一代高清LTE语音(VoLTE)和LTE视频(ViLTE)通话服务,同时还支持LTE和Wi-Fi间的通话连续性。借助Qualcomm Zeroth的认知能力,X12 LTE调制解调器能够实时监测Wi-Fi连接质量,以决定是否以及何时在LTE与Wi-Fi间切换通话。
以上简单列举了当前认知技术的一些使用场景——在拍照界面下自动识别拍摄内容是否为条形码;带来更加安全、智能的驾车体验;通过智能手机为用户带来更好的移动体验。可以看出,认知技术已经围绕在我们身边,并且未来随着技术和设计的进一步提升,认知技术必将大施拳脚,迎来更加广阔的前景。