几十年来,键盘和鼠标一直是我们操控电脑的传统工具。随着智能手机、平板电脑等移动设备的诞生,人们需要借助新技术来与这类没有配备键盘和鼠标的微型计算机进行有效交流。由此,触摸屏成为了一项关键技术,使得这些电子产品更加友好。而语音识别技术的加入,则使其更为直观。
随着物联网的普及,我们需要交互的电子设备的数量也将与日俱增。智能家居便是一个典型示例,声控恒温器已开始运用其中。未来,我们还可以直接与机器人进行交互。除交互式工业机器人之外,家庭助理机器人和医疗助理机器人也在研发当中。而今,设备可以通过触摸屏接收指令,也可以通过内置式耳机收听指令。借助眼动追踪系统,它们还能检测到用户正在注视的对象,从而预测用户的下一步意图。这将为直观的人机交互开启无限可能。
眼动追踪系统可以检测人的眼球运动以及注视方向。起初,人们开发眼动追踪系统是出于市场调研、行为分析和合用性研究的目的。此外,在帮助那些双手无法操作电脑的用户方面,它们的应用已有一段时间。其中许多系统使用红外光照射用户眼睛,并通过摄像机获取图像,然后根据图像数据计算眼球运动。因此,这些系统需要特制的高质量摄像机、光源和软件,有时还需要加装硬件加速器来处理海量的图像数据。
而今天,借助极其强大的芯片、紧凑型摄像传感器和新型的大功率LED,可以将眼动追踪功能集成到智能手机等电子设备上。其实,许多电子设备上都搭载了摄像传感器和红外光源,只不过它们是用来实现面部识别、虹膜识别等其他功能。因此,接下来需要有的就是一款合适的软件,来将眼动追踪作为一个附加功能加以集成。
目前,各个领域均在开发各种创新概念,意在促进眼动追踪用作一种新型的人机接口。在具有眼动追踪功能的智能手机和平板电脑的屏幕上,已经可以通过视线接触激活图标或移动游戏人物。具有眼动追踪功能的游戏电脑能使玩家在游戏场景中更为身临其境。在一些系统中,玩家可以通过眼球动作控制游戏人物的视角,而无需使用鼠标或触控板。眼动追踪同样也可以用于常规电脑,如通过眼球动作实现文档滚动查看。
此外,在智能家居行业,有多种方式可以通过眼动追踪技术与各种设备进行交互。例如,具有眼动追踪功能的智能电视已经问世。汽车领域也已提出这些系统的潜在应用,其中的一个典型示例便是驾驶员活动助理系统,它可以监测驾驶员的眼球活动,从而及时检测到疲劳驾驶的信号。眼动追踪功能也可以用于监测驾驶员的注视方向,从而确定其正专注前方路况还是注意力分散。这类信息将有助于避免道路上出现紧急情况。
图1:视线接触激活图标。眼动追踪结合现有的输入功能,开启了全新的电子设备操控方式。
上述应用中的新型眼动追踪系统基于红外LED(IRED)和高分辨率摄像传感器而设计,它们分别用于照射人眼和记录眼球反射的光线。然后,由图像处理算法根据这些原始数据计算瞳孔的位置(图2),再由专用软件利用屏幕等参照物的位置信息确定用户所注视的具体位置。不管眼睛是什么颜色,尤其是在黑暗中或屏幕背光非常明亮时,红外照明均可以确保虹膜与瞳孔之间所需的对比度。
图2:眼动追踪系统使用红外光照射人眼,并利用摄像传感器捕捉图像。所捕捉的图像数据用于确定瞳孔的位置,并用来计算用户注视的方向。
这些系统目前的最远探测距离是一米。智能手机和平板电脑的工作距离通常在30cm左右,而台式电脑则通常在60cm左右。屏幕分辨率与眼睛的光栅尺寸相对应,平板电脑约为1cm,电脑则约为2cm。所用红外LED的数量以及发射器和摄像头的具体排列取决于应用的类型,即工作距离的长短和覆盖面积的大小。此外,设置还会因所采用的眼动追踪软件而有所不同,这是因为几何设计也要看各种算法能否可靠地检测瞳孔的转向。一般而言,发射器和摄像传感器需要按特定角度进行布局,彼此之间需保持一定距离,以避免收到眼镜的眩光或者光线从眼球到传感器的直接反射。距离越大,信号质量越好,用户与设备间最佳距离的选择空间就越灵活。。
不同于大多数需要使用特定波长的虹膜扫描仪,眼动追踪系统可以在较宽的光谱范围内运行。通常,这些系统需要借助现有的虹膜扫描或面部识别系统,并搭配波长为850nm或810nm的IRED。人眼可感知到波长为850nm的IRED所发出的微弱红外光。许多眼动追踪解决方案制造商更倾向于采用940nm的IRED,因为裸眼看不到这种光。然而,940nm设计现在还存在弊端:目前通用的摄像传感器针对可见光进行了优化,但在红外光谱范围内灵敏度则较低。波长为940nm时,灵敏度降低十分明显(图3),因此需要增强红外照射,以达到与850nm光源一样的信号强度。鉴于红外照明的广泛应用,摄像头制造商正在研发红外灵敏度高的新版本。
图3:在850nm和940nm之间时,针对可见光优化过的标准摄像传感器的灵敏度大幅度下降。配备940nm IRED的眼动追踪系统的优势在于它几乎不会被人眼所感知。大多数情况下,需要使用更高的工作电流来补偿下降的信号水平。
理想状态下,双眼应位于摄像传感器的捕捉区域内。整个眼球需被均匀照射,这一点很重要。所需红外光照射强度取决于工作距离,即便对于移动设备,也可能需要数瓦的功率。为尽量减少大工作电流下的热输出,发射器是在脉冲模式下工作。尽管如此,热管理仍是设计重点之一,在更轻薄的智能手机和平板电脑中尤为如此。因此,IRED效率是除光输出外的另一个重要因素。效率越高,产生的热就越少。
针对这类应用,欧司朗特别开发了Oslon Black系列产品,其中,SFH 4715A的光电效率达到创纪录的48%。这款850nm发射器在1A工作电流下的典型光输出为770mW,是目前此工作电流下效率最高的IRED。如果需要,还可以采用纳米堆叠技术,在一颗芯片上提供两个发射中心,堆叠布置,从而获得更高的输出。工作电流为1A时,SFH 4715AS的典型光输出为1340mW。它提供90度和150度发射角两种版本,涵盖许多不同的设计。Oslon Black版本在1A工作电流下光输出为990mW,是理想的940nm光源。
图4:Oslon Black SFH 4715AS的波长为850nm,是迄今为止功率最大的IRED。工作电流为1A时,其发光功率为1340mW。得益于其纤薄的外形,其不仅能安装在最新的智能手机中,还可以用于下一代设备。
Oslon Black的一个特性是其器件高度仅为2.3mm,因此它不仅适用于今天的智能手机,也适用于下一代更为纤薄的电子设备。
像其他红外光源应用一样,眼动追踪系统必须符合人眼安全标准。普通用户接触的红外辐射量相对较低。然而,技术人员近距离观看红外光源时需留意风险。眼动追踪系统上关联有一个接近传感器,可确保在这种情况下IRED能自动关闭。有关光学系统安全设计的详细信息,可参阅《欧司朗人眼安全应用注释》等文献。
我们周围有太多复杂的电子设备,需要有新的技术来实现直观的人机交互。红外照明和摄像传感器为交互技术奠定了良好的基础,使设备能“看到”用户并理解他们的意图。眼动追踪示例展示了如何在硬件基础上通过软件方案实现新的交互类型。硬件组件的创新也正驱动着这一发展。例如,采用波长为940nm的光源便是其中一种发展趋势。因此,欧司朗也在不断扩展在人脸识别、眼动追踪等应用方面的产品组合。
作者:Christoph Goeltner,欧司朗(OSRAM)光电半导体产品经理
本文授权编译自EDN美国版。《电子技术设计》2017年11月刊版权所有,转载请注明来源及链接。