广告

3D视觉为机器人增加“眼睛”

2019-05-10 09:38:35 Richard Quinnell 阅读:
人类之所以能够驾驭这个世界,是因为具有三维(3D)感知能力。而这个能力也可以赋予给我们的机器人。但人类感知三维的方式也许并不适用于机器。要引导机器人运用深度传感视觉,需要考虑三个关键方法:立体视觉、结构光和飞行时间(ToF)。

人类之所以能够驾驭这个世界,是因为具有三维(3D)感知能力。而这个能力也可以赋予给我们的机器人。但人类感知三维的方式也许并不适用于机器。要引导机器人运用深度传感视觉,需要考虑三个关键方法:立体视觉、结构光和飞行时间(ToF)。Uqwednc

机器人系统已经存在了几十年,但直到最近它们大多都是盲目工作。只需为机器人配备接触传感器、接近传感器和位置传感器,它们就可以优雅地进行精心编排的、无休止的重复动作,可以操纵重型材料,执行精密装配,或焊接复杂的结构。但是,它们工作的成功与否,取决于其环境的精确性、必用材料的精确放置,以及对其运动轨迹的仔细绘制和编程。Uqwednc

然而,这种情况正在发生变化。机器视觉和视觉智能方面的研究、半导体制造的进步,以及图像传感器在手机市场上的应用,简化了视觉系统的开发并降低了其成本,使其成为了一种扩展机器人功能的越来越具成本效益的选择。借助视觉(特别是3D视觉)的引导,机器人将变得更能够与自由世界交互,工作起来更灵活,也更容易适应新的任务。Uqwednc

然而,特定的机器人所需的视觉特性高度取决于应用。例如,对于那些必须通过视觉引导在杂乱的仓库里移动的机器人来说,它们需要对动态环境进行远程感知,但只需要提供适当的精度。固定机器人的需求则可能完全不同,例如有些机器人用来将箱子里所混合的零件取出,并按相同类型进行堆放,这可能只需要在有限的范围内提供高精度的视觉。执行精密装配的机器人则又有另一套需求。因此,要确定采用哪一种3D视觉方法,首先要对机器“观看”的工作方式有所理解。Uqwednc

立体机器视觉

由于和人类观看的方式相似,最容易理解的3D方法是立体视觉。这是一种三角测量法,即用相隔一定距离的摄像头去捕获两个(或多个)图像(或用一个摄像头在图像之间移动),然后通过比较来确定摄像头视场中物体的距离。将摄像头分离会产生视差,这样,较近物体相对远处背景的对齐就会不同——物体越接近摄像头,视差越大。Uqwednc

图1给出了一个简单的示例。图中的两个摄像头沿平行轴指向相同方向,其传感器对齐并相隔基线距离B,每个摄像头都会捕获一个3D空间(X,Y,Z)的点(P)图像。捕获的图像中,该点在其2D图像平面上的位置将会不同(uL和uR)。几何上,该位置相当于从P点向摄像头引一条射线,穿过一个垂直于摄像头光轴(ZA)、距离等于摄像头镜头焦距(f)的平面所得的交点。Uqwednc

3dvision-1Uqwednc

图1:简单的立体视觉几何图。Uqwednc

如果取每个摄像头的ZA与该平面相交的点作为每个图像2D坐标系的原点,那么计算两个成像点之间的距离,就可以获得该点的视差(d)。然后,就可以很容易地计算出该点到图像平面的距离(深度):Uqwednc

深度 = f * B/dUqwednc

但是通常现实世界中的系统不是那么容易对齐的。图2给出了一种更通用的设置,其中,每个摄像头都有自己的坐标系,它们以其光轴方向和图像传感器像素栅格的旋转方向来界定。确定图像点视差要比简单的距离计算更复杂,这涉及到坐标变换和几何校正,但三角测量原理是相同的。Uqwednc

3dvision-2Uqwednc

图2:现实世界中的立体视觉几何图。Uqwednc

幸运的是,有大量的商用和开源软件可以处理这些计算。还有一些软件可使用摄像头栅格图像来确定所有必要的坐标变换,这样开发人员就不需要精确地确定摄像头方向。因此,计算空间中单个点的深度信息就变成了机器视觉系统中相对简单的一项运算。Uqwednc

但是,这当中仍然存在许多其他的计算挑战。其中最重要的一个是让系统确定不同摄像头图像中是哪个点对应于空间中的相同物理点。这个确定过程可能涉及极为复杂的相关过程,需要将来自一幅图像的一小组像素与构成另一幅图像的所有组像素进行比较来确定哪些组匹配,然后对构成第一幅图像的所有小像素组重复该过程。Uqwednc

结构光深度测定

第二种3D视觉方法——结构光——可简化上面这个相关过程,设计人员应当留意这个优势。这种方法在三角测量工作中用投光机取代了其中一个摄像头。投光机生成一个已知的光斑,然后系统将摄像头图像与这个已知光斑进行比较。所捕获图像中的结构光光斑会因为被测对象上的每个点深度不同而产生失真(图3)。在这个例子中,可以使用基线和两条射线之间夹角计算出P点的深度(R):Uqwednc

R = B (sin α)/sin (α + θ)Uqwednc

3dvision-3Uqwednc

图3:结构光系统根据已知光斑产生的反射光失真来计算深度。Uqwednc

目前业界已针对场景的深度信息提取开发出各种各样的结构光方案(图4),但其中有许多针对的是物体扫描而不是机器人运动控制。其中一些结构光方案产生图像序列所使用的光斑包含若干条纹,其宽度从一个图像到下一个图像依次减半(二进制编码)。还有类似采用格雷码或相移条纹的连续光斑也有使用。要利用单个图像捕获深度信息,可以利用连续变化的颜色编码图案,或对条纹图案编制索引,即每个条纹都与其他条纹不同。使用激光器或微镜光控制器可以很容易地创建这样的图案,而amsFinisarTI等公司也都专门针对结构光光源制造器件和控制器。Uqwednc

最近越来越流行的一种结构光方法是以伪随机图案来排列编码形状或二进制点所组成的栅格。系统使用人眼看不见的红外(IR)光来投射这种栅格图案,并且因为栅格是静止的,所以可以使用简单的全息光栅来创建图案。使用这种方法的商用深度传感摄像头系统现已上市。(请参见EDN姊妹刊物Electronic Products上发表的《Designer's guide to 3D cameras》一文)。Uqwednc

红外光的使用在视觉引导机器人应用中具有两个明显优势。首先,它可以使视觉系统与人类一起工作,而不会因结构光投射而为人类带来的视觉混乱。其次,使用红外光还可简化将结构光与环境光分离的工作。Uqwednc

3dvision-4Uqwednc

图4:3D结构光的种类。(来源:OSA,《Structured-light 3D surface imaging: A tutorial》)Uqwednc

飞行时间深度测量

第三种3D视觉方法——飞行时间(ToF)——完全没有使用三角测量法。ToF 3D成像是直接测量深度,也就是确定光从光源到达环境中的物体然后返回所用的时间。在这方面,ToF类似于激光雷达(LIDAR)。然而,ToF方法不是用窄激光束扫描环境来构建深度图像,而是针对整个视场同时确定距离。半导体技术在不断进步,如今的传感器设计已经可以实现每个像素都可以向控制电子逻辑提供自己的信号,进而提取出计时信息。Uqwednc

ToF的一个挑战在于能够在有意义的范围内实现精确计时,从而获得精确的深度信息。光在空气中的传播速度约为1ft/ns(c),因此光脉冲必须使用数GHz时钟,才能分辨小于1ft的尺寸。类似地,传感器信号必须以亚纳秒精度进行测量。但是,这么短的脉冲所含光子数量有限,也即传感器接收到的光子数太少,从而导致信噪比(SNR)不佳。Uqwednc

尽管如此,仍有传感器使用直接时间测量法。Teledyne e2v的1.3MP BORA CMOS图像传感器提供距离选通成像,其全局快门开关可使传感器仅在很短的一段时间内针对特定深度平面收集光子。通过结合多次光照的结果,该传感器可以建立更强的信号用于处理。若在整个系统范围内扫描快门计时,该系统就可以在其深度范围内构建完整的深度图。Uqwednc

然而,更常见的一种方法是检测发射信号与反射信号之间的相位差来获取深度信息。图5给出了这种方法,反映了反射信号与方波发射脉冲(也可以是其他调制波)之间的关系。物距越大,关联信号越短,并且信号在多个周期内的积分值越低。由于对信号强度进行积分测量起来会比瞬时计时更加精确,因此这种方法的深度测量精度会比简单计算信号返回时间更高。目前,InfineonpmdTI等公司都提供这类ToF传感器,其中一些更具有可执行所有深度计算的内置电路。Uqwednc

3dvision-5Uqwednc

图5:ToF通过比较反射信号与发射信号的时序来直接测量距离。Uqwednc

不幸的是,这两种方法均存在深度混叠的问题。ToF方案中,光源的调制频率(f)决定了最大不模糊距离,为R = c/2f。假如光脉冲速率是100MHz,则传感器可以清楚分辨的最大范围是5ft(10ns往返)。如果一个物体在6ft以外,其相关信号与1ft外的物体别无二致。也就是说,6ft远的物体对脉冲N的反射光线,其到达传感器的时间与1ft远的物体对脉冲N+1的反射相同。Uqwednc

降低调制频率可增大不模糊距离,但也有不利后果。释放的光子数较少,会使信噪比变差,或需要增加积分时间。这两种结果都不可取。Uqwednc

有一种解决方案是通过在光源中混合两种调制频率,来实现信号的去混叠。然后,传感器信号处理可以在对信号进行积分之前分离频率。其总返回信号较高,可提供良好的信噪比;不同的频率所混叠的距离不同,有助于解决距离模糊问题。该方案的最大模糊距离为光速除以两个频率最大公分母的两倍。Uqwednc

R = c/2*GCD(f1, f2)Uqwednc

根据需求匹配优势

上述3D视觉方法各有优劣,开发人员应根据其应用需求进行评估和选择;了解各种3D视觉技术的含义对于选择正确的方法也至关重要。例如,立体视觉系统可以使用传统的摄像头,并且无需使用集成式光源,所以这种方法成本低廉并且更容易集成到设计中。但是立体视觉系统的深度精度取决于其在多幅图像中找到对应点所需的计算性能,而且物体距离越远,深度分辨率越差。立体视觉系统在应对光滑表面和重复图案上也存在问题,这两者都使找到对应点的任务变得更复杂。Uqwednc

另一方面,结构光方法也使用传统摄像头,但只需要一个。其不需要有很强的计算性能,因此有助于降低成本。但其需要使用集成式光源,其强度会影响工作距离。在环境光可控或被滤除的情况下,其效果最佳,例如在封闭空间中。Uqwednc

ToF系统的计算强度最低,由于摄像头通常直接向系统主机提供深度信息,因此大大降低了计算需求。然而,与结构光一样,系统需要使用集成式光源,其功率会影响系统的距离,环境光不受控也会导致问题。此外,光源的调制频率也会影响距离。Uqwednc

无论哪种方法最适合您的应用,为机器人配备视觉引导正变得越来越容易。现货摄像头系统和视觉软件(商用和开源)也使事情变得更简单。此外,为下一代智能手机提供3D视觉功能的研发,有望进一步降低3D视觉的成本和复杂性。Uqwednc

本文为《电子技术设计》2019年5月刊杂志文章。Uqwednc

Uqwednc

本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 探索PSIJ之谜—由电源引起的高速信号抖动 在高速信号传输的世界里,每一个细微的“波动”都可能引发巨大的影响。而如今,一个隐匿的“杀手”正悄然威胁着高速信号的稳定性——那就是电源引起的高速信号抖动PSIJ···
  • 转换效率提升近8000倍,能用千年的核电池问世 近日,苏州大学的团队联合苏州大学纳米科学技术学院、西安高新技术研究所、西北核技术研究所、湘潭大学等机构院校的研究人员,提出了一种基于“内置能量转换器”的锕系微型核电池结构设计理念···
  • 如何评估热载流子引导的MOSFET衰退 随着MOSFET栅极长度的减小,热载流子诱发的退化已成为重要的可靠性问题之一···
  • 上海贝岭“功率器件&电源IC”在PD快充中的应用 USB-PD,英文全称为USB Power Delivery,是USB的标准化组织USB-IF推出的一个快速充电的标准。经过近7年时间的发展与更新,如今的USB PD快充协议已经由最初的1.0版本、2.0版本、3.0版本发展到PPS,现在又推出了最新的3.1版本。目前为止,我们现有的使用消费类产品大部分停留在USB-PD 3.0的时代···
  • 基于铁电晶体管科研,共探集成电路的创新之路 后摩尔时代专题,泰克张欣与北大集成电路学院唐克超老师共话铁电晶体管、存储计算科研进展···
  • Nordic nRF9151:面向大规模物联网市场的小型、低功耗 nRF9151是一款完全集成的预认证 SiP,免征美国关税,支持LTE-M/NB-IoT和DECT NR+,具有应用 MCU 或独立调制解调器功能···
  • 选择LDO时的主要考虑因素和挑战,一文全了解 低压差(LDO)稳压器在智能手机、可穿戴设备和其他便携式小型设备等现代电子产品中发挥着至关重要的作用。由于其效率和可靠性,它们在系统级芯片(SoC)架构中的集成变得越来越普遍。然而,片上LDO选项和特性种类繁多,使得选择过程变得十分复杂···
  • 无处不在的 Arm 软硬件生态赋能开发者 AI 创新 人工智能 (AI) 是当今最重大的技术变革之一,并正以前所未有的速度推动着各行各业的发展···
  • 复杂的RF PCB焊接该如何确保恰到好处?只需关注这几点 当射频电路在50GHz以上的高频下运行时,每一块额外的金属都会影响严格控制的走线的阻抗。我们来看看如何确保射频PCB上的焊料恰到好处···
  • 采用RISC-V架构,紫光同芯发布全球首颗开放式架构安全芯 近日,紫光同芯发布了全球首颗开放式架构安全芯片E450R,这款芯片不仅同时具有开放式硬件+软件架构,还获得了多项权威认证,标志着安全芯片领域的重大突破···
  • 使用电子保险丝克服传统保护器件的局限性 在现代汽车和工业应用中,可靠性至关重要。从汽车区域控制器,到工业应用中的计算机数控等产品,无论最终产品是简单还是复杂,如果不能保证可靠性,就很可能损害制造商的声誉。此外,还需要考虑保修维修的成本,甚至是召回产品的成本。然而,电子电路总归都会出现故障,可能是由于外部影响,也可能是由于组件随时间推移性能下降而引起。因此,根据良好的设计实践,建议采用电路保护器件,以确保将故障的影响降至最低。本文介绍了标准电路保护器件的局限性,以及如何利用电子保险丝改进设计。
  • FPGA让嵌入式设备安全成为现实 谈及嵌入式设备,安全性一直是人们关注的一大话题。然而目前为止,人们的注意力都放在了错误的方向上。不安全的网络边缘计算和物联网设备已经证明,最薄弱(且经常被忽视)的环节往往导致重大的安全漏洞···
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了