谷歌发文详解Pixel 3中的拍照黑科技——Super Res Zoom-EDN 电子技术设计

 前些天，谷歌发布了全新Pixel 3/Pixel 3XL手机，其最新的AI拍照功能令人感到惊艳。Night Sight夜间拍照效果吊打iPhone XS；Top Shot功能可以连续拍摄多张HDR+照片，自动去掉抖动、眨眼的废片，推荐效果最好的一张；Photo Booth模式可以在检测到人脸有微笑或者有趣的表情时自动拍照，帮你留下珍贵的一刻；Super Res Zoom通过摄像头的变焦功能拍摄具备高分辨率的照片。

在雷锋网看来，Super Res Zoom可以说是此次几项全新AI拍照功能中最难理解的一个，也让不少业内人士感到好奇。幸而，谷歌计算成像领域首席科学家Peyman Milanfar和软件工程师Bartlomiej Wronski在Google Blog特意发布一篇博文，讲述了Super Res Zoom技术实现的全部过程。雷锋网对原文进行了不改变原意的翻译和编辑。bv5ednc

bv5ednc

一直以来，使用算法（而不是镜头）来进行数码变焦的移动设备相机就像是“丑小鸭”。数码变焦的图像质量难以与数码单反相机的光学变焦相提并论，因此传统观点认为，大型相机的复杂光学机制无法被更紧凑的移动设备相机和聪明的算法替代。bv5ednc

凭借Pixel 3上新的Super Res Zoom功能，我们正在挑战这一概念。bv5ednc

此前，数码变焦技术主要是升级单个图像中的像素，Pixel 3中的Super Res Zoom技术则不然。Super Res Zoom的做法是将许多帧的图像直接合并以产生更高分辨率的图像，这个方法能大大改善图片的细节，能许多其他智能手机上的2倍光学变焦镜头大致相当。bv5ednc

bv5ednc

2倍变焦：Pixel 2 vs. Super Res Zoom Pixel 3bv5ednc

数码变焦的挑战

数码变焦是困难的。因为一个好的算法期望从低分辨率的图像开始，并可靠地“重建”缺失的细节——在典型的数字变焦中，单个图像的一小部分被放大，生成一个大得多的图像。传统上，这是通过线性插值方法来实现的，这种方法试图重新创建在原始图像中丢失的信息，但会使得图像模糊，缺乏纹理和细节。基于单图像来提升图像质量一般采用机器学习的方法(包括我们自己的早期工作RAISR)。这些图像放大了一些特定的图像特征，如直线边缘，甚至可以合成某些纹理，但无法恢复自然的高分辨率细节。虽然我们仍然使用RAISR来提高图像的视觉质量，不过Super Res Zoom创新性地采用了多帧图像方法。bv5ednc

彩色滤镜阵列和脱模

重构细节尤其困难，因为数码照片已经不完整了。通过一种叫做脱模(Demosaicing)的过程，我们可以从部分颜色信息中重构丢失的信息。在典型的消费相机中，相机传感器元件只用于测量光的强度，而不是直接测量光的颜色。为了捕捉场景中呈现的真实颜色，摄像机使用放置在传感器前面的颜色滤镜阵列，以便每个像素只测量一种颜色(红色、绿色或蓝色)。如下图所示，它们以拜耳模式排列。bv5ednc

bv5ednc

拜耳马赛克彩色滤镜：每2x2组像素捕获由特定颜色过滤的光——两个绿色像素(因为我们的眼睛对绿色更敏感)，一个红色，一个蓝色。这种模式在整个图像中重复出现。bv5ednc

然后，在给定部分信息的情况下，摄像机处理管道必须重构所有像素的真实颜色和所有细节。脱模(Demosaicing)过程的第一步是要猜测丢失的颜色信息，通常会选取附近像素的颜色进行插值，这意味着RGB数字图像的三分之二实际上是重建的！bv5ednc

bv5ednc

脱模利用相邻像素重建丢失的颜色信息bv5ednc

在最简单的形式中，这可以通过对相邻值进行平均来实现。大多数真正的解谜算法都比这更复杂，但由于只能得到部分信息，脱模的效果仍然不完美而且有很重的人工痕迹。虽然大尺寸的单反相机也存在这种情况，但它们更大的传感器和更大的镜头能比一般的移动相机能够捕捉到更多的细节。bv5ednc

如果你在移动设备上进行缩放变焦，情况会变得更糟；然后，算法被迫通过附近的像素进行插值来弥补更多的信息。然而，这也不是一无是处，因为即使受到移动设备光学的限制，高速连拍（Burst Photography）以及多幅图像的融合可以用来实现超分辨率。bv5ednc

从高速连拍（Burst Photography）到多帧超分辨率

虽然单个帧不能提供足够的信息来填充缺失的颜色，但是我们可以从高速连续拍摄的多个图像中获得一些缺失的信息。谷歌的HDR+算法在Nexus手机和Pixel手机上得到了成功应用，它已经利用多帧的信息使手机照片达到了更大传感器所期望的质量水平，是否可以使用类似的方法来提高图像分辨率?bv5ednc

多帧超分辨率的概念出现已经有十多年历史了（在天文摄影上，类似的概念被称为“drizzle”），通过捕捉和组合多个细微位置差异的照片可以产生相当于光学变焦的效果，至少在2-3倍的低倍变焦和良好的照明条件下。在这个过程中，一般的想法是将低分辨率的图像部分直接对齐并合并到一个理想(更高)分辨率的网格上。下面是一个理想化的多帧超分辨率算法如何工作的例子:bv5ednc

bv5ednc

与顶部的需要插值的脱模过程相比，用多个图像填充，每个图像水平或垂直移动一个像素更为理想bv5ednc

在上面的示例中，我们捕获了4个帧，其中3个帧精确地移动了一个像素：从水平方向、垂直方向以及同时从水平和垂直方向。所有的洞都会被填满，根本就不需要任何脱模。一些单反相机支持这种操作，但只有当相机在三脚架上，传感器/镜头能进行移动，这有时被称为“微步”（microstepping）。bv5ednc

多年来，这种“超级分辨率”的高分辨率成像方法的应用仍然主要局限于实验室，或以其他方式控制的设置中。在这些设置中，传感器和主体是对齐的，它们之间的移动要么是有意控制的，要么是受到严格限制的。例如，在天文成像中，用固定的望远镜来拍摄星空的移动轨迹。但在当今智能手机等广泛使用的成像设备及应用程序中，超级分辨率的实际应用仍是可望而不可及的。bv5ednc

多帧超分辨率功能需要满足一些条件。首先，也是最重要的一点，镜头需要比所使用的传感器更好地处理细节(相反，你可以想象这样一个情况，镜头设计得很差，添加一个更好的传感器没有任何好处)。数码相机有的一种常见的且不受欢迎的效果，叫做混叠（aliasing）。bv5ednc

图像混叠

当摄像机传感器不能忠实地表示场景中的所有模式和细节时，就会发生混叠。混叠的一个很好的例子是龟纹图案（ Moiré patterns），当两种同样的图案以一定的角度重叠会出现的现象。bv5ednc

bv5ednc

由两组平行线产生的莫尔条纹,一组垂直，另一组倾斜5°bv5ednc

此外，当物体在场景中移动时，对物理特征(如表边)的混叠效果也会发生变化。您可以在以下连拍序列中观察到这一点，在连拍序列中，相机的轻微运动会产生时变的混叠效果：bv5ednc

bv5ednc

左图：高分辨率下的桌子边缘的单幅图像，右图：连拍产生的不同图像帧。混叠效果和云纹效果在不同的帧之间是可见的——像素似乎跳来跳去，产生不同的彩色图案bv5ednc

但是，我们也能因祸得福，如果分析混叠效果产生的模式，就会得到颜色和亮度值的多样性，以实现超分辨率。尽管如此，要在手持移动设备和任何连拍序列中实现高分辨率，依然有诸多挑战存在。bv5ednc

手部移动实现超分辨率

如前所述，一些单反相机提供了特殊的三脚架超分辨率模式，类似于我们目前描述的方式。这些方法依赖于相机内传感器和光学器件的物理运动，但需要相机完全稳定。然而，这在移动设备上是不切实际的，因为它们几乎总是手持的。bv5ednc

然而，借助手部运动方案，我们将这个最大的难点变成了我们的优势。当我们用手持相机或手机拍摄一组照片时，画面之间总会有一些运动。光学图像稳定(OIS)系统可以补偿相机的大运动——通常间隔1/30秒以内的5-20像素移动——但不能完全消除更快、更低的幅度、自然的手震颤。当使用高分辨率传感器的手机拍照时，这种手抖的幅度只有几个像素。bv5ednc

bv5ednc

在进行处理后，连拍中手掌震颤的结果bv5ednc

为了利用手部抖动的优势，我们首先需要将高速连拍的照片排列在一起，我们选择高速连拍图像中的单个图像作为“基”或参考帧，并对齐与之相关的所有其他帧。对齐后，这些图像大致结合在一起。当然，手部运动不太可能将图像精确地移动单个像素，因此我们需要在每个新捕获的帧中插入相邻像素，然后将颜色注入基帧的像素网格中。bv5ednc

当由于设备是完全稳定的(例如放置在三脚架上)而没有出现手部运动时，我们仍然可以通过故意“抖动”相机来达到模拟自然手部运动的目的，通过强迫OIS模块在镜头之间轻微移动。这个移动非常小，选择的时候不会干扰正常的照片——但是你可以在Pixel 3上自己观察它，你可以把手机完全固定，比如把它按在窗口上，或者最大限度地缩放取景器。如下图所示，可以观察远处物体微小但连续的椭圆运动。bv5ednc

bv5ednc

克服超分辨率的挑战

以上是我们对理想过程的描述，听起来很简单，但是要实现超分辨率并不是那么容易。有很多原因导致没有被广泛应用到手机等消费产品中，例如其需要大量的算法创新。挑战可以包括:bv5ednc

即使在良好的光照条件下，连拍的单个图像也是有噪声的。一个实用的超分辨率算法需要意识到这种噪音，并正确工作。我们不想只得到更高分辨率的噪声图像——我们的目标是既提高分辨率，又能产生更小的噪声。bv5ednc

bv5ednc

左：在良好的光照条件下拍摄的单帧图像，由于曝光不足，仍然可能包含大量的噪声。右：连拍处理后合并多帧的结果。bv5ednc

在连拍的图像之间的运动不仅仅局限于相机的运动，可能有复杂的场景中运动如风吹动的树叶、水面涟漪、汽车、人的面部变化、火焰的闪烁——甚至一些不能被视为独立运动的如吸烟。一般来说，完全可靠和局部对准是不可能的，因此即使运动估计不完美，一个好的超分辨率算法也要能用。bv5ednc

因为大多数运动是随机的，即使有良好的对齐，数据可能在图像的某些区域密集，而在其他区域稀疏。超分辨率的关键是一个复杂的插值问题，因此数据的不规则传播使得在网格的各个部分生成更高分辨率的图像具有挑战性。bv5ednc

bv5ednc

以上所有的挑战似乎都使得超分辨率在实践中不可行，或者充其量只能局限于静态场景和放在三脚架上的相机。利用Pixel 3上的Super Res Zoom，我们开发了一种稳定、精确的连拍分辨率增强方法，它使用自然的手部运动，并且足够强大，可以部署在手机上。bv5ednc

以下是我们解决上述挑战的方法:

为了在高速连拍（Burst Photography）情况下有效地合并帧，并为每个像素生成一个红色、绿色和蓝色的值，而不需要进行除噪，我们开发了一种跨帧集成信息的方法，该方法考虑了图像的边缘，并相应地进行了调整。具体地说，我们分析输入帧并调整我们如何将它们组合在一起，权衡增加的细节，分辨率，噪声抑制和平滑。我们通过沿着明显边缘的方向合并像素，而不是跨越它们来实现这一点。效果是我们的多帧方法提供了噪音减少和细节的增强之间的最佳平衡。bv5ednc

为了使算法能够可靠地处理复杂的局部运动场景(人、车、水或树叶移动)，我们开发了一个鲁棒性模型来检测和减轻对齐误差。我们选择一帧作为“参考图像”，并只有当我们确信我们找到了正确的对应特征才将来自其他帧的信息合并到它。通过这种方式，我们可以避免像“重影”或运动模糊，或者是错误地合并图像的部分。bv5ednc

bv5ednc

一辆快速行驶的公共汽车的连拍图像。左:没有鲁棒性模型下合并。右:有鲁棒模型下合并bv5ednc

推动移动摄影技术的发展

去年谷歌推出的人像模式(Portrait mode)，以及之前HDR+ pipeline都展示了移动摄影的优越性。今年，我们从变焦下手。Super Res Zoom能提高计算机摄影技术水平，同时缩小移动摄影和数码单反之间的质量差距。bv5ednc

超分辨率的概念比智能手机的出现早了至少10年。在几乎同样长的时间里，它也通过电影和电视在公众的想象中存在，它也是学术期刊和学术会议上成千上万篇论文的主题。现在，在你手掌中的Pixel 3里，超分辨率真实存在。bv5ednc

如何最大限度地利用Super Res Zoom?

这里有一些关于如何在Pixel 3的手机上使用Super Res Zoom的技巧：bv5ednc

缩放再缩放，或者使用+按钮增加缩放的离散步骤。
双击预览以快速切换缩放和缩小。
Super Res Zoom可以在所有缩放系数下工作，不过出于性能原因，它只激活了1.2倍以上。
Pixel的广角摄像机的光学分辨率有基本的限制。因此，为了最大限度地利用缩放，请保持放大系数适中。
避免快速移动的物体。Super Res Zoom能正确捕捉它们，但你不可能得到更高的分辨率。

（来源：雷锋网）bv5ednc

啥时候国内能用？

阅读全文，请先

手机设计产业前沿

上一篇： 什么是积分噪声 下一篇： 让工程师难忘的Top 10博物馆…

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

Arm 技术预测：2025 年及未来的技术趋势 Arm 对 2025 年及未来的技术发展做出了预测，范围涵盖技术的各个方面，从 AI 的未来发展到芯片设计，再到不同技术市场的主要趋势···
“芯”之所向，音之所至：泰凌无线音频SoC助力万物互联新在国际集成电路展览会暨研讨会(IIC Shenzhen 2024)同期举办的“芯”品发布会上，泰凌微电子正式推出两款全新音频SoC产品：TL751X 和 TL721X···
EDA/IP与IC设计：引领芯片产业变革的未来引擎（上午场）在人工智能、5G通信、物联网等新兴技术蓬勃发展的当下，EDA/IP与IC设计技术正迎来新一轮的变革与机遇···
看似简单的冲击激励石英振荡器，这几个细节要注意这个电路看似极其简单，但却表现出不同寻常的行为。它产生奇整数石英谐波的近似方波，包括其主频率···
硬核科技，赋能未来：解码芯片产业创新趋势在近日举办的E维智库第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上，邀请了来自艾迈斯欧司朗、Qorvo、RAMXEED（原富士通半导体）、飞凌微、安谋科技、清纯半导体等企业的多位行业专家，共同探讨芯片技术在各个领域的应用和发展方向···
天玑9400详解：AI时代，旗舰芯拿什么引领？联发科将最近刚刚发布的天玑9400称为旗舰5G“智能体AI芯片”——所谓的“智能体”究竟是什么意思？对手机又有什么价值？本文详细剖析了天玑9400的关键技术，来尝试一探究竟...
后量子加密确保安全过渡量子计算时代量子计算机崛起的最重要影响之一就是对于安全的冲击，因为量子计算机甚至可能破解目前最安全的加密方法。这也就是为什么在此“量子十年”(quantum decade)期间，业界将会看到从传统加密系统快速转移到“后量子加密”(PQC)技术的原因...
常用蓝牙功能还有隐藏风险？被黑客跟踪这样就能解决由于所有无线设备在用于发射蓝牙信标的硬件上都存在微小的制造缺陷，这种蓝牙硬件的缺陷会导致独特的失真，所以实际上这些信标对于每个设备是独一无二的，黑客可以将其用作指纹来跟踪特定设备···
纯血鸿蒙手机每年靠OTA性能都能提升30%，华为要如何做到 2024年的华为开发者大会上，华为介绍了纯血鸿蒙为手机带来的性能提升，并表示要让整机的性能(通过OTA)每年再提升20-30%，超越整个行业芯片制程的进步速度。也就是说哪怕一直使用现在工艺制程的芯片，华为的手机仅靠鸿蒙系统升级每年性能都可以提高20-30%，这真的可以做到吗？
苹果M系列芯片被曝硬件架构漏洞，无法直接修复安全专家在苹果M系列芯片中发现了一个新的安全漏洞，使用该漏洞的攻击方式被命名为GoFetch，这种攻击方式使用的应用程序不需要root访问权限，只需要与macOS系统上安装的大多数第三方应用程序所需的相同用户权限，黑客就可窃取用户数据。
苹果首个第三方应用商店上线测试，和安卓商店有区别吗？ MacPaw近日发布公告称，计划在今年4月在欧洲市场推出苹果首个第三方应用商店Setapp。目前该应用的测试版已发布，正在邀请感兴趣的用户进行测试···
骁龙8 Gen 4发布时间提前，高通或采用自研Nuvia架构？在2月举办的2024巴塞罗那世界移动通信大会（MWC 2024）上，高通高级副总裁兼首席营销官Don McGuire就宣布了2024年的骁龙峰会的举办时间，也就是今年10月，届时高通将发布旗舰产品骁龙8 Gen 4平台···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

谷歌发文详解Pixel 3中的拍照黑科技——Super Res Zoom

数码变焦的挑战

彩色滤镜阵列和脱模

从高速连拍（Burst Photography）到多帧超分辨率

图像混叠

手部移动实现超分辨率

克服超分辨率的挑战

以下是我们解决上述挑战的方法:

推动移动摄影技术的发展

如何最大限度地利用Super Res Zoom?