广告

现实版“读心术”,Stable Diffusion能读取大脑信号复现图像

2023-03-06 16:31:18 综合报道 阅读:
近日,一项研究声称能够用Stable Diffusion将大脑活动重建为高分辨率、高精确度的图像,在网上掀起轩然大波。

近日,一项研究声称能够用Stable Diffusion将大脑活动重建为高分辨率、高精确度的图像,在网上掀起轩然大波。MCYednc

MCYednc

这项研究声称,使用fMRI(功能磁共振成像技术,相比sMRI更关注功能性信息,如脑皮层激活情况等)扫描大脑特定部位获取信号,AI就能重建出我们看到的图像。相关论文已经被CVPR 2023(IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议)接收。MCYednc

MCYednc

这项研究来自日本大阪大学,研究希望能从人类大脑活动中,重建高保真的真实感图像,来理解大脑、并解读计算机视觉模型和人类视觉系统之间的联系。MCYednc

MCYednc

可视化去噪过程MCYednc

研究人员选用潜在扩散模型(LDM)Stable Diffusion进行重建信号。整体研究的思路是,基于Stable Diffusion打造一种以人脑活动信号为条件的去噪过程的可视化技术。它不需要在复杂的深度学习模型上进行训练或做精细的微调,只需要做好fMRI成像到Stable Diffusion中潜在表征的简单线性映射关系。整个框架仅由1个图像编码器、1个图像解码器,外加1个语义解码器组成,概览框架如下:MCYednc

MCYednc

具体来说,研究人员将大脑区域映射为图像和文本编码器的输入。下部脑区被映射到图像编码器,上部脑区被映射到文本编码器。如此一来可以这让该系统能够使用图像组成和语义内容进行重建。研究者分别从早期和高级视觉皮层的fMRI信号中解码出重建图像z以及相关文本c的潜在表征,将其作为输入,由自动编码器生成复现出的图像Xzc。MCYednc

MCYednc

可以看到,如图1所示采用了Zc的编码模型在大脑后部视觉皮层产生的预测精确度是最高的。(Zc是与c进行交叉注意的反向扩散后,z再添加噪声的潜在表征)相比其它两者,它生成的图像既具有高语义保真度,分辨率也很高。MCYednc

MCYednc

图1:使用z、c和Zc重建的图像。MCYednc

责编:Ricardo
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 新一代MCU向着边缘AI和实时控制发展 在工业和汽车领域,电机驱动和数字电源转换是典型的实时控制系统,要求处理器具有高实时性和强大的数学计算与处理能力。这些应用需要优质的ADC和PWM功能,并通过联动机制,形成高效、有机的实时控制系统。
  • Arm年度技术大会:2025年底预计将有1,000亿台具备AI能力 近日,作为 Arm 一年一度的技术盛会,2024 年度技术大会 (Arm Tech Symposia 2024) 在上海和深圳成功举办。这次的大会十分特殊,以往 Arm 年度技术大会往往会专注于特定的应用市场,而今年的大会只聚焦于一个领域——AI···
  • Arm Tech Symposia 年度技术大会顺利收官,继续构建 作为当今时代最重大的技术变革之一,AI 极有潜力成为人类毕生最重要的技术。Arm 不仅提供了应用广泛的通用计算平台,还通过将 IP 与开源软件和工具乃至广泛的行业领先生态系统相结合,让全球 2,000 万开发者都能够使用 Arm 计算平台作为 AI 创新基础···
  • 继联网传输视频、图片之后,现在连气味也能远程传送了? 这是一家名为Osmo的“数字嗅觉”公司推出的技术,该公司在最近成功利用 AI 技术分析一个位置的气味,并在无需人工干预的情况下在其他地方复制它,实现了气味的远程传送···
  • AI 大模型迈向多模态,助力具身智能与机器人实现创新 你听过莫拉维克悖论 (Moravec's paradox) 吗?该悖论指出,对于人工智能 (AI) 系统而言,高级推理只需非常少的计算能力,而实现人类习以为常的感知运动技能却需要耗费巨大的计算资源···
  • 2024诺贝尔奖公布,竟然有两项都颁给了AI? 诺贝尔奖被普遍认为是在世界范围内,所有颁奖领域内能够取得的最高荣誉,最近,2024年的诺贝尔奖获奖名单也陆续公布了出来,而在目前公布的奖项中竟然有两项都与人工智能相关···
  • 无处不在的 Arm 软硬件生态赋能开发者 AI 创新 人工智能 (AI) 是当今最重大的技术变革之一,并正以前所未有的速度推动着各行各业的发展···
  • AI普及给嵌入式设计人员带来新挑战 探讨了人工智能(AI)的普及给嵌入式设计人员带来的新挑战。在创建“边缘机器学习(ML)”应用时,设计人员必须确保其能有效运行,同时最大限度地降低处理器和存储开销,以及物联网(IoT)设备的功耗。
  • 自制一个能拍照、能回答问题的智能眼镜,只要180块? 在Meta近日举办的Llama 3 hackathon黑客马拉松活动中,一项名为“Open Glass AI”的开源项目仅花费了20美元(约144元人民币)的物料成本就将一副普通的眼镜改装成了智能眼镜,成功斩获了比赛第一名···
  • 设计汽车雷达系统的挑战 高清雷达在任何天气条件下都能有效地进行基于人工智能的前端物体探测,与其他传感器通道相辅相成,进一步提高了准确性和安全性。对于构建高价值嵌入式雷达系统的制造商来说,市场潜力巨大。然而,如何有竞争力地发掘这一潜力却充满挑战。在本文中,我们探讨了其中一些挑战。
  • 英特尔推出全球最大神经拟态系统,速度比人脑快200倍 4月18日,英特尔宣布,其打造出了全球最大的神经拟态系统——Hala Point,该系统内置1152个英特尔Loihi 2处理器,拥有11.5 亿个神经元和1280亿个突触,速度最高可达人脑的 200 倍···
  • Meta推出下一代AI基础设施MTIA芯片,整体性能提升达3倍 2023年,Meta推出了元训练和推理加速器(MTIA)v1,这是一款专为Meta的深度学习推荐模型设计的第一代人工智能推理加速器,与上一代相比,最新版本芯片的性能得到了显著的提升···
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了