广告

现实版“读心术”,Stable Diffusion能读取大脑信号复现图像

2023-03-06 16:31:18 综合报道 阅读:
近日,一项研究声称能够用Stable Diffusion将大脑活动重建为高分辨率、高精确度的图像,在网上掀起轩然大波。

近日,一项研究声称能够用Stable Diffusion将大脑活动重建为高分辨率、高精确度的图像,在网上掀起轩然大波。0Vrednc

0Vrednc

这项研究声称,使用fMRI(功能磁共振成像技术,相比sMRI更关注功能性信息,如脑皮层激活情况等)扫描大脑特定部位获取信号,AI就能重建出我们看到的图像。相关论文已经被CVPR 2023(IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议)接收。0Vrednc

0Vrednc

这项研究来自日本大阪大学,研究希望能从人类大脑活动中,重建高保真的真实感图像,来理解大脑、并解读计算机视觉模型和人类视觉系统之间的联系。0Vrednc

0Vrednc

可视化去噪过程0Vrednc

研究人员选用潜在扩散模型(LDM)Stable Diffusion进行重建信号。整体研究的思路是,基于Stable Diffusion打造一种以人脑活动信号为条件的去噪过程的可视化技术。它不需要在复杂的深度学习模型上进行训练或做精细的微调,只需要做好fMRI成像到Stable Diffusion中潜在表征的简单线性映射关系。整个框架仅由1个图像编码器、1个图像解码器,外加1个语义解码器组成,概览框架如下:0Vrednc

0Vrednc

具体来说,研究人员将大脑区域映射为图像和文本编码器的输入。下部脑区被映射到图像编码器,上部脑区被映射到文本编码器。如此一来可以这让该系统能够使用图像组成和语义内容进行重建。研究者分别从早期和高级视觉皮层的fMRI信号中解码出重建图像z以及相关文本c的潜在表征,将其作为输入,由自动编码器生成复现出的图像Xzc。0Vrednc

0Vrednc

可以看到,如图1所示采用了Zc的编码模型在大脑后部视觉皮层产生的预测精确度是最高的。(Zc是与c进行交叉注意的反向扩散后,z再添加噪声的潜在表征)相比其它两者,它生成的图像既具有高语义保真度,分辨率也很高。0Vrednc

0Vrednc

图1:使用z、c和Zc重建的图像。0Vrednc

责编:Ricardo
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 2024诺贝尔奖公布,竟然有两项都颁给了AI? 诺贝尔奖被普遍认为是在世界范围内,所有颁奖领域内能够取得的最高荣誉,最近,2024年的诺贝尔奖获奖名单也陆续公布了出来,而在目前公布的奖项中竟然有两项都与人工智能相关···
  • 无处不在的 Arm 软硬件生态赋能开发者 AI 创新 人工智能 (AI) 是当今最重大的技术变革之一,并正以前所未有的速度推动着各行各业的发展···
  • AI普及给嵌入式设计人员带来新挑战 探讨了人工智能(AI)的普及给嵌入式设计人员带来的新挑战。在创建“边缘机器学习(ML)”应用时,设计人员必须确保其能有效运行,同时最大限度地降低处理器和存储开销,以及物联网(IoT)设备的功耗。
  • 自制一个能拍照、能回答问题的智能眼镜,只要180块? 在Meta近日举办的Llama 3 hackathon黑客马拉松活动中,一项名为“Open Glass AI”的开源项目仅花费了20美元(约144元人民币)的物料成本就将一副普通的眼镜改装成了智能眼镜,成功斩获了比赛第一名···
  • 设计汽车雷达系统的挑战 高清雷达在任何天气条件下都能有效地进行基于人工智能的前端物体探测,与其他传感器通道相辅相成,进一步提高了准确性和安全性。对于构建高价值嵌入式雷达系统的制造商来说,市场潜力巨大。然而,如何有竞争力地发掘这一潜力却充满挑战。在本文中,我们探讨了其中一些挑战。
  • 英特尔推出全球最大神经拟态系统,速度比人脑快200倍 4月18日,英特尔宣布,其打造出了全球最大的神经拟态系统——Hala Point,该系统内置1152个英特尔Loihi 2处理器,拥有11.5 亿个神经元和1280亿个突触,速度最高可达人脑的 200 倍···
  • Meta推出下一代AI基础设施MTIA芯片,整体性能提升达3倍 2023年,Meta推出了元训练和推理加速器(MTIA)v1,这是一款专为Meta的深度学习推荐模型设计的第一代人工智能推理加速器,与上一代相比,最新版本芯片的性能得到了显著的提升···
  • AI软件工程师已至:可独立开发项目,程序员饭碗真没了? 使用Devin进行开发,人类用户只需通过聊天机器人式的界面,用自然语言提示的方式概述项目,Devin就会按照要求完成所有工作。它首先会创建一个详细的分步计划来完成指定的任务,然后开始使用开发人员工具,就像人类程序员所做的一样,而速度要快得多···
  • 宝座易主,Claude 3超越GPT-4成为全球最强模型 Claude 3系列的旗舰模型Opus在本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等多个测试中均超越了OpenAI的GPT-4和谷歌的Gemini 1.0 Ultra,并在复杂任务上表现出接近人类水平的理解力和流畅性···
  • Cadence推出全新数字孪生平台Millennium Platform,提 颠覆性的专用软硬件加速平台;利用GPU和CPU计算以及专有软件算法,提高准确度、速度和规模的同时,带来高达100倍的设计效率提升;与传统HPC相比,支持GPU-resident模式的求解器可将仿真能效显著提高20倍;将数字孪生、人工智能和HPC技术相结合,为汽车、航空航天、能源、叶轮机械和数据中心提供更优的多物理场仿真解决方案;利用创新的生成式人工智能技术,进一步加速设计和分析探索,获得卓越的设计洞见,提供更好的系统解决方案;支持在云端或本地进行CFD多物理场分析,以满足客户的业务需求
  • 意法半导体智能执行器STSPIN参考设计整合电机控制、传 意法半导体的EVLSPIN32G4-ACT边缘AI电机驱动参考设计基于STSPIN32G4智能三相电机驱动器,能够降低智能执行器的开发难度。
  • 安霸发布前端AI开发者平台:Cooper Cooper开发者平台为工业应用、AIoT、智能视频分析和前端AI计算应用提供高能效解决方案。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了