据EDN电子技术设计报道,Meta近期开源了一个人工智能项目"Animated Drawings",任何人都能把他们的涂鸦变成动画。
Meta AI 的基础人工智能研究 (FAIR) 团队发布了这个开源项目,旨在帮助创作者和开发者轻松创建他们自己的绘图到动画体验或产品。它始于 2021 年,当时 FAIR 的研究人员决定将计算机视觉的最新进展应用于快速直观的管道,以动画化人物画中的类人形象。
绘画是一种熟悉而有趣的表达方式,我们作为初学者所画的人物往往非常奇怪、抽象和富有想象力。谁不希望那些可爱的角色活过来,在书页上四处走动?甚至还有书籍和电视剧讲述了这种普遍的幻想。不幸的是,实际上实现这种效果是相当困难的。创建许多图画以产生运动的错觉(例如翻书)是乏味的,并且现有的动画工具对于新用户来说可能具有挑战性。结果,许多令人难以置信的字符在页面上保持静止。
Meta的研究人员设想使用对象检测模型、姿势估计模型和基于图像处理的分割方法来快速创建绘图的数字版本。然后可以使用传统的计算机图形技术对其进行变形和动画处理。
它只需要用户上传一张类似人类的单一角色的图画,或者选择一个演示人物。如果你使用自己的涂鸦,你会看到一个同意书,询问Meta是否可以使用你的画来帮助训练其模型,不需要提供同意也可以继续使用这个工具。
接下来,上传者需要手动调整一个捕捉框的大小,使之与原作紧紧相贴,界面中提供了笔和橡皮擦来调整图纸,然后再调整关节的位置。完成这一切后,就可以看到草图的动画版本。你可以从四类预设的动画中挑选:舞蹈、搞笑、跳跃和行走。
动画图画利用物体检测模型、姿势估计模型和基于图像处理的分割方法来捕捉数字版本的图画。然后,它使用传统的计算机图形技术对图像进行变形和制作动画。
在演示上线后的几个月内,用户已经授权Meta公司使用160多万张图片用于培训。一些人上传了公司标志、动漫人物、鱼和毛绒动物的图片,尽管该工具规定只有人类形象可以使用。
除了要求提供包括声音效果和文本覆盖在内的更深入的工具集外,人们上传到该工具的一系列图像表明,人们对更广泛的绘画到动画的体验有广泛的兴趣。这在一定程度上带动了Meta公司将该项目与大约180000张图纸的数据集进行了开源。Meta在一篇博文中写道:"通过将模型和代码作为开放源码发布,该项目为开发者提供了一个起点,使他们能够建立和扩展该项目,促进开放源码社区内的创新和协作文化。"
参考链接:First-of-its-kind open source project brings your animated drawings to life
开源地址:AnimatedDrawings