下一代多对多直播场景需要新一代实况交互式流媒体解决方案-EDN 电子技术设计

 相较于传统的直播场景，下一代的直播场景则主要为多对多模式，即每个人都是主播，既是数据源也是接收器，这样的场景包括连线观赏、直播购物、在线拍卖和社交流媒体等。这样的应用场景要求对数据的处理更加贴近用户，要求把这样的处理转移到网络的边缘。

在实况直播市场，无论是在营收，还是在基础设施的部署方面，增长都非常迅速。2021年数据显示，全球视频市场超70%的份额由直播内容所主导。yodednc

yodednc

目前，传统的广播流媒体主要是由软件和CPU提供支持。传统的直播活动主要采取一对多的模式，由于视频流的数量比较少，同时时延比较可控，因而可以用比较传统的现有网络形式来支持直播服务。yodednc

yodednc

相较于传统的直播场景，下一代的直播场景则主要为多对多模式，即每个人都是主播，既是数据源也是接收器，这样的场景包括连线观赏、直播购物、在线拍卖和社交流媒体等。这样的应用场景要求对数据的处理更加贴近用户，要求把这样的处理转移到网络的边缘。在边缘来处理这些应用场景，意味着原来通过云集中的方式能够获得的经济效益已经不复存在了，因此也就需要彻底改变基础设施部署模式。yodednc

yodednc

随着目前流媒体直播对时延的要求越来越高，而且部署在边缘的成本也在提高，这就驱使业界致力于开发新一代的实况交互式流媒体解决方案。这样的实时、交互式的流媒体应用场景要求低时延和大容量，新的架构才能够适应这些变化带来的成本压力。yodednc

yodednc

日前，AMD公司视频转码事业部推出了全新的媒体加速器卡Alveo MA35D，其中包括了从芯片到板，再到软件的解决方案。据AMD视频战略与市场开发主管 Sean Gardner介绍，Alveo MA35D针对一系列新的应用场景进行了优化。该产品的命名，MA代表媒体加速器（Media Accelerator），35代表Alveo U30后的新一代产品，D表示两个（dual）视频处理单元的意思。yodednc

yodednc

Alveo MA35D媒体加速器卡具备两个5nm基于ASIC的、支持AV1压缩标准的视频处理单元（VPU），专为推动大规模直播互动流媒体服务新时代而打造。yodednc

Alveo MA35D能够大大改善经济性，从而使得新的应用场景变得商业可行。比如，它同时具有高密度、超低时延的处理单元以及人工智能的赋能。Alveo MA35D卡可以以每流1W的功率每卡提供多达32路1080p60转码密度。Alveo MA35D的4K编码时延最低8ms，仅为常规处理时间（16ms）的一半。Alveo MA35D具备22 TOPS AI算力（INT8），可以支持非常多的新的应用场景，可以很好的来满足我们的客户对于行业的期待。“同时，我们也必须要保证Alveo MA35D的成本效益，所以Alveo MA35D的建议零售价1595美元也非常有吸引力。”Gardner补充说。yodednc

通过和上一代产品Alveo U30的比较，可以看到，Alveo MA35D的通道密度提高了4倍、功耗降低了3倍、时延降低了4倍。Alveo MA35D在方方面面都有非常优异出色的表现，而且还有很多额外的功能和新的能力。yodednc

yodednc

“我们在开发Alveo MA35D的过程当中，从概念到算法到设计，再到卡到解决方案，都和有关的客户进行了非常密切的合作。通过协作，我们希望能够确保在大多数应用场景下，都能够实现产品所体现出来的种种效益。”Gardner表示。yodednc

要实现Alveo MA35D的相关的优势，也需要通过流媒体的供应商在部署下一代应用的过程当中来实现。“在卡的层面上，我们在设计和优化的过程当中预见到Alveo MA35D会对于客户如何看待我们的解决方案产生怎样的影响。客户在部署的过程中的基础设施是固定的，比如说占地面积，处理的功耗是一定的。所以我们也对32路通道都做了优化。”Gardner表示。yodednc

“配备8张卡的1U机架式服务器可提供256个通道，以实现每服务器、每机架或每数据中心转码密度最大化。数据显示，每个通道的成本是50美元，每通道的功耗是1W。由于我们采用非常先进的编码解码器，每个通道可节省高达52%的带宽。客户在评估效率的时候主要看的是每平方占地面积的成本，以及每个通道的功耗。我们这个解决方案从价格和性能来说性价比非常显著。”yodednc

yodednc

Alveo MA35D如何实现上述卓越性能yodednc

首先，得益于Alveo MA35D新的专用视频处理单元（VPU）。在芯片四角有四个分离的支持AV1压缩标准的编码器（MP）单元模块。这使得客户在部署应用的时候，能够享受最大的灵活性。使得客户部署新的压缩标准时，可以一边用旧的标准，一边加入新的标准。在优化和开发编码器算法的时候，也要确保能够优化加速，从而使处理性能能够适应整个视频的处理过程。在现在和未来很多的应用场景中都会涉及到解码缩放和合成，所有这些都要通过Alveo MA35D的硬件加速来确保每个通道拥有最高的密度、最低的功耗和最低的成本。另外，它还叠加了人工智能和机器学习模块，通过这样的工具就能够确保在做视频处理的时候在降低比特率的同时提高视频质量。yodednc

yodednc

Gardner指出，客户希望能够以最低的成本，以及最低的每通道功耗，来实现最高的处理效率，因此Alveo MA35D对于客户来说非常有吸引力，尤其是相较于市场上其他的处理方案。下图展示了其非常先进的视频处理过程，借此即可支持未来的各种应用场景。yodednc

yodednc

所有的这些处理都是在芯片和卡上完成的，也能够确保维持最高的密度，为客户实现最高的效率和经济性。yodednc

据Gardner介绍，传统的视频处理方案，无论是在设置还是在部署上，假设的都是最糟糕的情形，也就是说，如果它能够处理所假设的最糟糕的情形，那么稍好一些的情形就不会是问题。但是这种设计或者部署最糟糕情形和条件的方法的问题是效率非常低，而且成本会很高。因此AMD在Alveo MA35D创新的过程当中，引入了人工智能分析视频的内容。再加上Alveo MA35D人工智能和机器学习的能力，就能够更好地理解视频的特点，比如视频复杂程度如何、类型如何，是合成的电脑游戏，还是一些自然的内容。yodednc

有了人工智能和机器学习获得的洞见和智能，就能以更高的效率把这种动态的内容传导给编码器。通过这样的方式就可以在做动态视频处理的时候，降低带宽和存储要求同时提高效率。yodednc

举一个晚间新闻的例子，在一般的晚间新闻当中，都会有一个主持人以大头像的形式向大家进行播音，但是在这个过程当中，可能会切换到比如说汽车赛事等体育赛事，就会产生有非常多的动态，然后再切换回主持人的画面。正如刚才所介绍的那样，当主持人主持画面的时候，人工智能就能够配置编码器，降低带宽，但是在切换到体育赛事的时候，可以进行实时的动态调整。所以创造的是高度智能动态和优化的视频处理过程，可以规模很大而功耗和成本很低。yodednc

但是，人工智能并不完美，所以在做动态调整的时候，有可能会出现一些不准确，或者是判断失误的情况。所以AMD所做的一个创新就是VQ分析IP模块。该IP模块在人工智能进行动态调整和变化的过程中，会形成一个反馈环，来确保所做的决策不是错误的。通过VQ分析可以确保视频每一帧的质量，一旦出现错误都可以及时调整。“尽管类似的方案中已经在传统的模式中得以应用，但我们仍然很高兴地看到这个方案得以在这种实时的并且是非常低时延的应用场景中实现。”Gardner补充说。yodednc

带宽的消耗对于流媒体客户来说是非常大的一项运营开支。AMD也致力于改善其编码解码器。如下图中的柱状图所示，左边为基准，低于这一条线说明有节约带宽。当然，在这个过程中，都有一个假设的标准，也就是视频的质量，是能够达到通常的水平。所以通过这些参照的对比，就可以看到AV1的编码器可以达到同等的视觉质量，但是它在带宽的节省则高达52%。yodednc

yodednc

在了解了人工智能和机器学习如何可以在视频的质量分析方面提供解决方案，现在再来看一种新的优势。下图中的两张图像都是按照同样的比特率进行的压缩，但是没有使用人工智能技术的图像有更多的瑕疵，也不那么清晰。如果这两个图像使用的都是同样的带宽，右边这张的质量就明显优于另一张。yodednc

yodednc

通过人工智能技术可以找到人脸，然后在人脸这个重点区域分配更多的比特，在其他区域减少比特的配置。在这张图中，人脸的部分就被叫做重点区域。通过人工智能我们可以得知哪些是重点区域，并且在处理的时候，配置不同的资源。这就使得客户或者是流媒体的服务供应商可以做更加激进的压缩，并且降低比特率，同时还能够保证质量。重点区域不仅仅是人脸，有时候比如文本的测试和探知也同样重要。对于一个视频来说，有一部分小字，是非常重要的，这样也就可以保证其清晰度，Gardner表示。yodednc

在做视频处理的时候，能够确保成本效益固然重要，但是最重要的是要能够使用这一技术。该平台可通过 AMD 媒体加速软件开发套件（SDK）访问，支持广泛使用的FFmpeg和Gstreamer视频框架，易于开发。有些客户有自己的框架，他们也会与AMD的媒体加速器API进行一个接口的连接。yodednc

yodednc

Alveo MA35D对于AMD的CPU和GPU并非竞品，而是补充性的产品。所有这些产品都各有所长，而且效率都非常高。CPU可以提供非常高性能的压缩。但是如果要处理的是几百万个流视频，那么经济性就不高了。如果要要求图像的呈现的应用场景的话，GPU就是最好的一个工具。也有一些应用需要三者协作来提供非常具有成本效益和高性能的解决方案。例如云电竞或云游戏，GPU尽可能多的去呈现游戏内容，Alveo MA35D完成所有的低时延高质量的编码，EPYC CPU可以完成所有的应用级的系统处理。这样的组合能够给客户提供最高的密度，同时以非常优惠的价位和很低的功耗来实现。yodednc

yodednc

下图进一步解释了EPYC CPU对于某一类型的APP是非常出色的，Alveo MA35D对于其他类型的应用是非常适用的。总的来说，软件和CPU适用于数量比较少的流视频，Alveo MA35D适用于有几百万个流视频的交互场景。yodednc

yodednc

Alveo MA35D 媒体加速器卡现已提供样品，预计在第三季度量产出货。最后，总的来说，Alveo MA35D是AMD从头研发的，针对的是大容量、交互式流媒体的优化，目的是希望无论是在资本支出还是运营支出方面都实现很高的成本效益。yodednc

yodednc

责编：Franklin

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

赵明灿

赵明灿是EDN China的产业分析师/技术编辑。他在电子行业拥有10多年的从业经验。在加入ASPENCORE之前，他曾在电源和智能电表等领域担任过4年的工程师。

进入专栏

处理器/DSP 数据中心网络/协议通信人工智能产业前沿 EDN原创

上一篇： 分析高压SiC MOSFET的鲁棒性和可靠性 下一篇： 全新低温生长工艺，在硅片上直接“长出”三原子厚晶体管

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

毫米波雷达与音频技术重塑汽车驾乘新体验汽车行业的发展正由两大创新领域主导：更为精准可靠的车内感知系统和高质量音频系统。传统方法如增加传感器或音频设备数量，虽可提升性能但会带来成本上升和复杂性增加的问题。
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC 基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
英伟达50系列显卡发布，RTX 5090D近乎“零提升”？ 1月6日的CES展会上，英伟达正式发布了备受期待的RTX 50系列显卡···
谷歌Willow芯片5分钟完成10亿亿亿年计算，突破量子纠错3 近日，谷歌宣布了其新一代量子处理器Willow的诞生，这款量子计算芯片采用105个量子比特的设计，完成了全球量子计算历史上一个难以企及的里程碑，让长达近30年的“量子纠错”难题成为过去···
打造下一代家用机器人：精心构建智能化、集成化和电源优今天的家用机器人不仅仅是工具，它们已经成为人们的生活伙伴，为日常生活增添了便利性和互动性。设计这些结构紧凑、功能强大的机器需要克服连接性、电源和外形尺寸等方面的严峻挑战，每一次突破都使我们更接近全面集成的智能家居体验···
英特尔Ultra处理器，用普通内存也能超频到10000 MT/s+？目前内存超频的世界记录是12666MT/s，而想要达成这样的频率不光需要降低CPU频率，还需要辅助液氮等特殊的冷却方案，对内存进行降温。但已有主板可以在没有特殊冷却方案的情况下，超频到10000 MT/s以上···
再拆沃尔玛的FHD流媒体棒：“UHD”和“FHD”的区别在哪？在我于2024年7月拆解沃尔玛第一代onn. Android TV 4K UHD流媒体设备的介绍中，我还提到了一个FHD“棒”，它“在我右手边的书架上排队等着拆解”，现在是时候了···
英伟达或推中国特供RTX 5090 D，硬件与5090完全相同？据外媒曝光的消息，英伟达即将推出的50系显卡也会推出专门的中国特供版本，名称为GeForce RTX 5090 D···
兆易创新推出EtherCAT®从站控制芯片，工业自动化的卓越业界领先的半导体器件供应商兆易创新GigaDevice（股票代码 603986）宣布，正式推出EtherCAT®从站控制芯片···
瑞萨率先推出采用车规3nm制程的多域融合SoC 第五代R-Car SoC为集中式E/E架构，带来面向未来的多域融合解决方案，并支持Chiplet扩展···
艾迈斯欧司朗Belago红外LED，助力Supernode打造高精度避 Supernode与艾迈斯欧司朗携手，通过Belago红外LED实现精准扫地机器人避障；得益于Belago出色的红外补光功能，使扫地机器人能够大大提升其识别物体的能力，实现精准避障；Belago点阵照明器采用迷你封装，兼容标准无铅回流工艺，适用于各种3D传感平台，包括移动设备、物联网设备和机器人。

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

下一代多对多直播场景需要新一代实况交互式流媒体解决方案