长期以来,可控核聚变作为一种缓解全球能源危机的重要潜在路径,无数的科学家在对其进行研究和探索,其中磁性约束托卡马克装置是可控核聚变的一个重要研究方向,其核心技术难题就是如何让托卡马克装置中的高温等离子体实现可控、精准地放电。而随着人工智能技术,特别是强化学习(RL)的飞速发展,我们也许离核聚变的实际应用更近了一步。
对于托卡马克装置的运行来说反馈控制至关重要,控制系统会主动管理磁线圈,以控制稳定细长的离子体,防止破坏性的垂直事件发生。传统的控制系统依赖于预先计算的前馈线圈电流和反馈回路,这些都必须从磁性测量中实时估算,尤其是等离子体的形状,必须使用平衡重构代码进行实时估算。这种方式不但很有挑战性而且耗时,特别是针对新型等离子体。
而就在近日,谷歌的DeepMind团队发表的最新研究成果,改进了其之前的架构和算法,不仅通过实验模拟将等离子体形状的精度提高了65%,同时降低了电流稳态误差,还让新任务学习所需的训练时间实现3倍及以上的减少。
去年DeepMind宣称,经过3年的秘密研发,首次成功用AI控制托卡马克装置内部的等离子体,该成果还登上了《Nature》。但是这个成果并不完善,由于强化学习的诸多缺点,影响了控制托卡马克等离子体的效果,而这次研究团队在原有成果的基础上更进一步,攻克了其中三方面的难题:
这些技术的使用大大缩短了训练时间,提高了控制精确度,从而使RL成为等离子体控制的常规可用技术取得了长足进步,从实质上加速了可控核聚变的到来。