“刘元玮”教授的肺腑之言
之所以持续从事 AI in 6G 方面的研究,是因为现代通信系统需要优化的参数和系统指标非常多,系统关切的指标会随着场景、用户的改变而变化。而 AI 技术可以同时优化多项参数,并且针对具体场景、结合用户的行为规律进行预测,最终做出智能决策。相较于传统算法能搞好地适应场景的快速变化,基于 AI 的通信系统将更适用于车联网、高铁通信、室内通信等新场景。
通信系统的智能化是目前学术界和工业界普遍看好的大趋势。然而,AI in 6G 的研发也面临重重的挑战,例如:
(1)通信系统中的用户调度,资源分配等问题要求我们设计高维离散优化方法;
(2)对于深度学习在通信中的应用,训练和测试数据集合的获取和构建也成为了一大挑战,需要考虑数据的时效性、一致性、以及训练复杂度。相比于深度学习,深度强化学习对数据的依赖程度较低,是一种适合在通信系统中应用的解决方案;
(3)由于通信系统自身的复杂度较高,待优化变量较多,且通信系统对算法和决策的时延非常敏感,AI 算法的处理速度可能难以应对用户对实时性的要求;
(4)统一的测试环境和指标。AI+6G 的研究缺乏像 CV、NLP 等领域中的标准化测试环境。
为了促进该领域的发展,刘元玮团队正基于 OpenAI 的标准化 API 构建深度强化学习环境,平台将在不久的将来开源共享。
目前,他们正大力推进以下两个方面的研究:(1)AI for NGMA(Next Generation Multiple Access),即通过 AI 技术满足无线通信场景下的一些需求;(2)NGMA for AI,即通过资源分配等设计,满足分布式人工智能计算对于时延等指标的要求。
笑对疫情,探索 STAR
“在新冠肺炎疫情爆发之初,伦敦很快就进入了封城状态,学校、餐厅等公共设施普遍都被封闭了起来,人们的生活一时间慢了下来。” 回忆起那段经历,刘元玮感慨万千。
起初,他的工作受到了相当程度的影响,由于在家会受到一些生活琐事的干扰,很难保持亢奋的工作状态,工作效率直线下降。面对这种情况,他及时做出了调整,强迫自己将工作和生活分开,通过出门散步调整心态。
渐渐地,他发现从另一个角度来看,疫情之后的工作模式也产生了一些积极的变化。对于教职人员来说,原先的一些招生、开会、作报告、社交等杂事占用的时间变少了,反而留给研究的时间变多了,每天都有时间可以打开 arxiv 跟进最新的研究进展。也正是在此时,他可以查阅大量文献,着手大力推进 STAR 项目,静下心来研究电磁、物理、麦克斯韦方程组,对研究中的“硬骨头”发起攻关。
6G 通信的无线接入部分被广泛认为需要在原理和范式上取得革命性进步。在诸多候选技术中,RIS 及其营造的智能电磁环境获得了大量专家学者的青睐。简而言之,在传统观念中,电磁波等无线信号的传播环境被认为是不可控的。幸而,RIS 技术的出现使得我们可以在无线信号传播的路径中实现对电磁波的控制。
然而,传统的 RIS 大多只支持对信号的反射。刘元玮团队受到玻璃对光的部分反射、部分透射的启发,提出了融合反射和透射于一体的智能超表面(Simultaneously Transmitting And Reflecting Surface,STARS)。在硬件层面的实现上,刘元玮团队考虑使用“块阵列“和“超材料”两种方法实现 STARS。
就 STARS 的控制而言,STARS 需要同时考虑每个单元折射和反射信号的控制,于是 STARS 的控制相比传统 RIS 更加复杂。每个 STARS 阵元需要具备独立可调的表面电、磁阻抗,这样,每个单元中的面电流强度(对应电阻抗)和涡旋电流强度(对应磁阻抗)才可以被改变,从而人为的控制其产生的反射和透射信号的幅值与相位,对无线信号的传播环境进行“人工配置”。
然而,由于用户的移动和外部自然传播条件的不断变化,如何智能地根据当前的自然传播条件和用户分布智能地控制 STARS 成为了决定系统性能优劣的重要因素。针对这一问题,刘元玮团队提出了多种基于机器学习算法(强化学习、深度学习、元学习等)的智能控制方案。
之所以选择使用强化学习技术进行 STAR 的智能控制,是因为强化学习对于训练集的依赖程度较低,天然地适用于通信系统中的决策与控制问题。为此,刘元玮团队设计了两种方案:
(1)在多个基站进行采样,制作数据集,训练强化学习智能体;
(2)每一个智能体周围的传播环境较为稳定,使用自己基站的历史数据训练。
奖励函数是强化学习的“指挥棒”,设计奖励函数需要考虑的衡量通信系统性能的指标很多,比如速率、能量效率、时延等。在设计强化学习奖励函数时,需要根据具体场景进行分析,确定各指标的系数,在保证有效性的同时,使优化难度可接受,训练可收敛。
另外,为了训练能够通用于不同基站的人工智能代理,刘元玮团队提出了元学习方案。通俗地讲,元学习本质上是教会机器如何学习。在基于元强化学习的通信场景下,不再需要针对单一的样本来训练智能体,而是需要通过迁移学习在通信系统中训练具有普适性的智能体。这种新兴方案可以充分利用基站之间存在的相似性,从而通过知识迁移降低训练的时间和成本。
STARS 具有非常广泛的应用场景,比如在 STAR: Simultaneous Transmission and Reflection for 360° Coverage by Intelligent Surfaces 中所列举的 STARS-NOMA 蜂窝网络,工业通信场景,室内/室外信号增强以及海上通信等诸多应用场景。例如:
(1)从室外到室内的信号连接是一个重要的通信问题,通过把 STARS 安装在窗户上可以有效增强室外到室内信号的传输质量,尤其是对于高频段的毫米波/太赫兹信号;
(2)在通信感知一体化任务中,STARS 可以有效增加信号维度,以便于利用信号完成识别,感知等任务;
(3)STARS 还可以被用于增强通信的物理层安全,通过增强目标用户和发射机之间的信道,可以允许发射机使用较小的发射功率,从而有效降低信号被非合作用户窃听的风险。
6G 与后疫情时代
在后疫情时代,网络通信技术的重要性更加凸显了出来,越来越复杂的网络交互场景对 6G 技术的发展提出了要求。以学术交流为例,越来越多的报告、演讲、授课活动,甚至学术会议都以 Zoom、腾讯会议等形式进行,从线下物理空间走向了线上空间,提高了交流的效率,拓宽了知识传播的受众,使沟通的渠道更加畅通。
此外,就医疗行业而言,6G 、数字孪生、通感一体化等技术将推动值回病房、家庭医生问诊、数字病房、数字床位等概念的落地。未来,数字医疗领域将会呈现井喷式的增长。
值得一提的是,跨学科交叉研究对来自不同学科背景的研究人员的合作效率提出了很高的要求。以 IT+医疗为例,刘元玮指出:在与医疗机构的合作伙伴合作的过程中,需要以具体的工作为载体,让研究机构和医疗机构的合作者在工作中增进对各自领域的熟悉程度,互利共赢。
精品论文?有三个特质
精品论文往往具备 3 个特质:
(1)选题简洁而明确。2016 年,他发表了自己第一篇 IEEE JSAC 论文 Cooperative Non-orthogonal Multiple Access With Simultaneous Wireless Information and Power Transfer。在该论文中,他基于随机几何理论提出了一种环形模型,十分简洁明了。该模型是一项基础性的研究,随后被 NOMA、UAV认知无线电等领域的工作大量引用。
(2)具有较大的数学贡献。他于 2017 年发在 IEEE TWC 上发表了一篇题为 Enhancing the Physical Layer Security of Non-orthogonal Multiple Access in Large-scale Networks 的论文。其中,刘元玮推导出来了一种新的数学分布,可以被应用于 NOMA、物理层安全等多个领域,具有很强的普适性。
(3)文章叙述与表达精辟。2017 年,他与英国皇家科学院院士 Lajos Hanzo 合著了一篇题为 Nonorthogonal Multiple Access for 5G and Beyond 的论文,该论文被发表在 Proceeding of IEEE 上。论文撰写期间,Lajos Hanzo 院士花费了大量精力修改论文引言部分,将其视为艺术品仔细雕琢,达到了娓娓道来的效果。
快乐科研,高效比勤奋更重要
刘元玮一直对自己的学生倡导“快乐科研”的理念。他认为,研究者应该对研究感兴趣(be interested in the research),对自己的研究充满信心(be confident in the research),最终为自己的研究而自豪(be proud of the research)。
为了释放压力,研究者们可以培养自己的一些兴趣爱好,比如健身、跑步、艺术鉴赏。体育运动可以让研究者拥有健康的体魄,这对于可持续的科研工作十分重要。在伦敦这样的大都市里,公园、剧院、博物馆等公共设施可以为研究者们提供丰富的业余生活,做到劳逸结合。