香港理工大学的研究团队搞出了个新知识数据融合框架,专门给城市排水系统的实时控制提速。这东西就是把以前那种不怎么容易处理的工程经验知识,转换成数据来喂给深度强化学习(DRL)用。 作者有Wenchong Tian、Zhiyu Zhang、Xuan Wang、Hexiang Yan、Zhenliang Liao、Kunlun Xin、Tao Tao还有Zhiguo Yuan。文章发表在《Water Research》上,时间是2025年。 这个框架的核心就是把专家的经验、现成的控制规则还有历史运行数据都通过模拟变成标准化的数据,然后用这些数据去训练DRL智能体。具体用的是近端策略优化算法(PPO)。 研究发现,用这种方式预训练出来的智能体已经掌握了基本的控制逻辑,不需要再从头开始试错了。在实际的华东地区合流制排水系统案例里,这种方法比从头学节省了90%以上的训练时间,效果非常明显。 他们还把这个方法叫作UDS-RTC,是给城市排水系统实时控制用的深度强化学习模型。框架分成了三个阶段:先把知识转化成数据,再用这些数据去监督学习预训练智能体,最后进行微调。 实验结果证明,这套系统不光训练得快,还能找到解决内涝和溢流的好办法。未来他们还想开发更自动化的知识评估方法,或者和大语言模型结合起来搞个通用的预训练库。 这个研究的亮点就是成功绕过了DRL在复杂系统里需要大量试错的问题。不过现在的框架还只是初步的,以后还要探索更多复杂的应用场景。