香港理工大学研究团队搞出了个新知识数据融合框架，专门给城市排水系统的实时控制提速。这东西就是把以前那种不怎么

香港理工大学的研究团队搞出了个新知识数据融合框架，专门给城市排水系统的实时控制提速。这东西就是把以前那种不怎么容易处理的工程经验知识，转换成数据来喂给深度强化学习（DRL）用。作者有Wenchong Tian、Zhiyu Zhang、Xuan Wang、Hexiang Yan、Zhenliang Liao、Kunlun Xin、Tao Tao还有Zhiguo Yuan。文章发表在《Water Research》上，时间是2025年。这个框架的核心就是把专家的经验、现成的控制规则还有历史运行数据都通过模拟变成标准化的数据，然后用这些数据去训练DRL智能体。具体用的是近端策略优化算法（PPO）。研究发现，用这种方式预训练出来的智能体已经掌握了基本的控制逻辑，不需要再从头开始试错了。在实际的华东地区合流制排水系统案例里，这种方法比从头学节省了90%以上的训练时间，效果非常明显。他们还把这个方法叫作UDS-RTC，是给城市排水系统实时控制用的深度强化学习模型。框架分成了三个阶段：先把知识转化成数据，再用这些数据去监督学习预训练智能体，最后进行微调。实验结果证明，这套系统不光训练得快，还能找到解决内涝和溢流的好办法。未来他们还想开发更自动化的知识评估方法，或者和大语言模型结合起来搞个通用的预训练库。这个研究的亮点就是成功绕过了DRL在复杂系统里需要大量试错的问题。不过现在的框架还只是初步的，以后还要探索更多复杂的应用场景。