今年《政府工作报告》提出,深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。
近日,南方电网2024年生产域AI算法应用竞赛(网内赛道)决赛火热进行,24支队伍同台竞技。这是全国首个覆盖输电、变电、配电、安全管理等生产领域的人工智能大赛,参赛队伍瞄准生产实际,用AI解决问题。本文走近网内赛道队伍,看看他们是如何探索释放“AI+电力”的无限潜能。
——编者
2024年生产域AI算法应用竞赛历时将近两个月,对于南方电网公司内部专注生产领域人工智能技术的选手来说,就像经历了一场既融合又互竞的盛宴,关乎人工智能与电网生产。
一开始,这只是一个比赛,要证明自己,夺得荣誉,而后变成一场大的联结盛会。大家既竞争更联结,一起为人工智能在电网生产领域的应用积蓄下一拨力量。
人工智能创新平台切实降低开发成本
“现在的模型开发没有大家想象中那么难。只要感兴趣,认真自学一段时间就能掌握。”广东电网公司湛江霞山供电局智能作业与监控班班员谢振华一直觉得,开发算法就像打一场养成类游戏,把有点儿懵懂的算法训练为成熟的模型,帮自己完成任务,很酷。
谢振华之所以认为模型开发没有那么难了,不仅因为他好学、点子多,还因为南网人工智能创新平台帮他完成了不少前期工作。
此次大赛赛题来自输电、配电、变电、综合(主要是安监)四大类应用场景,涉及人工智能技术主要是计算机视觉领域的模型搭建,隶属人工智能中深度学习(多层神经网络)。
模型搭建的核心要素是算法、算力与数据。算力考验的是软硬件能力。先说硬件,主要指的是图形处理单元(GPU)和专用人工智能加速器。硬件一般还要搭配模型开发平台,使得开发者能够利用GPU的强大计算能力。平台还要为开发者提供一套完整的工具和库,支持深度学习框架,简化人工智能模型的开发和优化过程。比如,英伟达是全球领先的GPU制造商,与之配套的是CUDA平台,PyTorch是它的深度学习框架,YOLO这样已经比较成熟的目标检测算法也基于英伟达这个生态开发。
这次比赛中开发者使用的南网人工智能创新平台也具备了完整的生态系统。该平台一体集成并能灵活调度华为、百度、商汤等算力资源,全面支持多种主流深度学习框架,比如百度的飞桨、华为的MindSpore,能够实现按需调用算力资源和快速微调,用户操作门槛、算力消耗成本更低。
“这次决赛模型都是在人工智能平台上跑,十分流畅。算力在比赛中很重要,因为同样时间里,训练次数越多,算法就会越精准。”广东电网公司机巡管理中心技术应用推广部经理刘高说。
“我们相当于站在巨人肩膀上再往前走。不是完全从零开始开发算法。只要有兴趣,花时间大家都能参与进来。”谢振华认为,人工智能平台相当于帮开发者走了很多步。
南方电网公司数字化部副总经理余芸介绍,人工智能创新平台就像是算法模型的训练工厂,融合了电力样本集、模型库、训练环境、算力资源,可面向用户提供训练、微调、部署等服务。目前平台已完成百亿规模参数大模型训练验证,模型学习效果良好,部分指标已达到甚至超过了国际水平。
数据即核心,行业知识愈发重要
算力之外,最核心的还是数据。它决定着模型智商水平。如同人类的知识教育输入一样,输入高质量的知识,相对而言就能产出高质量的认知。除此之外,训练方法至关重要。同一组数据,先选择哪部分训练,结果大不同。然后便是算法开发。
广东电网公司江门供电局信息安全运维班员陈泽鸿认为比赛中数据收集很重要,不仅是编程。“样本量越大,训练次数越多,算法越聪明。反倒是算法,大家基本都是围绕深度神经网络、注意力机制、人工调优等基础算法上优化模型结构或局部算法。”
也是这个原因,在广东电网机巡管理中心的算法开发团队中,有一个人物不得不提——林俊省。他曾在广东输变电公司干了十几年线路运维,飞过无人机,也在直升机上巡过无数次线路,后来被广东电网机巡管理中心招入麾下。
“算法一定是要和业务知识深入融合,必须保证它在现场业务需求、图像标注、核心逻辑设计、算法编程各个环节的一致准确性。”刘高最想强调的仍然是样本标注。看上去最没有技术含量,实则不然。
广东电网公司机巡管理中心总结提炼了人工智能标注五边形决策机制,算法标准必须要由技术推广专责、算法工程师、业务专责、一线作业班长(生产一线工作5年以上的班组长)、标注人员共同制定。人工智能算法自动提取特征前的环节,五人小组要反复深入研讨,用现场运维经验结合缺陷隐患等级判定逻辑,人工归纳出缺陷隐患的本质特征,形成主要标注特征区域,减少返工。
这种标注逻辑也获得来自广西电网公司数智运营中心数据管理科组长董赟的赞同。“算法一定是业务与技术两个逻辑的双重融合。业务不是单纯提需求,算法工程师也不能只闷头开发。必须要把一线生产经验变成算法语言,教会给机器。”
对此深有感受的还有综合、变电赛道的一些队伍。广东电网公司惠州惠阳供电局生产计划部生产指挥中心副班长郭艳婷进入决赛后,在深圳跑了两天模型,就赶紧返回惠州做数据。“综合赛道图片量很少。很多时候我们只能摆拍,再以图生图等各种方式生成样本图。”
变电赛道,来自广东电网公司汕头供电局的杨秋强也是如此。决赛阶段,有几天他为了收集样本,白天忙生产,晚上下了班就开始找图片,“我们赛题和变压器设备漏油相关,没有电力知识积累根本不可能。因为你要先从一堆图片里判断出有没有漏油,才能和标注人员一起把这个知识传递给人工智能。”
和网外团队相比较,网内队伍的优势也在此。数据质量更高,行业知识多,让同台竞技的网内队伍并不弱于网外专业的算法开发团队。
复合型人才将发挥重要作用
联结是人工智能深度学习中的一个重要关键词。也是这次人工智能竞赛中网内队伍的一个关键特点。
董赟介绍,广西电网公司在人员安排上特别从各个地市局抽调了刚刚毕业1—2年的年轻员工。“或许他们的算法开发不是最优秀的,但是可以借着这个机会让大家都参与进来。”
还有一人就拉起一支队伍的王洋,来自南网资本控股公司。初赛时,他的队伍一度名列前茅,给广东、广西电网机巡管理中心小伙伴留下深刻印象。刘高说,“尤其他看上去完全没有生产背景,却在配电赛道杀出一条血路。”后来大家才知道,王洋2023年从上海交通大学计算机专业毕业,入企培训时结识了广州从化供电局的小伙伴。这次他做算法,从化供电局提供样本、样本标注、电力知识。虽然王洋止步决赛前,仍然成为众人口中的传奇人物。
综合赛道中,汕头供电局则联合了海南电网公司海口供电局。其中一个关键人物是许轩博,他与吴坤聪曾经是同学,所以有了这次两家供电局之间的联合。南网超高压公司广州局、梧州局也合力打比赛。郭艳婷在比赛中则寻找到武汉大学就读时的导师,不时请教问题。谢振华拉来了刚刚毕业马上要入职南网数研院的师弟冼梓康。校友、同事、共同参加过培训都成为这次联结的关键词。
南方电网公司输配电部副总经理章彬认为,这说明随着近几年人工智能技术在电网领域的应用,南方电网公司生产领域已经积累起了一批懂算法又有电网知识的年轻人。
“复合型人工智能人才非常重要。未来,他可以成为人工智能体与生产应用场景之间的桥梁和翻译者。”本次竞赛不仅增进了电网企业与外部科技企业、高校间交流互动,也成为南方电网公司内部培养和选拔人才的平台,给大家提供了技术交流和思想碰撞的机会。
龙树燏和董赟分别属于生产口、信息口,两人不约而同提到,比赛成为一个沟通的渠道。龙树燏认为,“算法能解放生产力,但要实现这个目的必须贴合生产。我参加完这个比赛,完全可以充当中间者。”
比赛也凸显了平台和环境对人工智能技术发展至关重要。广东电网公司无人机应用早,生产领域产生的数据量大,对人工智能技术识别缺陷的需求强烈,使得他们在人工智能技术方面底子厚。这次人工智能竞赛,广东电网公司几乎每个地市局都派出了参赛队伍,其中不乏汕头供电局、湛江供电局这样的地市局,甚至还有惠州惠阳供电局这样的县局。
刘高认为,这和广东电网机巡中心常态化开展模型开发有关。“虽然这些人绝大部分都不是专职,但是大量开发需求为内部人才提供了实战机会。”他组建的“星星之火可以燎原”公司内部群,已经聚集了广东电网130多名既懂生产一线又懂模型开发的人才。“有时候一个供电局只要有那么一两个关键的年轻人,就能拉起一支队伍。企业不乏人才,我们自己是可以的。”这是刘高的肺腑之言。
广西电网公司则有他们的特点。南方电网公司开发的大瓦特输电大模型最早部署在了广西,让广西电网公司地市供电局一线人员很早看到人工智能的能量。同样蓄积力量的还有贵州电网公司。“去年我们成立了智能作业中心,也在整合人工智能这方面的业务。目前我们开发的算法,最主要的还是走人工智能创新平台这条通道。”贵州电网公司智能作业中心智能配电管理三级专责陈开雷说。
南方电网人工智能公司平台技术事业部经理郑桦介绍,2023年9月,人工智能创新平台对外发布以来,内部已上线了上千个模型,其中上百个模型使用率非常高。采访中,许多一线人员反映鸟巢识别等模型准确率很高。
但是也必须承认,模型开发仍有很长的路要走。计算机视觉领域的人工智能技术与调度、客服很不一样。它非常依赖数据与算法。像南网超高压公司运管的电网资产不论电压等级还是标准与省公司不同,即使省公司之间生成的数据内容尤其是视觉图片,在人工智能那里也大不同。
“这就需要我们丰富数据资源,同时对算法不断迭代。”郑桦说,“聚集更多网内网外算法开发的力量,让人工智能技术在生产领域释放出更大的潜能。”
南网报记者 刘杰
标签:AI