“广东电网公司积累的经营、管理和电网运行数据总量已超过2000TB,并仍以每年20%的速度快速增长,数据资产覆盖到营销、资产、生产等核心业务系统数据及企业外部数据,数据类型覆盖了结构化、非结构化数据及实时流数据,存在对数据的实时性处理速度快的数据应用需求场景,对于负荷预测、网架优化等分析结果要保证一定的准确性……总体来说具备大数据5V,即大体量(Volume)、多样性(Variety)、时效性(Velocity)、准确性(Veracity)、大价值(Value)的特征。”广东电网公司信息中心副主任徐晖介绍道。2016年年底,广东电网公司大数据平台初步建成,电力大数据的挖掘与应用从此踏上了新的征程。
影响悄然发生
在大数据平台建成以前,广东电网公司已经开始了对于电力大数据的研究和应用。2015年,为了进一步挖掘电力数据背后的价值并更好地利用大数据促进电网发展,广东电网公司在信息中心成立了数据应用部。据徐晖介绍,几年来,利用数据驱动的分析方法和知识发现方法,广东电网公司进行了多种大数据应用。如针对全方位客户服务,开展了全省居民和非居民客户的细分、客户服务渠道分析、95598话务量预测及排班优化等主题建设。针对资产全生命周期管理,开展了资产信息360全景展示、工程造价分析、省市县三级的物资需求预测等主题建设。针对安全生产管理业务,开展了设备分析、缺陷分析和生产管理看板等。
在众多的大数据运用中,电力景气指数是基于用电信息和相关宏观经济数据等经济体发展前瞻性指标,可以有效地对短期经济趋势进行预测。广东电网公司信息中心数据应用部数据分析及应用专责江疆说,电力景气指数每个季度通过综合分析用电量、新装报装容量、新装用户数等电力相关数据,结合生产、消费、投资、贸易、金融等宏观经济数据,构建电力景气指数模型,预测受电力影响较大的产业与行业经济增速及发展趋势。
“电力景气指数包括广东省及四大区域指数、21个地市子指数、三大产业指数、五大重点行业指数,能够更准确地把握与用电紧密相关的产业及行业经济走势、电力需求趋势,为公司客户管理、电网建设、投资决策、运行管理等决策提供科学依据。”江疆说。
在电力领域证明自己
“大数据平台的建成为电力大数据的挖掘与应用提供了更多可能性,让人能够真真切切地感受到大数据带来的颠覆性变革。”广东电网公司信息中心数据应用部部长黄剑文说。
2016年,基于大数据平台广东电网公司做了更多尝试。其中,模拟全省费控计算的测试让所有人见证了电力大数据的强大。这次测试是假设全省统一使用费控装置的情况下,对全省2500万居民用户开展基于大数据技术的居民电费计算。黄剑文介绍,费控对资源的需求已经远远超出了营销系统电费计算相关的设计能力,营销系统平均每天计算250万户左右,费控每天需要计算3000万户,为现有能力的10多倍。营销系统电费计算每月1次,每天允许算12小时,8天完成电费计算,而费控需每天计算。现有电费计算的过程从抄表初始化至电费计算完成共计需约120小时,而费控需要完整的过程在4小时内。
通过测试,技术人员运用大数据手段在40分钟内完成全省2500万居民的电费计算,远少于业务要求的时间4小时,而计算的准确率超过99.95%。“测试验证了大数据平台技术对电量电费计算功能的支持能力,验证了基于大数据技术实现费控功能的可行性、可靠性。”黄剑文说。
未来无限可能
大数据在电力领域的应用最终都是要提供服务,帮助企业创造更多的价值。为了让大数据技术能够发挥更大的作用,广东电网公司在大数据平台建成之初就重点为省、地各单位数据应用相关人员提供分析工具和各类数据服务,电力数据沙箱就是其中一个。电力数据沙箱是为电网数据分析人员提供的包含基础数据和数据分析工具的一站式数据分析探索容器。广东电网公司信息中心数据架构管理代理组长彭泽武说,我们可以把它理解为一个盒子,每个盒子里面都存放着数据和处理数据的工具,盒子和盒子之间是相互隔离的,大家做数据分析处理互不影响。电力数据沙箱为数据分析带来了多种便利,如果没有它,每个数据分析人员就要自己抽取要分析的数据、准备分析工具,繁琐程度可想而知。
彭泽武介绍,今年,广东电网公司将进一步丰富大数据平台的功能,如补充更多好用的数据分析工具。此外还将制定数据地图,让每个数据分析人员能够知道有什么样的数据、存放在什么位置等,以便更好地分析和应用。
“大数据在电力领域还有很大的发展空间,我们才刚刚起步。”徐晖说。去年10月,广东电网公司发布了《电力大数据应用能力发展规划》,提出了数据管理能力建设初步建成、全面推进、深化应用的三个阶段,目标是逐步实现从满足地市局的数据分析需求到省级大数据应用,直至最终为社会提供增值服务,实现电力数据资产变现,完成数据管理能力和业务能力的提升,具备省级电网企业提供全方位支撑的能力,真正实现为公司创造新的价值增长点。
徐晖说,尽管在行业内广东电网公司的大数据发展处于领先水平,但与其他行业比较我们起步较晚,水平相对落后。我们要尽快建立起统一的数据服务中心,并依靠开放共享的大数据平台,打造集数据集中、接口完善、应用多元、服务高效的数据应用生态圈。