工业4.0的新数据技术,正在涌入现实生活,也有望给核电站和核项目带来创新。它已经在加速退役中寻求发挥作用。杰里米·戈登(Jeremy Gordon)是美国Fluent in Energy通信咨询公司董事,采访了Assystem首席技术官罗伯特·普拉纳(Robert Plana),讲述了他们公司到目前为止的一些经验。文章的标题很有震撼力:“数据就是力量”(Data is Power)。[1]
罗伯特·普拉那(Robert Plana),Assystem首席技术官
工业4.0指未来的工作环境具有全部数据流动性和透明度;装置的构件收集的数据与其运行有关并相互共享。即使在今天,据IBM估计[2],一个典型的制造厂每天产生1TB(1万亿字节)数据,但是只有1%的数据被分析过。未来,数据量肯定会激增,而使用人工智能(AI)及其机器学习(ML)技术[3]的更高级分析,将发现越来越多的角色,帮助管理者理解它。将这一概念发挥到极致,某些工厂甚至会看到,自动化装置的部件,与它们来自供应和分配链的数据集成之间的分布式决策。现场的工人在他们需要时,将能得到他们所需要的确切信息,并能及时优化他们的工作安排。
对于许多行业,这些新技术整合的累积将会产生革命性的影响,但对核工业可能不那么重要。虽然核电厂长期以来到处都是连续记录数据的传感器,但监管环境不利于数据本身在共享、处理和使用方面的快速创新。在这一点上,对于核工业,工业4.0非常具有挑战性,特别是运行中的核电厂。安全的需求限制了运行数据的传播,因此很难证明对与安全和安保相关的系统进行任何更新改造是合理的。据世界核安全研究所说,“信息技术和运行技术的收敛(融合)是不可避免的,随之而来的是重大机遇和风险”,而且进入2020年代,仍然不能解决和界定这个问题。
专家智能
对于核工业,虽然以传感器为主导的数字革命还没有到来,但可以利用已有的大量结构型的数据信息。罗伯特·普拉那(Robert Plana)是Assystem[4]的首席技术官,他解释了该公司采取的某些办法。
通常在AI和ML应用程序中,最好的业绩来自用大量数据集培训新应用程序之后,有时数据来自多个领域的几个来源。尽管核工业的安保限制,这种方法不实现,但Plana和Assystem的另一种选择是独立创建专家系统,其中所有数据都归客户所有,而且任何时间都在客户的控制之下。没有大量的培训数据,公司通常用客户80%的实时数据用于培训,20%用于试验。Plana说,学习系统的潜在绩效可能有损失,但可借助输入数据的严谨性和专家在编码方面的知识加以弥补。
Assystem 为了支持法国即将进行的退役项目,基于数千份纸质存档文件创建了个特定的搜索引擎。这个过程的说明见下图。
建立先进搜索引擎的过程
第一阶段是扫描它们并使用光学字符识别,将其转换为机器可读的形式。然后,把它们分类,并提供完整的搜索。
接下来,该团队建立一机器学习(Machine Learning),研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。本体(ontology)[5],也就是基于文本中明显的词汇和关系的主题领域的“地图”,进一步为搜索提供信息。
当然,装置和监管文件中高度结构化的信息为这此奠定良好的基础,但对于Plana,最好的起点有时是表格。
他说,“工程师们非常有条理,他们在表格中总结重要的数字”。他解释说,文档通常是分解的、分别处理的纯文本、词汇表和表格。分析之后,机器可能建议从数据表开始,但工程师总是会指导和调整这个过程。
为了补足退役文件和本体,增加了一套20,000个‘问答’,是对编码有价值的制度性的知识。Plana说,“我把这称为公司的数字遗产”。“如果把专家的知识,最常见的问题,和深度学习技术结合起来,就能建立一个非常智能的搜索引擎”。通过这种方式,一个相对较小的数据输入,48GB(480亿字节)的文档,创建了一个强大的、主题特定的知识工具,包括一个网址目录数据库。
最后阶段是添加自然语言接口。工程师们可以通过一些问题,调查异常情况及其意义,比如“能识别A反应堆厂房内的放射性物资吗?”或“能把文件中列出的放射性水平与拆除小组开始在现场作业时测量的水平进行比较吗?”
Plana说,这个系统“可以在几秒钟内检索到需要一周才能采集到的信息”。
数字孪生[5]
详细了解一个设施的精确状态,对制定其退役计划至关重要。只有从完整的画面开始,才能正确限定团队的规模、所需的工具和工艺,以及进度安排和成本。为实现这一点,数字孪生必须包括装置的原理图和部件,直到最小的部件,包括描述部件及其维修的所有文档。
目前,许多即将退役的设施只有平面图纸和说明书,通常是设施的设计和后来的更新改造。然而,最重要是还要记住,没有任何设施是真正按照设计建成的。真要把某些东西用螺丝“钉”在墙上,总会有小问题并做了优化。Plana说,“数字孪生创造两者之间移动的环境”。
协调所有这些设计信息的第一步,是对设施进行三维激光扫描,以获得其当前的“拓扑结构”(topology)[7]。然后就有可能继续进行所谓的“Build4D”:核查随着时间推移发生行动的空间概念,例如安装新的大型部件。除了模拟主要任务的程序,Build4D还能够管理设施中的“协同收缩”(coactivity):避免两个团队同时进入同一空间,或安全或保安限制现场人数,发生冲突。如果一个专业团队不能在某一天完成其工作,就不能保证第二天还有人员或工具。这种简单的“协同收缩”冲突,可能很快地使项目偏离计划安排。
可以借助任务完成时获得的知识,进行调度。例如,如果OEM[8]信息显示需要3天时间来移除某个部件,但实际上通常需要4天,那么就可用这个结果对整个模型进行更新。
Plana说,“拥有的数据越多,模型就越能代表现实,就能更精确地描述项目竣工的状态”。
已经证实,在优化法国核电群停堆大修管理方面,Build4D也很有帮助。
以AI和ML为代表的IT技术对几乎所有传统行业的技术发展和管理概念都带来革命性的影响,有挑战也有机遇。要传统行业的技术人员都懂得这些技术是不现实的,但学习、拥有大数据相关技术将迎来职业的新发展。Plana对核工业、特别是核电站采用这样的技术非常期待。中国核工业应当及时了解国内外在这方面的进展,借助有实力有经验的IT 公司改造和优化我们的管理。
参考资料与注释:
1. Jeremy Gordon,Data is power,NEI,30 July 2020。
2. IBM,Internatial Business Machines Corporation,国际商业机器公司或万国商业机器公司,总公司在纽约州阿蒙克市,是全球最大的信息技术和业务解决方案公司。
3. AI:Artificial Intelligence,人工智能,指由人制造出来的机器所表现出来的智能。通常指通过普通计算机程序,呈现人类智能的技术。该词也指出研究这样的智能系统是否能够实现,以及如何实现。
ML:machine learning ,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
4. Assystem,欧洲最大的工程技术服务公司,独立的工程集团,为能源、核能、建筑、交通、工业和生命科学领域的客户提供服务。它在上海设有分公司,称“艾西斯腾技术咨询公司”。
5. 本体(ontology):在计算机领域的语义和知识层面上描述领域概念的建模工具,其目标是捕获相关领域的知识,确定该领域对给定地点的地形研究(特别是地形所显示的地点历史)。
6. Digital twinning,数字孪生:是一种云部署的软件模型,表示基于传感器安装数据或系统生成数据的物理机器或对象,或服务流程。数字孪生可分为零件孪生、产品孪生、工艺孪生和系统孪生四种类型。它使制造商免除物理原型新产品的想法。在创建产品、流程或系统之前,可能尝试每个功能、测试每个细微差别或消除每个故障。
7. 拓扑结构(topology):可以指通信网络的配置,或对给定地点的地形研究(特别是地形所显示的地点历史。
8. OEM,Original Entrusted Manufacture,原始委托生产者,OEM产品未必和原厂产品质量相同。