2024年4月12日发(作者:)
科技创新导报
2022NO.6
ScienceandTechnologyInnovationHerald
能源与环境工程
DOI:10.16660/.1674-098X.2202-5640-8222
电网知识图谱的构建
马娇玉
(积成电子股份有限公司山东济宁272000)
摘要:在新时期发展背景下,电网知识增长速度不断加快,各类企业对于该领域的知识管理和需求量也越
来越大。为了进一步展现出良好的电网知识作业,为相关企业提供便利,电网知识图谱的构建也成为了当前
发展的核心。再者,对于电网企业来说,在基础知识和实践经验中构建的理论图谱应用和探索相对落后,而
在对网络知识图谱的理念研究中,可结合电网业务现状及相关数据结构,构建电网知识图谱。构建电网知识
图谱可提高电网大数据可视化水平,降低电网业务的理解难度与查询效率。此外,可通过知识推理,产生新
的知识网络体系。
关键词:电网业务数据知识图谱
中图分类号:TM73文献标识码:A文章编号:1674-098X(2022)02(c)-0106-03
从知识图谱的定义角度分析,其在图书情报领域
又被看作是知识领域的映射和可视化地图,同时,通过
知识图谱,也能够直观地呈现出知识结构与发展状态
中的图形,基于可视化技术对知识资源及载体的描述,
能够清晰地找到并呈现二者之间存在的关系。本实验
中使用了Neo4j数据库,来实现知识库结构的形成与利
[1]
用。通过数据库语句,根据关键字段来完成知识网
络,提取mysql的半结构化数据,创建出实体、关系、属
性等要素。实现知识有效融合,能够摆脱实体与关系,
从而实现数据实时更新,构建良好的知识库结构,而知
识推理的意义在于对当前知识库进行深入的知识挖
掘,形成新的知识网络,丰富知识库内容。
知识图谱的主要作用是将多个独立的知识进行连
接,形成一张知识网络,从而可以完成信息的结构化、
统一化,也要依照现有的电网知识库实现隐晦知识的
进一步挖掘,形成新的知识网络。
1电网知识图谱的研发历程
1.1第一阶段——设计
下文主要探索知识图谱的概念与构建电网知识图
谱的意义,选取福建的电网数据进行分析。通过对福
建地区的数据进行研究,提炼出电网关系结构图,详见
图1,并将其作为电网知识图谱创建的重要参考。
电网知识图谱的平台采用了传统B/S的模式(见
图2),本文会详细介绍开发细节。
1.2第二阶段——持久化层
使用NOSQL图形数据库Neo4j,将其方法用于电
网知识图谱的数据库工具,来完成电网知识图谱的持
久化。以福建地区知识图谱为例,详见图3。
Neo4j具有高性能特点,利用NOSQL图形数据库可
以将结构化数据存储到网络中,其作为一种嵌入式的系
统,通过磁盘来可以提高事务处理特性,构建Java持久
[2]
化引擎,然而对于机构化数据在网络(从数学角度叫
做图)中的存储,并不是将数据存储于表内。Neo4j又被
称为高性能引擎,通过这一引擎,可以满足成熟数据库
应用需求,同时,程序员作为面向对象和灵活的网络结
构,也能够表现出静态与严格的特点,然而这些特点都
能够享受事务特性,也带来企业级数据库的优势。
Neo4j数据库中的label同等于关系型数据库中的
表,其中的每一个实体同等于关系型数据库中的一行
数据。
数据导入阶段,将福建电网的相关数据添加到
Neo4j数据库,并自动生成关系,具体数据导入语句模板:
USINGPERIODICCOMMIT100LOADCSVFROM
"文件路径"AS句柄merge(对象:标签名{对象.属性0:句
柄[0],对象.属性1:句[1],......{对象.属性n:句柄[n]})。
1.2.1USINGPERIODICCOMMIT100
在LOADCSV前面加上USINGPERIODICCOMMIT
1000,1000表示每1000行的数据进行一次Transaction提
交,提升性能。
1.2.2WITHHEADERS
从文件中读取第一行作为参数名,只有在使用了
该参数后,才可以使用“对象.属性”这样的表示方式,
否则需使用line[0]的表示方式。
具体自动创建关系语句模板:
作者简介:马娇玉(1987—),女,本科,工程师,研究方向为云计算、大数据、人工智能、物联网、区块链等数字技术
在电力工程中的应用。
106
科技创新导报ScienceandTechnologyInnovationHerald
能源与环境工程
2022NO.6
ScienceandTechnologyInnovationHerald
科技创新导报
图1电网关系结构图
图2电网知识图谱数据流结构图
关系自动创建,以半自动形成电网知识图谱。
1.3第三阶段——可视化层
使用Vue+Element完成基本界面的搭建:(1)在页
面script标签中引入等库;(2)使用Echarts对知
识图进行图形可视化展示操作首先引用Echarts的组
件,然后引用其Graph进行画图操作。
1.4第四阶段——部署
(1)平台使用.jar文件,使用JDK进行启动。(2)前
端vue文件部署在Tomcat服务器上,使用同Tomcat进
行启动。
2电网知识图谱详细功能简要介绍
2.1知识创建
以电网调控知识源为核心,建立电网调度运行专
业词库,综合采用命名本体实体识别、句法分析、语义
分析等自然语言处理方法,系统支持抽取数据源信息
中的实体(概念)、属性以及实体关系。抽取时,根据已
有电网模型信息构造,包含省调、地调、县调、厂站、设
备、电压等级、设备属性及量测数据统计信息的网络层
[3]
次知识。例如,可以按地区与厂站、厂站与母线等具
有关联关系,厂站本身也有很多相关的属性,这些都能
够在词库的实体属性中具体展现。
USINGPERIODICCOMMIT1000LOADCSV
FROM"文件路径"AS句柄merge(对象:标签名{对象.
属性0:句柄[0],对象.属性1:句[1],......{对象.属性
n:句柄[n]})。
科技创新导报ScienceandTechnologyInnovationHerald
图3福建电网知识图谱自动成图
Match(a:标签1),(b:标签2)wherea.属性=b.属性
merge(b)-[r:关系]->(a)。
通过此方式,来完成电网只是图谱的实体导入与
107
科技创新导报
2022NO.6
ScienceandTechnologyInnovationHerald
上述语句详细解释。
2.1.1USINGPERIODICCOMMIT1000
1000
提交,
,
在
1000
LOAD
表示每
CSV前面加上
1000行的数据进行一次
USINGPERIODIC
Transaction
COMMIT
2.1.2
提升性能。
从文件中读取第一行作为参数名,
WITHHEADERS
只有在使用了
该参数后,才可以使用这样的表示方式,否
则需使用
2.1.3
line[0]的表示方式。
整个数据表是以行的形式进行提交的,
ASline
每行提交
为一个实体。
2.1.4
使用MERGE
MERGE
实现创建,会自动取消创建重复的实
体以及关系。在导入时,MERGE子句在已经存在各个
标签、属性、属性值与当前MERGE后面描述的节点完
全相同的情况下不会重复创建多余节点。所以,要先
整理数据源,保证csv中的每条数据相同的节点要完全
相同。
2.2知识消减
系统可以消除电网知识图谱中的重复概念关系,
及时清理冗余及错误的实体关系,保证知识图谱结构
的准确性,可以使用Echarts完成知识图谱的数据可
视化
[4]
。
2.3知识推理
知识推理作为关键环节,可以根据现有电网业务
逻辑信息进行推理,系统可以实现知识库中已有实体
关系的逻辑推理,使用规则引擎,从现有知识中发现新
知识,可实现业务需求分析推理,从而辅助电网业务决
策。知识推理可以通过递归查询,深度挖掘,可以得到
新的知识网络,以发掘新的知识。
2.4知识展示
系统应提供知识图谱中的电网层次语义信息,点
击可查看相应的具体知识内容;系统可根据输入选择
类型,展示对应知识内容。
3电网KG构建
电网在建设初期并没有统一的知识平台,每一个
部门都建立了各种信息库,使得电网产生了较多的信
息,通过电网的生产、运行及服务等环节,使得信息量
不断增加
[5]
。例如,电流、电压及频率发生变化时会产
生相关数据,开关状态发生改变后,也产生一系列的数
据,电表信息是不可忽视的数据信息。电网信息化虽
然产生了较多的电网数据,但需要使用的时间不断缩
108
科技创新导报ScienceandTechnologyInnovationHerald
能源与环境工程
短。但是,在输出这些数据时,存在一些困难,主要原
因是没有统一的格式,不仅需要将结构化的数据输入
其中,还具有各种非结构化的数据,涵盖了文本、音频
及视频等。在构建电网KG时,KG中根据多源数,结构
化数据一般可以直接进行知识融合;对于半结构化数
据来说,需要进行有效筛选,利用此种方法消除干扰数
据,也可以进行知识抽取,有助于更好地规范数据。此
外,要想建立完整的电网KG,需要将电网中涉及的各
种数据进行有效整合,在对数据进行管理及查找时,会
降低时间的浪费,也会将电网逐渐智能化,提高工作效
率。要想建立良好的电网KG,第一步要从各个方面获
取有效的电网术语,有效运用这些电网术语为形成专
业化电网KG奠定了基础。与此同时,还可以运用形式
化方法抽取术语信息,并对其可靠性进行相关分析
[6]
。
但是,电网术语没有得到大规模的使用,其重要性也会
得到降低,但会提高术语的统计难度。对此,工作人员
可以设计专业化的电网词典,这有助于其他人更好地
理解专业电网术语,也可以提高电网知识的学习效率,
促进电网不断获得发展。
4结语
电网知识图谱作为大数据时代背景下的全新技术
领域,对我国现代化电力产业的发展起到良好的推进
作用,但是,当前的电力行业发展中对于知识图谱的运
用仍然处于起步阶段,算法还不够成熟。然而,受到信
息化时代的支持,人们对知识图谱展开了深入研究,积
极探索多领域技术的融合应用,为电网企业的知识传
承提供可靠支持。
参考文献
[1]吴小刚
能调度辅助决策系统设计
,许士锦,陈兴望,等.基于知识图谱的电网智
[J].信息技术,2021(12):
[2]
60-65.
付鑫,郭阳
[3]
监测分析系统设计
,聂玲,等.
聂勇
[J].
基于知识图谱技术的电网运营
供用电,2021,38(7):45-50.
[4]
设计
郭榕
[D].
.基于知识图谱的输电规程知识查询系统
南昌:南昌大学,2021.
[5]
研究与应用
,杨群,刘绍翰,等.电网故障处置知识图谱构建
乔骥
知识图谱框架与关键技术初探
,王新迎
[J].
,闵睿
电网技术
,等.面向电网调度故障处理的
,2021,45(6):2092-2100.
[J].中国电机工程
[6]
学报
王渊
,2020,40(18):5837-5849.
统一数据中心的应用
,彭晨辉,王志强,等.
55(15):104-109.
[J].计算机工程与应用
知识图谱在电网全业务
,2019,
发布者:admin,转转请注明出处:http://www.yc00.com/news/1712910808a2146468.html
评论列表(0条)