电网知识图谱的构建

电网知识图谱的构建


2024年4月12日发(作者:)

科技创新导报

2022NO.6

ScienceandTechnologyInnovationHerald

能源与环境工程

DOI:10.16660/.1674-098X.2202-5640-8222

电网知识图谱的构建

马娇玉

(积成电子股份有限公司山东济宁272000)

摘要:在新时期发展背景下,电网知识增长速度不断加快,各类企业对于该领域的知识管理和需求量也越

来越大。为了进一步展现出良好的电网知识作业,为相关企业提供便利,电网知识图谱的构建也成为了当前

发展的核心。再者,对于电网企业来说,在基础知识和实践经验中构建的理论图谱应用和探索相对落后,而

在对网络知识图谱的理念研究中,可结合电网业务现状及相关数据结构,构建电网知识图谱。构建电网知识

图谱可提高电网大数据可视化水平,降低电网业务的理解难度与查询效率。此外,可通过知识推理,产生新

的知识网络体系。

关键词:电网业务数据知识图谱

中图分类号:TM73文献标识码:A文章编号:1674-098X(2022)02(c)-0106-03

从知识图谱的定义角度分析,其在图书情报领域

又被看作是知识领域的映射和可视化地图,同时,通过

知识图谱,也能够直观地呈现出知识结构与发展状态

中的图形,基于可视化技术对知识资源及载体的描述,

能够清晰地找到并呈现二者之间存在的关系。本实验

中使用了Neo4j数据库,来实现知识库结构的形成与利

[1]

用。通过数据库语句,根据关键字段来完成知识网

络,提取mysql的半结构化数据,创建出实体、关系、属

性等要素。实现知识有效融合,能够摆脱实体与关系,

从而实现数据实时更新,构建良好的知识库结构,而知

识推理的意义在于对当前知识库进行深入的知识挖

掘,形成新的知识网络,丰富知识库内容。

知识图谱的主要作用是将多个独立的知识进行连

接,形成一张知识网络,从而可以完成信息的结构化、

统一化,也要依照现有的电网知识库实现隐晦知识的

进一步挖掘,形成新的知识网络。

1电网知识图谱的研发历程

1.1第一阶段——设计

下文主要探索知识图谱的概念与构建电网知识图

谱的意义,选取福建的电网数据进行分析。通过对福

建地区的数据进行研究,提炼出电网关系结构图,详见

图1,并将其作为电网知识图谱创建的重要参考。

电网知识图谱的平台采用了传统B/S的模式(见

图2),本文会详细介绍开发细节。

1.2第二阶段——持久化层

使用NOSQL图形数据库Neo4j,将其方法用于电

网知识图谱的数据库工具,来完成电网知识图谱的持

久化。以福建地区知识图谱为例,详见图3。

Neo4j具有高性能特点,利用NOSQL图形数据库可

以将结构化数据存储到网络中,其作为一种嵌入式的系

统,通过磁盘来可以提高事务处理特性,构建Java持久

[2]

化引擎,然而对于机构化数据在网络(从数学角度叫

做图)中的存储,并不是将数据存储于表内。Neo4j又被

称为高性能引擎,通过这一引擎,可以满足成熟数据库

应用需求,同时,程序员作为面向对象和灵活的网络结

构,也能够表现出静态与严格的特点,然而这些特点都

能够享受事务特性,也带来企业级数据库的优势。

Neo4j数据库中的label同等于关系型数据库中的

表,其中的每一个实体同等于关系型数据库中的一行

数据。

数据导入阶段,将福建电网的相关数据添加到

Neo4j数据库,并自动生成关系,具体数据导入语句模板:

USINGPERIODICCOMMIT100LOADCSVFROM

"文件路径"AS句柄merge(对象:标签名{对象.属性0:句

柄[0],对象.属性1:句[1],......{对象.属性n:句柄[n]})。

1.2.1USINGPERIODICCOMMIT100

在LOADCSV前面加上USINGPERIODICCOMMIT

1000,1000表示每1000行的数据进行一次Transaction提

交,提升性能。

1.2.2WITHHEADERS

从文件中读取第一行作为参数名,只有在使用了

该参数后,才可以使用“对象.属性”这样的表示方式,

否则需使用line[0]的表示方式。

具体自动创建关系语句模板:

作者简介:马娇玉(1987—),女,本科,工程师,研究方向为云计算、大数据、人工智能、物联网、区块链等数字技术

在电力工程中的应用。

106

科技创新导报ScienceandTechnologyInnovationHerald

能源与环境工程

2022NO.6

ScienceandTechnologyInnovationHerald

科技创新导报

图1电网关系结构图

图2电网知识图谱数据流结构图

关系自动创建,以半自动形成电网知识图谱。

1.3第三阶段——可视化层

使用Vue+Element完成基本界面的搭建:(1)在页

面script标签中引入等库;(2)使用Echarts对知

识图进行图形可视化展示操作首先引用Echarts的组

件,然后引用其Graph进行画图操作。

1.4第四阶段——部署

(1)平台使用.jar文件,使用JDK进行启动。(2)前

端vue文件部署在Tomcat服务器上,使用同Tomcat进

行启动。

2电网知识图谱详细功能简要介绍

2.1知识创建

以电网调控知识源为核心,建立电网调度运行专

业词库,综合采用命名本体实体识别、句法分析、语义

分析等自然语言处理方法,系统支持抽取数据源信息

中的实体(概念)、属性以及实体关系。抽取时,根据已

有电网模型信息构造,包含省调、地调、县调、厂站、设

备、电压等级、设备属性及量测数据统计信息的网络层

[3]

次知识。例如,可以按地区与厂站、厂站与母线等具

有关联关系,厂站本身也有很多相关的属性,这些都能

够在词库的实体属性中具体展现。

USINGPERIODICCOMMIT1000LOADCSV

FROM"文件路径"AS句柄merge(对象:标签名{对象.

属性0:句柄[0],对象.属性1:句[1],......{对象.属性

n:句柄[n]})。

科技创新导报ScienceandTechnologyInnovationHerald

图3福建电网知识图谱自动成图

Match(a:标签1),(b:标签2)wherea.属性=b.属性

merge(b)-[r:关系]->(a)。

通过此方式,来完成电网只是图谱的实体导入与

107

科技创新导报

2022NO.6

ScienceandTechnologyInnovationHerald

上述语句详细解释。

2.1.1USINGPERIODICCOMMIT1000

1000

提交,

1000

LOAD

表示每

CSV前面加上

1000行的数据进行一次

USINGPERIODIC

Transaction

COMMIT

2.1.2

提升性能。

从文件中读取第一行作为参数名,

WITHHEADERS

只有在使用了

该参数后,才可以使用这样的表示方式,否

则需使用

2.1.3

line[0]的表示方式。

整个数据表是以行的形式进行提交的,

ASline

每行提交

为一个实体。

2.1.4

使用MERGE

MERGE

实现创建,会自动取消创建重复的实

体以及关系。在导入时,MERGE子句在已经存在各个

标签、属性、属性值与当前MERGE后面描述的节点完

全相同的情况下不会重复创建多余节点。所以,要先

整理数据源,保证csv中的每条数据相同的节点要完全

相同。

2.2知识消减

系统可以消除电网知识图谱中的重复概念关系,

及时清理冗余及错误的实体关系,保证知识图谱结构

的准确性,可以使用Echarts完成知识图谱的数据可

视化

[4]

2.3知识推理

知识推理作为关键环节,可以根据现有电网业务

逻辑信息进行推理,系统可以实现知识库中已有实体

关系的逻辑推理,使用规则引擎,从现有知识中发现新

知识,可实现业务需求分析推理,从而辅助电网业务决

策。知识推理可以通过递归查询,深度挖掘,可以得到

新的知识网络,以发掘新的知识。

2.4知识展示

系统应提供知识图谱中的电网层次语义信息,点

击可查看相应的具体知识内容;系统可根据输入选择

类型,展示对应知识内容。

3电网KG构建

电网在建设初期并没有统一的知识平台,每一个

部门都建立了各种信息库,使得电网产生了较多的信

息,通过电网的生产、运行及服务等环节,使得信息量

不断增加

[5]

。例如,电流、电压及频率发生变化时会产

生相关数据,开关状态发生改变后,也产生一系列的数

据,电表信息是不可忽视的数据信息。电网信息化虽

然产生了较多的电网数据,但需要使用的时间不断缩

108

科技创新导报ScienceandTechnologyInnovationHerald

能源与环境工程

短。但是,在输出这些数据时,存在一些困难,主要原

因是没有统一的格式,不仅需要将结构化的数据输入

其中,还具有各种非结构化的数据,涵盖了文本、音频

及视频等。在构建电网KG时,KG中根据多源数,结构

化数据一般可以直接进行知识融合;对于半结构化数

据来说,需要进行有效筛选,利用此种方法消除干扰数

据,也可以进行知识抽取,有助于更好地规范数据。此

外,要想建立完整的电网KG,需要将电网中涉及的各

种数据进行有效整合,在对数据进行管理及查找时,会

降低时间的浪费,也会将电网逐渐智能化,提高工作效

率。要想建立良好的电网KG,第一步要从各个方面获

取有效的电网术语,有效运用这些电网术语为形成专

业化电网KG奠定了基础。与此同时,还可以运用形式

化方法抽取术语信息,并对其可靠性进行相关分析

[6]

但是,电网术语没有得到大规模的使用,其重要性也会

得到降低,但会提高术语的统计难度。对此,工作人员

可以设计专业化的电网词典,这有助于其他人更好地

理解专业电网术语,也可以提高电网知识的学习效率,

促进电网不断获得发展。

4结语

电网知识图谱作为大数据时代背景下的全新技术

领域,对我国现代化电力产业的发展起到良好的推进

作用,但是,当前的电力行业发展中对于知识图谱的运

用仍然处于起步阶段,算法还不够成熟。然而,受到信

息化时代的支持,人们对知识图谱展开了深入研究,积

极探索多领域技术的融合应用,为电网企业的知识传

承提供可靠支持。

参考文献

[1]吴小刚

能调度辅助决策系统设计

,许士锦,陈兴望,等.基于知识图谱的电网智

[J].信息技术,2021(12):

[2]

60-65.

付鑫,郭阳

[3]

监测分析系统设计

,聂玲,等.

聂勇

[J].

基于知识图谱技术的电网运营

供用电,2021,38(7):45-50.

[4]

设计

郭榕

[D].

.基于知识图谱的输电规程知识查询系统

南昌:南昌大学,2021.

[5]

研究与应用

,杨群,刘绍翰,等.电网故障处置知识图谱构建

乔骥

知识图谱框架与关键技术初探

,王新迎

[J].

,闵睿

电网技术

,等.面向电网调度故障处理的

,2021,45(6):2092-2100.

[J].中国电机工程

[6]

学报

王渊

,2020,40(18):5837-5849.

统一数据中心的应用

,彭晨辉,王志强,等.

55(15):104-109.

[J].计算机工程与应用

知识图谱在电网全业务

,2019,


发布者:admin,转转请注明出处:http://www.yc00.com/news/1712910808a2146468.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信