大数据在我国重大疫情治理中的应用

大数据在我国重大疫情治理中的应用


2024年6月11日发(作者:)

大数据在我国重大疫情治理中的应用

作者: 钟一苇

来源:《湖北经济学院学报》2020年第04期

摘要:国家在重大疫情中的治理能力,主要体现在疫情爆发前的防范控制、疫情爆发中的

医疗保障以及疫情爆发后的社会管理三个环节。此次新冠肺炎疫情,暴露出我国在上述环节中

监测预警能力不足、医疗保障机制不健全、执法行为不规范等问题。对此,可利用大数据应用

优势,对疫情的治理进行有效辅助。在防范控制环节,利用大数据建立疫情监测、预警、发布

三个子系统,实现疫情的“智能化治理”;在医疗保障环节,利用大数据辅助诊断及医疗物资调

配工作,实现疫情的“精确化治理”;在社会管理环节,利用大数据提高病患的收治排查效率,

规范执法行为,实现疫情的“标准化治理”。通过大数据在上述三个环节的应用,有效推动我国

重大疫情治理能力的提升。

关键词:新冠肺炎;大数据应用;重大疫情治理

中图分类号:D630 文献标志码:A 文童编号:1672-626X(2020)04-0013-09

新冠肺炎疫情的爆发,对于我国重大疫情治理能力是一次重大考验。习近平总书记在中央

全面深化改革委员会会议中指出:“这次疫情是对我国治理体系和能力的一次大考。……要鼓

励运用大数据、人工智能、云计算等数字技术,在疫情监测分析、病毒溯源、防控救治、资源

调配等方面更好发挥支撑作用。”大数据应用作为信息时代国家治理能力现代化的新型思维和

手段,能够实现国家在公共安全、卫生服务、应急管理中数据共享、部门协同、趋势研判、战

略分析、科学决策等领域治理能力的提升。在突发重大疫情中,国家治理能力主要体现在疫情

爆发前的防范控制、疫情爆发中的医疗保障以及疫情爆发后的社会管理三个环节。由此,如何

发挥大数据技术优势,将其应用于疫情防控中的上述环节,以提升我国在重大疫情中的治理能

力,是本文探讨的主要问题。

一、监测预警:大数据在重大疫情防范控制环节的应用

对于重大疫情,国家治理能力首先体现在对疫情爆发前的防范控制环节,即对疫情的监测

预警能力。此次疫情暴露出我国在疫情监测预警方面的短板:据中国及武汉疾病防控中心发表

于《新英格兰医学杂志》的论文显示,在2019年12月中旬新冠肺炎已發生传播,但未引起相

关防疫部门的重视。这不仅使得疫情的防范控制工作损失了黄金时间,亦反映出我国在疫情监

测预警方面的不足。而大数据则能够通过信息收集、智能处理、云计算等技术,对数据进行自

动抓取、深入挖掘、智能分析,从中提取规律,并利用这些规律对相关数据进行监测与预警。

因此,为提升我国在疫情防范控制环节的监测预警能力,可利用大数据技术,在国家及省级层

面建立权威的“重大疫情监测预警系统”,包括后台“疫情监测层”、中台“疫情预警层”及前台“疫

情发布层”,实现疫情信息的收集、分析、发布功能,以辅助国家重大疫情治理工作的开展。

(一)后台:大数据疫情监测层

“重大疫情监测预警系统”的后台为大数据“疫情监测层”,其目标是通过对国家、社会、网

络等层面海量数据的收集,整合各部门信息资源,提升我国重大疫情的监测能力。疫情监测层

可分为3个子系统,分别对国家数据、社会数据以及网络数据进行收集、整合与监测。

第一,基于“国家数据”的疫情监测系统。当前,我国重大疫情监测在国家层面存在的主要

问题是信息的公开与共享力度不足。尽管各防控部门实际已拥有大数据信息化系统,但大多自

建自用,导致信息资源互动程度低、共享难。同时,由于不同部门监测标准不一,导致数据形

式和格式不统一,难以统筹利用。若将各部门收集到的信息予以整合、共享并统一标准,即能

打破“部门藩篱’’与“数据孤岛”现象,提升重大疫情的监测能力。这样一种基于国家的数据疫情

监测系统在国外已被广泛应用:如全球新兴传染病监测系统(GEIS)即致力于整合全球监测

系统、疫情调查及日常训练,目前已覆盖92个国家。美国卫生部对有关传染病医疗方面的数

据进行公开,建立了细菌传染病监测PulseNe系统和食源性疾病主动监测网。在我国,电子病

历系统亦已全面覆盖,公共卫生部门可以通过分析全国各地的患者出现相同或相似症状的信

息,预测某些传染病的暴发,提前快速响应。

“国家数据”疫情监测系统的功能为对各政府部门、卫生管理部门、疾病防控中心、突发事

件监测部门等疫情防控部门的数据进行收集与整合,建立监测协同机制,实现疫情监测系统的

共享共建。首先,各防控部门需要建立统一的数据共享平台,联通各部门数据,并对数据进行

初步加工,统一标准,方便系统识别。其次,建立统一的数据接收和传递渠道,使数据能够进

入监测系统,完成“警源”数据的收集。再次,在数据收集完毕后,系统即对各部门的海量数据

进行存储与抓取,实时监测疫情存在的可能性,并反馈给防控部门。最后,对可能的征兆与风

险数据进行深度挖掘与智能分析,形成疫情威胁的风险性报告,提前制定防控预案,以应对可

能的风险。

第二,基于“社会数据”的疫情监测系统。由于疫情爆发原因的复杂性,人们的生活方式、

卫生习惯、活动轨迹以及地理、气候等因素均可能导致疫情的发生,使得疫情防控中的“社会

因素”逐步受到重视,很多公共机构亦开始利用大数据对可能的疫情进行检测。如美国公共健

康协会创立的“Flu Near You”网站,即采用大数据技术监测流感的蔓延程度,并预测未来任何

有可能暴发的流感疫情。加拿大ra公司运用地理资讯系统,通过分析人口移动、气

候因素、航班起降、卫生系统、家畜密度等信息,发布动态全球病毒地图,预测可能爆发疫情

的地区。而在非洲埃博拉病毒爆发期间,通过分析当地居民行动通信资料,大数据在定位疫区

位置、预测疫情扩散、合理规划资源等方面亦发挥了重要作用。

“社会数据”疫情监测系统的功能为对各级医院、医疗卫生机构、医保机构、医疗企业等与

医疗相关的行业数据进行收集与整合,提升重大疫情监测能力。首先,对于未知疾病可能引发

的重大疫情,传统的监测方法均基于历史的临床数据来监测,在临床经验数据为零的情况下,

传统方法无法检测到首次出现的疾病。而大数据则不然,通过社会机构的海量数据、公共机构

的疾病监测报告、医疗机构的信息共享,即可以监测到某地不明原因疾病的出现,为判断疾病

的性质赢取时间。其次,对于突发疫情,可通过大数据监测到疫情爆发区人群流动的轨迹,第

一时间通知该人群流向地的疾病防控中心,提前做好应对措施。例如此次疫情中的“百度迁徙

平台”,即利用大数据技术展示了封城前离开武汉人员的迁徙轨迹,若各地疾病防控部门能够

有效利用上述数据,即可提前拟定措施,在疫区流动人群到达前做好防控准备工作。

第三,基于“网络数据”的疫情监测系统。利用患者患病后在互联网上对相关信息的查询,

通过网络的实时信息处理技术,对网络数据进行统计、筛选、甄别、分析,根据对高频率关键

词的跟踪查询,可以有效监测重大疫情的发生。如谷歌通过分析其搜索引擎上的关键词,将该

数据与疾病中心的数据相比较,根据搜索次数和实际患者的时间序列,利用一个多元线性回归

模型,很好地预测了流感的传播趋势。P01green(2008)通过对雅虎搜索记录的分析,指出用

户在医疗信息网站的搜索记录,能够很好地用来预测流行病的传播。Ginsberg(2009)通过在

谷歌日志中选择关键词,建立模型以监测流感活动,模型预测值与国家疾病预防控制中心数据

高度吻合,并且能够提前预测流感病例的发生。

“网络数据”疫情监测系统的功能为对各门户网站、搜索引擎、社交媒体中的海量网络数据

进行收集与整合,甄别其中与疫情相关的信息,并对可能发生的疫情进行监控。首先,在系统

中设置疫情专业领域的概念、定义与表达模式。由于网络信息的数量巨大、繁杂模糊,需建立

一个公共卫生、医疗检疫、疾病防控等与疫情高度相关的专有词典库或数据库,以便让系统能

够自动识别。在对这些专业概念、定义与表达进行明确规定和限制之后,再搜集目标网页的数

据资源。依据专有领域概念特征的表达和描述,建立目标数据规模训练集,目标数据就可在完

整的模式分类和机器学习技术上建立起来。其次,设置专业用语语义过滤机制。其目的是筛选

并去除与疫情关联度不大或完全无关的干扰数据和信息,保证疫情监测的准确性。在完成专业

用语的界定与过滤后,即可构建目标网页的自动提取技术。最后,利用网络爬虫技术,建立疫

情数据搜索机制。通过智能网络爬虫算法技术在各门户网站、搜索引擎、社交网络等公共媒体

和自媒体中有选择地搜索特定信息,对与疫情相关的数据进行定向抓捕,从而利用网络数据完

成对疫情的监测。

(二)中台:大数据疫情预警层

“重大疫情监测预警系统”的中台为大数据“疫情预警层”,其目标是在将疫情信息进行收

集、整合后,对监测到的数据进行智能分析,判断监测数据的风险阈值,提升重大疫情的预警

能力。

第一,建立统一的疫情预警系统,将收集到的海量疫情数据进行甄别与分类。由于疫情监

测系统获得的国家数据、社会数据、网络数据分属不同的类型,其标准、口径、形式、格式均

不一致,因此需先对数据进行类型化,统一数据标准,以便系统能够有效识别。之后还需对数

据进行脱敏与过滤,在保护居民隐私权的前提下,判断风险存在的实际状态,使可能或已经存

在的疫情警兆能够直观地展示给决策者。

第二,将经过脱敏、过滤后的标准类型化数据进行相关性分析,对疫情的风险指数进行评

估。相比于传统的重大疫情预警方式,大数据的优势在于可以从海量的数据中凝练具有连续

性、动态性和实时性的信息,并将这些信息进行相关分析,预测疫情的发生趋势,降低警示信

号识别的误差率,实现预警决策从假设推动到数据推动的长足飞跃。由此,在疫情的防控工作

中,可以利用大数据深度学习技术,将与重大疫情有关的信息进行罗列,让计算机自动识别可

能或已经发生的疫情,并发出预警。例如国家数据中的相关信息包括病种、病例、病毒库、电

子病历、医保信息中的异常数;社会数据中的相关信息包括地理区域、时间范围、气候因素、

人群活动轨迹中的异常数;网络数据中的相关信息包括门户网站、社交媒体、搜索引擎中的异

常数等。在将上述数据进行设置后,即可采用时空聚集性分析与时间序列分析等模型,通过相

关关系分析,让系统自动给出是否存在疫情、爆发的可能性有多高等风险判断,并及时将结果

发送给疫情防控人员。

第三,对风险信息进行分级评估,设定预警阈值。在对预警数据进行相关性分析后,还要

对预测结果进行分级,并设置相应的风险指数阈值,以便防控人员能够判断疫情的风险级别,

决定是否发出预警、何时发出预警以及发出何种程度的预警。可参照国际“疾病爆发应对系统

(DoTscon)”的标准预先将疫情预警级别分为绿色、黄色、橙色、红色,并设置对应的阈值,

在系统对监测数据进行分析时,一旦超过阈值,则将监测结果与预警级别进行比对,根据风险

级别自动发出预警。例如某疾病防控中心发现某家医院的传染病患急剧上涨,某机构发现该地

区居民前往医院的人数比以往明显增多,某网站发现该段间内传染病的搜索频率大幅增加,这

时系统即会对上述信息进行智能分析,得出加权后的预测结果,并根据设置的风险阈值,自动

向决策者报告对应的风险预警等级,以为其是否发出预警提供依据。

(三)前台:大数据疫情发布层

目前,我国疫情信息的发布制度主要存在两个方面的问题。一是由于疫情信息发布机构的

层级较高,导致信息的发布较为迟缓。我国《传染病防治法》第38条规定:“传染病暴发时,

国务院卫生行政部门负责向社会公布传染病疫情信息,并可授权省、自治区、直辖市人民政府

卫生行政部门向社会公布疫情信息”。由于疫情信息的发布部门只能是国家和省一级的卫生部

门,使得基层卫生部门在发现疫情后,需要逐级上报,大大延缓了疫情发布时间。二是出于各

种考虑,一些部门在得知疫情信息后不仅不愿上报,甚至采取封杀或惩戒的方法对社会上疫情

信息的“苗头”进行处理,使疫情的防控工作损失了宝贵的时间。对此,有学者指出:“草率地

通过行政权力对存在不确定性的信息采取‘一棍子打死’的做法,可能導致正确信息被筛选掉,

给人民群众生命健康和公共安全造成极大隐患,甚至造成不可挽回的损失。”

“重大疫情监测预警系统”的前台为大数据“疫情发布层”,其目标是对当前疫情信息发布制

度的缺陷进行改善。一是对疫情信息发布迟缓问题,可利用大数据技术,将不同级别的预警信

息直接发送至国家或省级卫生管理部门。在疫情预警系统发出“绿色”或“黄色”级别预警信号

时,立即将信息发送至省一级卫生行政部门;而在系统发出“橙色”或“红色”级别预警信号时,则

将该预警信息发送至国家卫生行政部门。这样可使有疫情信息发布权的行政部门能够及时了解

疫情状况,并迅速开展疫情调查与防控工作,在第一时间对疫情信息予以发布。同时,亦能有

效避免疫情信息逐级上报所消耗的宝贵时间,大幅缩短疫情的反应时间,促使疫情的发布工作

迈向精确、迅速及有效。二是对于一些部门在得知疫情信息后不愿上报的问题,大数据可以有

效减少人为因素的干扰。大数据的特征之一是自动化,系统在提取、分析和处理数据时是不受

人为因素控制的,对于疫情的预警亦是如此,系统只根据收集到的数据得出相应的结果,非人

为因素可以影响。因此,可以考虑对国家疫情信息发布制度作出改进,规定一旦预警系统发出

“绿色”及以上级别的预警,就应当在相应卫生行政部门的官方网站上自动发布疫情信息,并将

疫情数据予以公开。这样不仅能够做到对疫情防控的快速应对,亦能提升国家公信力,使居民

更加配合疫情防控部门的工作。

第三,基于“网络数据”的疫情监测系统。利用患者患病后在互联网上对相关信息的查询,

通过网络的实时信息处理技术,对网络数据进行统计、筛选、甄别、分析,根据对高频率关键

词的跟踪查询,可以有效监测重大疫情的发生。如谷歌通過分析其搜索引擎上的关键词,将该

数据与疾病中心的数据相比较,根据搜索次数和实际患者的时间序列,利用一个多元线性回归

模型,很好地预测了流感的传播趋势。P01green(2008)通过对雅虎搜索记录的分析,指出用

户在医疗信息网站的搜索记录,能够很好地用来预测流行病的传播。Ginsberg(2009)通过在

谷歌日志中选择关键词,建立模型以监测流感活动,模型预测值与国家疾病预防控制中心数据

高度吻合,并且能够提前预测流感病例的发生。

“网络数据”疫情监测系统的功能为对各门户网站、搜索引擎、社交媒体中的海量网络数据

进行收集与整合,甄别其中与疫情相关的信息,并对可能发生的疫情进行监控。首先,在系统

中设置疫情专业领域的概念、定义与表达模式。由于网络信息的数量巨大、繁杂模糊,需建立

一个公共卫生、医疗检疫、疾病防控等与疫情高度相关的专有词典库或数据库,以便让系统能

够自动识别。在对这些专业概念、定义与表达进行明确规定和限制之后,再搜集目标网页的数

据资源。依据专有领域概念特征的表达和描述,建立目标数据规模训练集,目标数据就可在完

整的模式分类和机器学习技术上建立起来。其次,设置专业用语语义过滤机制。其目的是筛选

并去除与疫情关联度不大或完全无关的干扰数据和信息,保证疫情监测的准确性。在完成专业

用语的界定与过滤后,即可构建目标网页的自动提取技术。最后,利用网络爬虫技术,建立疫

情数据搜索机制。通过智能网络爬虫算法技术在各门户网站、搜索引擎、社交网络等公共媒体

和自媒体中有选择地搜索特定信息,对与疫情相关的数据进行定向抓捕,从而利用网络数据完

成对疫情的监测。

(二)中台:大数据疫情预警层

“重大疫情监测预警系统”的中台为大数据“疫情预警层”,其目标是在将疫情信息进行收

集、整合后,对监测到的数据进行智能分析,判断监测数据的风险阈值,提升重大疫情的预警

能力。

第一,建立统一的疫情预警系统,将收集到的海量疫情数据进行甄别与分类。由于疫情监

测系统获得的国家数据、社会数据、网络数据分属不同的类型,其标准、口径、形式、格式均

不一致,因此需先对数据进行类型化,统一数据标准,以便系统能够有效识别。之后还需对数

据进行脱敏与过滤,在保护居民隐私权的前提下,判断风险存在的实际状态,使可能或已经存

在的疫情警兆能够直观地展示给决策者。

第二,将经过脱敏、过滤后的标准类型化数据进行相关性分析,对疫情的风险指数进行评

估。相比于传统的重大疫情预警方式,大数据的优势在于可以从海量的数据中凝练具有连续

性、动态性和实时性的信息,并将这些信息进行相关分析,预测疫情的发生趋势,降低警示信

号识别的误差率,实现预警决策从假设推动到数据推动的长足飞跃。由此,在疫情的防控工作

中,可以利用大数据深度学习技术,将与重大疫情有关的信息进行罗列,让计算机自动识别可

能或已经发生的疫情,并发出预警。例如国家数据中的相关信息包括病种、病例、病毒库、电

子病历、医保信息中的异常数;社会数据中的相关信息包括地理区域、时间范围、气候因素、

人群活动轨迹中的异常数;网络数据中的相关信息包括门户网站、社交媒体、搜索引擎中的异

常数等。在将上述数据进行设置后,即可采用时空聚集性分析与时间序列分析等模型,通过相

关关系分析,让系统自动给出是否存在疫情、爆发的可能性有多高等风险判断,并及时将结果

发送给疫情防控人员。

第三,对风险信息进行分级评估,设定预警阈值。在对预警数据进行相关性分析后,还要

对预测结果进行分级,并设置相应的风险指数阈值,以便防控人员能够判断疫情的风险级别,

决定是否发出预警、何时发出预警以及发出何种程度的预警。可参照国际“疾病爆发应对系统

(DoTscon)”的标准预先将疫情预警级别分为绿色、黄色、橙色、红色,并设置对应的阈值,

在系统对监测数据进行分析时,一旦超过阈值,则将监测结果与预警级别进行比对,根据风险

级别自动发出预警。例如某疾病防控中心发现某家医院的传染病患急剧上涨,某机构发现该地

区居民前往医院的人数比以往明显增多,某网站发现该段间内传染病的搜索频率大幅增加,这

时系统即会对上述信息进行智能分析,得出加权后的预测结果,并根据设置的风险阈值,自动

向决策者报告对应的风险预警等级,以为其是否发出预警提供依据。

(三)前台:大数据疫情发布层

目前,我国疫情信息的发布制度主要存在两个方面的问题。一是由于疫情信息发布机构的

层级较高,导致信息的发布较为迟缓。我国《传染病防治法》第38条规定:“传染病暴发时,

国务院卫生行政部门负责向社会公布传染病疫情信息,并可授权省、自治区、直辖市人民政府

卫生行政部门向社会公布疫情信息”。由于疫情信息的发布部门只能是国家和省一级的卫生部

门,使得基层卫生部门在发现疫情后,需要逐级上报,大大延缓了疫情发布时间。二是出于各

种考虑,一些部门在得知疫情信息后不仅不愿上报,甚至采取封杀或惩戒的方法对社会上疫情

信息的“苗头”进行处理,使疫情的防控工作损失了宝贵的时间。对此,有学者指出:“草率地

通过行政权力对存在不确定性的信息采取‘一棍子打死’的做法,可能导致正确信息被筛选掉,

给人民群众生命健康和公共安全造成极大隐患,甚至造成不可挽回的损失。”

“重大疫情监测预警系统”的前台为大数据“疫情发布层”,其目标是对当前疫情信息发布制

度的缺陷进行改善。一是对疫情信息发布迟缓问题,可利用大数据技术,将不同级别的预警信

息直接发送至国家或省级卫生管理部门。在疫情预警系统发出“绿色”或“黄色”级别预警信号

时,立即将信息发送至省一级卫生行政部门;而在系统发出“橙色”或“红色”级别预警信号时,则

将该预警信息发送至国家卫生行政部门。这样可使有疫情信息发布权的行政部门能够及时了解

疫情状况,并迅速开展疫情调查与防控工作,在第一时间对疫情信息予以发布。同时,亦能有

效避免疫情信息逐级上报所消耗的宝贵时间,大幅缩短疫情的反应时间,促使疫情的发布工作

迈向精确、迅速及有效。二是对于一些部门在得知疫情信息后不愿上报的问题,大数据可以有

效减少人为因素的干扰。大数据的特征之一是自动化,系统在提取、分析和处理数据时是不受

人为因素控制的,对于疫情的预警亦是如此,系统只根据收集到的数据得出相应的结果,非人

为因素可以影响。因此,可以考虑对国家疫情信息发布制度作出改进,规定一旦预警系统发出

“绿色”及以上级别的预警,就应当在相应卫生行政部门的官方网站上自动发布疫情信息,并将

疫情数据予以公开。这样不仅能够做到对疫情防控的快速应对,亦能提升国家公信力,使居民

更加配合疫情防控部门的工作。

第三,基于“网络数据”的疫情监测系统。利用患者患病后在互联网上对相关信息的查询,

通过网络的实时信息处理技术,对网络数据进行统计、筛选、甄别、分析,根据对高频率关键

词的跟踪查询,可以有效监测重大疫情的发生。如谷歌通过分析其搜索引擎上的关键词,将该

数据与疾病中心的数据相比较,根据搜索次数和实际患者的时间序列,利用一个多元线性回归

模型,很好地预测了流感的传播趋势。P01green(2008)通过对雅虎搜索记录的分析,指出用

户在医疗信息网站的搜索记录,能够很好地用来预测流行病的传播。Ginsberg(2009)通过在

谷歌日志中选择关键词,建立模型以监测流感活动,模型预测值与国家疾病预防控制中心数据

高度吻合,并且能够提前预测流感病例的发生。

“网络数据”疫情监测系统的功能为对各门户网站、搜索引擎、社交媒体中的海量网络数据

进行收集与整合,甄别其中与疫情相关的信息,并对可能发生的疫情进行监控。首先,在系统

中设置疫情专业领域的概念、定义与表达模式。由于网络信息的数量巨大、繁杂模糊,需建立

一个公共卫生、医疗检疫、疾病防控等与疫情高度相关的专有词典库或数据库,以便让系统能

够自动识别。在对这些专业概念、定义与表达进行明确规定和限制之后,再搜集目标网页的数

据资源。依据专有领域概念特征的表达和描述,建立目标数据规模训练集,目标数据就可在完

整的模式分类和机器学习技术上建立起来。其次,设置专业用语语义过滤机制。其目的是筛选

并去除与疫情关联度不大或完全无关的干扰数据和信息,保证疫情监测的准确性。在完成专业

用语的界定与过滤后,即可构建目标网页的自动提取技术。最后,利用网络爬虫技术,建立疫

情数据搜索机制。通过智能网络爬虫算法技术在各门户网站、搜索引擎、社交网络等公共媒体

和自媒体中有选择地搜索特定信息,对与疫情相关的数据进行定向抓捕,从而利用网络数据完

成对疫情的监测。

(二)中台:大数据疫情预警层

“重大疫情监测预警系统”的中台为大数据“疫情预警层”,其目标是在将疫情信息进行收

集、整合后,对监测到的数据进行智能分析,判断监测数据的风险阈值,提升重大疫情的预警

能力。

第一,建立统一的疫情预警系统,将收集到的海量疫情数据进行甄别与分类。由于疫情监

测系统获得的国家数据、社会数据、网络数据分属不同的类型,其标准、口径、形式、格式均

不一致,因此需先对数据进行类型化,统一数据标准,以便系统能够有效识别。之后还需对数

据进行脱敏与过滤,在保护居民隐私权的前提下,判断风险存在的实际状态,使可能或已经存

在的疫情警兆能够直观地展示给决策者。

第二,将经过脱敏、过滤后的标准类型化数据进行相关性分析,对疫情的风险指数进行评

估。相比于传统的重大疫情预警方式,大数据的优势在于可以从海量的数据中凝练具有连续

性、动态性和实时性的信息,并将这些信息进行相关分析,预测疫情的发生趋势,降低警示信

号识别的误差率,实现预警决策从假设推动到数据推动的长足飞跃。由此,在疫情的防控工作

中,可以利用大数据深度学习技术,将与重大疫情有关的信息进行罗列,让计算机自动识别可

能或已经发生的疫情,并发出预警。例如国家数据中的相关信息包括病种、病例、病毒库、电

子病历、医保信息中的异常数;社会数据中的相关信息包括地理区域、时间范围、气候因素、

人群活动轨迹中的异常数;网络数据中的相关信息包括门户网站、社交媒体、搜索引擎中的异

常数等。在将上述数据进行设置后,即可采用时空聚集性分析与时间序列分析等模型,通过相

关关系分析,让系统自动给出是否存在疫情、爆发的可能性有多高等风险判断,并及时将结果

发送给疫情防控人员。

第三,对风险信息进行分级评估,设定预警阈值。在对预警数据进行相关性分析后,还要

对预测结果进行分级,并设置相应的风险指数阈值,以便防控人员能够判断疫情的风险级别,

决定是否发出预警、何时发出预警以及发出何种程度的预警。可参照国际“疾病爆发应对系统

(DoTscon)”的标准预先将疫情预警级别分为绿色、黄色、橙色、红色,并设置对应的阈值,

在系统对监测数据进行分析时,一旦超过阈值,则将监测结果与预警级别进行比对,根据风险

级别自动发出预警。例如某疾病防控中心发现某家医院的传染病患急剧上涨,某机构发现该地

区居民前往医院的人数比以往明显增多,某网站发现该段间内传染病的搜索频率大幅增加,这

时系统即会对上述信息进行智能分析,得出加权后的预测结果,并根据设置的风险阈值,自动

向决策者报告对应的风险预警等级,以为其是否发出预警提供依据。

(三)前台:大数据疫情发布层

目前,我国疫情信息的发布制度主要存在两个方面的问题。一是由于疫情信息发布机构的

层级较高,导致信息的发布较为迟缓。我国《传染病防治法》第38条规定:“传染病暴发时,

国务院卫生行政部门负责向社会公布传染病疫情信息,并可授权省、自治区、直辖市人民政府

卫生行政部门向社会公布疫情信息”。由于疫情信息的发布部门只能是国家和省一级的卫生部

门,使得基层卫生部门在发现疫情后,需要逐级上报,大大延缓了疫情发布时间。二是出于各

种考虑,一些部门在得知疫情信息后不仅不愿上报,甚至采取封杀或惩戒的方法对社会上疫情

信息的“苗头”进行处理,使疫情的防控工作损失了宝贵的时间。对此,有学者指出:“草率地

通过行政权力对存在不确定性的信息采取‘一棍子打死’的做法,可能导致正确信息被筛选掉,

给人民群众生命健康和公共安全造成极大隐患,甚至造成不可挽回的损失。”

“重大疫情监测预警系统”的前台为大数据“疫情发布层”,其目标是对当前疫情信息发布制

度的缺陷进行改善。一是对疫情信息发布迟缓问题,可利用大数据技术,将不同级别的预警信

息直接发送至国家或省级卫生管理部门。在疫情预警系统发出“绿色”或“黄色”级别预警信号

时,立即将信息发送至省一级卫生行政部门;而在系统发出“橙色”或“红色”级别预警信号时,则

将该预警信息发送至国家卫生行政部门。这样可使有疫情信息发布权的行政部门能够及时了解

疫情状况,并迅速开展疫情调查与防控工作,在第一时间对疫情信息予以发布。同时,亦能有

效避免疫情信息逐级上报所消耗的宝贵时间,大幅缩短疫情的反应时间,促使疫情的发布工作

迈向精确、迅速及有效。二是对于一些部门在得知疫情信息后不愿上报的问题,大数据可以有

效减少人为因素的干扰。大数据的特征之一是自動化,系统在提取、分析和处理数据时是不受

人为因素控制的,对于疫情的预警亦是如此,系统只根据收集到的数据得出相应的结果,非人

为因素可以影响。因此,可以考虑对国家疫情信息发布制度作出改进,规定一旦预警系统发出

“绿色”及以上级别的预警,就应当在相应卫生行政部门的官方网站上自动发布疫情信息,并将

疫情数据予以公开。这样不仅能够做到对疫情防控的快速应对,亦能提升国家公信力,使居民

更加配合疫情防控部门的工作。

第三,基于“网络数据”的疫情监测系统。利用患者患病后在互联网上对相关信息的查询,

通过网络的实时信息处理技术,对网络数据进行统计、筛选、甄别、分析,根据对高频率关键

词的跟踪查询,可以有效监测重大疫情的发生。如谷歌通过分析其搜索引擎上的关键词,将该

数据与疾病中心的数据相比较,根据搜索次数和实际患者的时间序列,利用一个多元线性回归

模型,很好地预测了流感的传播趋势。P01green(2008)通过对雅虎搜索记录的分析,指出用

户在医疗信息网站的搜索记录,能够很好地用来预测流行病的传播。Ginsberg(2009)通过在

谷歌日志中选择关键词,建立模型以监测流感活动,模型预测值与国家疾病预防控制中心数据

高度吻合,并且能够提前预测流感病例的发生。

“网络数据”疫情监测系统的功能为对各门户网站、搜索引擎、社交媒体中的海量网络数据

进行收集与整合,甄别其中与疫情相关的信息,并对可能发生的疫情进行监控。首先,在系统

中设置疫情专业领域的概念、定义与表达模式。由于网络信息的数量巨大、繁杂模糊,需建立

一个公共卫生、医疗检疫、疾病防控等与疫情高度相关的专有词典库或数据库,以便让系统能

够自动识别。在对这些专业概念、定義与表达进行明确规定和限制之后,再搜集目标网页的数

据资源。依据专有领域概念特征的表达和描述,建立目标数据规模训练集,目标数据就可在完

整的模式分类和机器学习技术上建立起来。其次,设置专业用语语义过滤机制。其目的是筛选

并去除与疫情关联度不大或完全无关的干扰数据和信息,保证疫情监测的准确性。在完成专业

用语的界定与过滤后,即可构建目标网页的自动提取技术。最后,利用网络爬虫技术,建立疫

情数据搜索机制。通过智能网络爬虫算法技术在各门户网站、搜索引擎、社交网络等公共媒体

和自媒体中有选择地搜索特定信息,对与疫情相关的数据进行定向抓捕,从而利用网络数据完

成对疫情的监测。

(二)中台:大数据疫情预警层

“重大疫情监测预警系统”的中台为大数据“疫情预警层”,其目标是在将疫情信息进行收

集、整合后,对监测到的数据进行智能分析,判断监测数据的风险阈值,提升重大疫情的预警

能力。

第一,建立统一的疫情预警系统,将收集到的海量疫情数据进行甄别与分类。由于疫情监

测系统获得的国家数据、社会数据、网络数据分属不同的类型,其标准、口径、形式、格式均

不一致,因此需先对数据进行类型化,统一数据标准,以便系统能够有效识别。之后还需对数

据进行脱敏与过滤,在保护居民隐私权的前提下,判断风险存在的实际状态,使可能或已经存

在的疫情警兆能够直观地展示给决策者。

第二,将经过脱敏、过滤后的标准类型化数据进行相关性分析,对疫情的风险指数进行评

估。相比于传统的重大疫情预警方式,大数据的优势在于可以从海量的数据中凝练具有连续

性、动态性和实时性的信息,并将这些信息进行相关分析,预测疫情的发生趋势,降低警示信

号识别的误差率,实现预警决策从假设推动到数据推动的长足飞跃。由此,在疫情的防控工作

中,可以利用大数据深度学习技术,将与重大疫情有关的信息进行罗列,让计算机自动识别可

能或已经发生的疫情,并发出预警。例如国家数据中的相关信息包括病种、病例、病毒库、电

子病历、医保信息中的异常数;社会数据中的相关信息包括地理区域、时间范围、气候因素、

人群活动轨迹中的异常数;网络数据中的相关信息包括门户网站、社交媒体、搜索引擎中的异

常数等。在将上述数据进行设置后,即可采用时空聚集性分析与时间序列分析等模型,通过相

关关系分析,让系统自动给出是否存在疫情、爆发的可能性有多高等风险判断,并及时将结果

发送给疫情防控人员。

第三,对风险信息进行分级评估,设定预警阈值。在对预警数据进行相关性分析后,还要

对预测结果进行分级,并设置相应的风险指数阈值,以便防控人员能够判断疫情的风险级别,

决定是否发出预警、何时发出预警以及发出何种程度的预警。可参照国际“疾病爆发应对系统

(DoTscon)”的标准预先将疫情预警级别分为绿色、黄色、橙色、红色,并设置对应的阈值,

在系统对监测数据进行分析时,一旦超过阈值,则将监测结果与预警级别进行比对,根据风险

级别自动发出预警。例如某疾病防控中心发现某家医院的传染病患急剧上涨,某机构发现该地

区居民前往医院的人数比以往明显增多,某网站发现该段间内传染病的搜索频率大幅增加,这

时系统即会对上述信息进行智能分析,得出加权后的预测结果,并根据设置的风险阈值,自动

向决策者报告对应的风险预警等级,以为其是否发出预警提供依据。

(三)前台:大数据疫情发布层

目前,我国疫情信息的发布制度主要存在两个方面的问题。一是由于疫情信息发布机构的

层级较高,导致信息的发布较为迟缓。我国《传染病防治法》第38条规定:“传染病暴发时,

国务院卫生行政部门负责向社会公布传染病疫情信息,并可授权省、自治区、直辖市人民政府

卫生行政部门向社会公布疫情信息”。由于疫情信息的发布部门只能是国家和省一级的卫生部

门,使得基层卫生部门在发现疫情后,需要逐级上报,大大延缓了疫情发布时间。二是出于各

种考虑,一些部门在得知疫情信息后不仅不愿上报,甚至采取封杀或惩戒的方法对社会上疫情

信息的“苗头”进行处理,使疫情的防控工作损失了宝贵的时间。对此,有学者指出:“草率地

通过行政权力对存在不确定性的信息采取‘一棍子打死’的做法,可能导致正确信息被筛选掉,

给人民群众生命健康和公共安全造成极大隐患,甚至造成不可挽回的损失。”

“重大疫情监测预警系统”的前台为大数据“疫情发布层”,其目标是对当前疫情信息发布制

度的缺陷进行改善。一是对疫情信息发布迟缓问题,可利用大数据技术,将不同级别的预警信

息直接发送至国家或省级卫生管理部门。在疫情预警系统发出“绿色”或“黄色”级别预警信号

时,立即将信息发送至省一级卫生行政部门;而在系统发出“橙色”或“红色”级别预警信号时,则

将该预警信息发送至国家卫生行政部门。这样可使有疫情信息发布权的行政部门能够及时了解

疫情状况,并迅速开展疫情调查与防控工作,在第一时间对疫情信息予以发布。同时,亦能有

效避免疫情信息逐级上报所消耗的宝贵时间,大幅缩短疫情的反应时间,促使疫情的发布工作

迈向精确、迅速及有效。二是对于一些部门在得知疫情信息后不愿上报的问题,大数据可以有

效减少人为因素的干扰。大数据的特征之一是自动化,系统在提取、分析和处理数据时是不受

人为因素控制的,对于疫情的预警亦是如此,系统只根据收集到的数据得出相应的结果,非人

为因素可以影响。因此,可以考虑对国家疫情信息发布制度作出改进,规定一旦预警系统发出

“绿色”及以上级别的预警,就应当在相应卫生行政部门的官方网站上自动发布疫情信息,并将

疫情数据予以公开。这样不仅能够做到对疫情防控的快速应对,亦能提升国家公信力,使居民

更加配合疫情防控部门的工作。


发布者:admin,转转请注明出处:http://www.yc00.com/news/1718073041a2746679.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信