2024年3月13日发(作者:商务笔记本哪个牌子性价比高)
第28卷第4期
2015年4月
传感技术学报
CHINESEJOURNALOFSENSORSANDACTUATORS
Vol.28 No.4
Apr.2015
DataCompressionMethodwithPiece-Wise
LinearRegressioninWSN
∗
ZHANGRuirui
1,2,3
,DUShangfeng
1
,CHENLiping
2,3∗
,KANJie
4
,XUGang
2,3
gResearchCenterofIntelligentEquipmentforAgriculture,BeijingAcademyofAgricultureandForestrySciences,Beijing100097,China;
alEngineeringResearchCenterofIntelligentEquipmentforAgriculture,Beijing100097,China;
eofInformationEngineering,CapitalNormalUniversity,Beijing100048,China)
(eofInformationandElectricalEngineering,ChinaAgricultureUniversity,Beijing100083,China;
Abstract:Sufferingfromthelimitationofbandwidth,
transmissionalgorithmforWSNwith-
BeijingXiaoTangshannationaldemonstrationbaseofprecisionagricultureasresearchobject,wetestedthecom-
sshowthatdatacompressionratioisashighas51.9%
theamountofdatatransmission.
Keywords:WSN;datafusion;linearregression;correlationanalysis
EEACC:7230 doi:10.3969/.1004
-
1699.2015.04.014
obtainingBase-dataandconstructingpiece-wiselinearregressionequation,thispaperproposedadatacompression
ingenvironmenttemperature,relativeairhumidityandsoiltemperaturedataobtainedbyaWSNsystemlocatedin
whentheRMSEbetweenrestoreddataandrawdataare3.87%and0.49℃,whichbringsanenormousreductionof
基于分段线性回归的传感器网络数据压缩
传输方法研究
∗
(1.中国农业大学信息与电气工程学院,北京100083;2.北京农业智能装备技术研究中心,北京100097;
3.国家农业智能装备工程技术研究中心,北京100097;4.首都师范大学信息工程学院,北京100048;)
张瑞瑞
1,2,3
,杜尚丰
1
,陈立平
2,3∗
,阚 杰
4
,徐 刚
2,3
摘 要:
无线传感器网络通信带宽等十分有限,难以实现较大量数据传输。针对多参数传感器网络,通过提取基准参数数据
集,并分段构建线性回归方程的方法,设计了一种适合多参数、较大数据量传感器网络网内数据的压缩传输算法。以某基地
实际采样环境温度、空气相对湿度、土壤温度数据为研究对象,对算法压缩效率和数据恢复效果进行了分析。结果表明:对于
空气相对湿度和土壤温度,恢复数据与原始数据均方根误差RMSE分别为3.87%、0.49℃时,整体数据压缩率可达51.9%,有
效降低了数据传送量。
关键词:
传感器网络;数据融合;线性回归;相关分析
中图分类号:TP391.9 文献标识码:A 文章编号:1004
-
1699(2015)04
-
0531
-
06
无线传感器网络WSN(WirelessSensorNetwork)
少数据传送量,延长网络生命周期,是当前WSN能耗
控制研究重点
[3
-
4]
。数据压缩传输技术是解决上述
问题的有效方法之一
[5
-
6]
。
DeligiannakisA等
[7]
提出了一种基于分段线性
是以感知、采集和处理网络覆盖区域中被感知对象的
信息为目的,利用大量传感器节点以无线、多跳、自组
织方式构成的数据协同处理网络
[1
-
2]
。如何有效减
展计划项目(2012AA101901)
收稿日期:2014.11.6 修改日期:2014.12.24
项目来源:北京市自然科学基金项目(4121001);北京市农林科学院青年科研基金项目(QNJJ201217);国家863高技术研究发
532
传 感 技 术 学 报
第28卷
回归模型的WSN数据估计算法。算法通过对数据
分段处理,从中选出基础信号数据,并传送基于以段
为单位的线性回归运算得出的回归方程系数,有效
地减低了传感器网络的网内数据传送量。王玲
等
[8
-
10]
从数据时间相关性分析层面考虑,基于线性
回归模型构建了不同的数据压缩算法。杨圣洪
等
[11]
针对数据时间、空间相关性特征,提出了一种
基于环模型的分布式时
-
空小波数据压缩算法。李
杨
[12]
等提出了一种基于小波分段常值压缩的数据
大误差,主要原因在于:①参数在不同时间段表现的
相关程度不同。例如环境温度在一天的正午时段变
化率较小,而傍晚时分变化率较大。②不同参数的
相互影响在时间维度上具有滞后性。当某个参数改
变时其他相关参数的相应变化会延迟发生。例如环
境温度与土壤温度的相互影响。
本文提出一种分段线性回归映射方法,将时间
序列上的样本数据划分成段,以段为单位进行线性
回归计算,并以自定义结构化精简集S的形式进行
收集算法,利用压缩采样理论和分段化方法降低数
据传输量。DeepakGanesa等
[13
-
14]
提出了一种基于
小波压缩层次系统,基于时空相关性,在节点层对数
据时间序列上相关性进行分析,在聚合节点上对不
同节点进行空间相关性分析,通过两次处理降低数
据冗余。侯鑫、杨永健等
[15
-
17]
基于神经网络、卡尔
曼滤波等算法模型构建了传感器网络数据融合
算法。
考虑到非实时多参数WSN节点环境监测应用
背景下,网内参数间表现出强相关、大冗余特点,以
及传感器网络节点对数据融合算法的简单、易实现
等特殊要求,本文提出了一种基于相关性分析的节
点
-
PWLR(Piece-Wise
基站分离式的分段线性回归数据压缩传输算法
掘参数间相关性,减少网内数据量
LinearRegression)。
,延长
算法通过挖
WSN生命
周期。
1 算法的模型描述
传感器节点采集数据可以描述为矩阵结构,如
式(1)所示。式中行向量表示单个参数在时间序列
上采样数据集。n
×
m矩阵表示当前最新样本数据,
n表示节点有n个监测参数,m表示节点已采样周
期数(假设各参数具有相同的采样周期)。
é
Y
1
ùé
yy
X
=
Y
y
11
y
12
…
︙
2
=
︙
21
︙
22
…
y
y
1m
ù
⋱
2m
ë
Y
︙
(1)
n
ûë
y
n1
y
n2
(如空气温度和土壤温度
…y
nm
û
对于强相关性参数),
利用标准线性回归估计模型建立参数间数学关系方
程,如(2)所示,并基于最小二乘法确定拟合方程拟
合误差RMSE最小时的回归系数(a,b)。传感器网
络节点将Y
j
作为基准数据集BD(BaseData)发送至
基站,对于Y
i
数据集的传送则可以通过只发送拟合
方程回归系数(a
然而,对整个时间序列进行线性回归会产生较
=
a
,
·
b
Y
)实现
+
ε
。
Y
ij
+
b(1<
=
i,j<
=
n)(2)
特征描述,如定义1。
定义
•l:段长度
1:结构化精简集
;
S由以下部分组成
上的区间可表示为
•start:段在行上的开始坐标
•migration:该段做线性回归运算时在基准数
Y
,例如该段在行i
i
[start,start
+
l]
据集上的起始偏移量
migration
•a,
+
b
l]
,例如可表示为BD[migration,
数,err为均方根误差
,err:a,b为分段线性回归方程的回归系
(err用于分段搜索时可不用传
输,见2.2节)
当n
×
m个样本数据采集完毕后,传感器网络节
点首先选取基准数据集(设为Y
m/l⌉段(「m/l⌉表示对m
j,
见2.1节),并将行
i分成「/l的计算值做上取
整运算)。每段以长度l搜索Y
j
上对应的线性回归
运算最优数据区间,并将结果以结构化形式发送给
基站。基准数据集整体直接发送给基站作为数据恢
复依据。每行完成分段回归运算后,该行可用结构
化精简集S
i的特征描述
k
(S
,
k
用以在基站进行数据恢复
≪m,k
=
「m/l⌉)代替,精简集作为行
。假设Y
j
是基准数据集,则Y
i
中的某段数据Y
i
可表示为:
[start,start
+
l]
a·Y
j
此时节点数据传输量为
[migration,migration
Data
:
+
l]
+
b
假设传感器采集参数数据表示与结构化精简集
=
{基准数据集,精简集S}
S成员参数的数据表示占用相同存储空间,则数据
压缩率可简化表示为:
n
m
CR
=
1
-
i
∑
=
1,i≠j
l
n
i
·4
+
m
·m
(3)
式中:l
i
是第i个参数的分段长度,n是传感器网络
节点的监测参数种类数,m是节点已采样周期数。
2 算法实现
算法包括建立和运行维护两个阶段。在能量充
发布者:admin,转转请注明出处:http://www.yc00.com/num/1710331185a1738804.html
评论列表(0条)