龙芯处理器商用密码指令集运算性能分析

龙芯处理器商用密码指令集运算性能分析


2024年4月23日发(作者:惠普系统在官网上怎么下载)

技术

分析

IGITCW

Technology Analysis

龙芯处理器商用密码指令集运算性能分析

徐海波

(北京赛迪软件测评工程技术中心有限公司,北京 100048)

文章介绍了龙芯处理器3A5000内置硬件加密模块,支持商用密码SM2/3/4,通过搭建测试环境,对龙芯3A5000

摘要:

处理器运算SM2/3/4算法的速度和吞吐量进行了测试,并与其他8款市面上主流的处理器进行了比较;对测试结果进行了分

析,根据英特尔CPU的指令集机制进行了估算,与上一代处理器进行了对比,并对下一代处理器进行了展望。

龙芯处理器;商用密码;指令集;性能

关键词:

10.3969/.1672-7274.2023.09.029

doi:

TP

332

文献标志码:

A

文章编码

:1672-7274(2023)09-

0086

-03

中图分类号:

Performance Analysis of Commercial Cryptographic Instruction Set Operations

for Godson Processors

XU Haibo

(Beijing Saidi Software Evaluation Engineering Technology Center Co., Ltd., Beijing 100048, China)

Abstract: The article introduces the built-in hardware encryption module of the Godson 3A5000 processor, which

supports commercial password SM2/3/4. By building a testing environment, the speed and throughput of the Godson

3A5000 processor's SM2/3/4 algorithm were tested, and compared with eight other mainstream processors on the

market. The test results were analyzed, estimated based on the instruction set mechanism of Intel CPUs, compared

with the previous generation of processors, and looked forward to the next generation of processors.

Key words: godson processor; commercial password; instruction set; performance

1 研究背景

2021年,龙芯中科技术股份有限公司(简称龙芯

中科)官方发布了基于龙芯架构的新一代处理器龙芯

3A5000的消息,“龙芯3A5000实现了自主性和

安全性的深度融合。龙芯3A5000中包括处理器核

心、内存控制器及相关PHY、高速IO接口控制器及相

关PHY、锁相环、片内多端口寄存器堆等在内的所有

模块均自主设计。龙芯3A5000处理器集成了安全可信

模块,支持可信计算体系。龙芯3A5000内置了硬件

加密模块,支持商用密码SM2/3/4及相关算法,其中

[1]

SM3/4密码处理性能达到5 Gbps以上

。”

在测试工程中,经向龙芯中科咨询得知,目前产

品手册等白皮书还没有发布。由于该款处理器刚刚发

布,各操作系统厂商与之适配的操作系统、编译器还在

适配研制过程中,正式版尚未发布。因此此次测试尚未

能检测商用密码算法通过处理器指令集的运算性能。

2.1 测试准备

测试共选取了8款处理器进行对比测试,分别为龙

芯3A5000、龙芯3B5000、龙芯3A4000、龙芯3B4000、

英特尔赛扬J1900、英特尔i5-2400、英特尔i7-2600、英特

尔至强E5-2620V2。(其中3B5000、E5-2620V2为服务器

架构,每台安装了两颗相同的处理器),如表1所示。

表1 测试机机型、处理器、内存、硬盘、操作系统版本等参数

CPU3A40003A50002*3B5000J1900i5-2400i7-2600

CentOS

7.8

16 GB

1 TB

HDD

工控机

2*E5-2620 v2

CentOS

7.8

128 GB

1 TB

HDD

Dell

服务器

2 性能测试

针对此款处理器,为了验证其商用密码指令集运

算性能,笔者第一时间拿到了成品及适配的主板等硬

件,并在实验室开展了初步测试。为了比较该处理器

在商用密码运算方面的性能,还选用了龙芯同期生产

的3B5000处理器及市面上常见的英特尔处理器进行

了比较。

操作

UnionTechUnionTechKylin

系统

OS 20

内存8 GB

硬盘

240 GB

SSD

OS 20

8 GB

500 GB

HDD

桌面PC

V10

32 GB

500 GB

SSD

机架式

服务器

CentOS CentOS

7.8

2 GB

16 GB

SSD

7.8

8 GB

1 TB

HDD

备注桌面PC工控机工控机

作者简介:徐海波(1972-),男,江苏无锡人,高级工程师,硕士研究生,研究方向为软件测评及密码技术。

86

DIGITCW

2023.09

Copyright©博看网. All Rights Reserved.

Technology Analysis

技术分析

与英特尔的酷睿处理器持平,基本接近至强服务器处

理器的运算能力

[4]

DCW

2.2 测试结果(这里只选取了商用密码的测

试结果)

表2 龙芯与英特尔处理器运算商用密码测试结果

测试结果

指标

SM2签名

SM2验签

16

64

SM2

加密

128

256

1024

8192

16384

16

64

SM2

解密

128

256

1024

8196

16384

16

64

128

SM3256

1024

8192

16384

SM4 CBC加密

SM4 CBC解密

SM4 ECB加密

SM4 ECB解密

3A4000

7700

1400

0.2

0.7

1.3

2.7

10.4

68.4

114.2

0.2

0.8

1.6

3.3

12.7

89.8

154.9

0.8

2.0

2.9

3.8

4.8

5.1

5.2

1.8

1.9

1.4

1.4

3A5000

13400

2400

0.3

1.1

2.3

4.6

17.8

118

196.5

0.4

1.4

2.8

5.6

21.9

155.2

268.8

1.0

2.6

3.9

5.1

6.6

7.2

7.2

2.9

3.1

1.6

1.6

3B5000*2

24500

4400

0.5

2.1

4.1

8.2

30.3

146.9

202.5

0.6

2.6

5.1

10.2

40.5

279.8

492.3

1.6

4.3

6.5

8.8

11.9

13.2

13.4

5.4

5.6

2.1

2.1

J1900

38800

11700

0.8

3.1

6

11.7

39.4

128.8

153.7

0.9

3.6

7.1

13.8

49.2

196

249.3

0.5

1.0

1.4

1.7

2.1

2.2

2.2

2.4

2.4

1.9

1.9

i5-2400

111100

30000

2.0

7.9

15.5

29.9

99.2

305.9

359.7

2.3

9.1

18

35.1

124

475.6

595.7

1.1

2.3

3.1

3.7

4.5

4.8

4.8

3.3

3.4

3

3

i7-2600

135000

36500

2.4

9.5

18.9

36

118.1

347.9

401.3

2.8

10.8

21.6

42.6

148.6

540.5

663

1.2

2.5

3.4

4.1

5.0

5.3

5.3

5.9

6

5

4.9

2*E5-

2620 v2

297500

78600

5.3

21

41.3

79.7

267

848

1009

5.8

23.5

45.6

89.2

318.7

1281.8

1621.9

3.1

6.8

9.3

11.3

13.5

14.2

14.2

14.6

14.8

11.9

11.9

2.3.2 龙芯与英特尔处理器执行国际加密算法的

结果分析

本次测试仍采用纯软件计算,以此比较不同处

理器在各计算方式下的性能差别。对于非对称算

法,选取了常用的RSA算法进行比较,在加密/解

密,签名/验签操作方面,龙芯与英特尔处理器的性

能差距非常大,英特尔的酷睿、至强处理器计算速

度比龙芯快10~30倍以上,赛扬处理器也要优于龙

芯处理器的处理能力;对于对称算法,选择了AES

算法进行比较,除英特尔至强服务器处理器优势

相对明显以外,各处理器表现相对比较平均,计算

性能相差不大;对于散列函数算法,选择了SHA1和

SHA256两种算法进行比较,龙芯的计算性能基本达

到英特尔的赛扬处理器的水平,与酷睿、至强相比略

有差距。

2.3.3 英特尔处理器AES算法采用指令集的能力

提升分析

英特尔公司在2008年3月提出了高级加密标准指

令集(或称英特尔高级加密标准新指令,简称AES-

NI),是x86指令集架构的扩展,用于Intel和AMD微

处理器,该指令集的目的是改进应用程序使用高级加

密标准(AES)执行加密和解密的速度。并在随后生产

的大部分处理器中嵌入了AES-NI指令集

[5]

在被测产品中,除赛扬处理器不支持此指令

集,酷睿系列及至强均支持此指令集。

[6]

由于指令

集只针对对称密码算法AES设置,所以测试也只选

择了酷睿和至强的3款处理器,对AES-128、AES-

256两种常见算法的加密/解密进行了测试。对于128

位加解密算法,处理器指令集的处理效率比纯软件

运算有明显的提升,运算速度大约为6~10倍;对于

256位加解密算法,处理器指令集的处理效率比纯软

件运算有明显的提升,运算速度大约为50倍。

注:SM2签名验签的结果为次/秒;SM2加解密选择不同

Byte,结果为Mbps;SM3散列选择不同Byte,结果为Gbps;

SM4加解密结果为Gbps。

2.3 测试分析

2.3.1 龙芯与英特尔处理器执行商用密码算法的

结果分析

由于英特尔处理器不支持商用密码的指令集,龙

芯处理器虽然支持,但操作系统和编译器尚未适配,

所以本次测试均为纯软件计算,以此比较不同处理器

在各计算方式下的性能差别。测试结果表明:对于采

用非对称算法SM2的加解密操作,包括加密/解密,签

名/验签操作,龙芯与英特尔处理器的性能差距比较

大,基本相差一个数量级以上。但是随着运算位数的

[2]

增大,性能差距在逐渐减小;在采用对称算法SM4

的运算能力方面,龙芯与英特尔的赛扬处理器性能相

差不大,但与英特尔酷睿处理器还是有一定差距

[3]

;在

采用SM3的散列函数运算能力方面,龙芯的计算性能

2.3.4 龙芯处理器5000系列与4000系列对比能

力提升分析

龙芯处理器在软件运算速度和处理能力方面,与

英特尔相比还有非常大的差距,尤其是在非对称算法

(RSA、SM2)的计算过程中,由于涉及大量乘除操

作,导致处理速度远远落后于英特尔处理器;在对

称算法(AES、SM4)的计算过程中,大多数均为位

移和异或等操作,所以与英特尔处理器的处理能力

相差不大;对于散列函数(SHA、SM3)的计算,涉

数字通信世界

Copyright©博看网. All Rights Reserved.

2023.09

87

技术

分析

IGITCW

Technology Analysis

如果能对非对称加解密的算法进行指令集成,那性

能提升将是巨大的,高性能的运算也将为商用密码

的应用带来更加广泛的前景。日前,龙芯官方表示

“龙芯3A6000今年上半年会流片回来,单核性能比

3A5000系列提升30%,浮点性能将提升60%。”让

我们拭目以待,纯国产、真自主、高性能、全生态的

龙芯早日登场。■

及位移和映射等操作,所以与英特尔处理器相比略

有差距。

通过对英特尔处理器打开/关闭AES-NI指令集的

测试发现,在处理对称加解密AES算法时,对性能影

响非常大,尤其是相比32位操作与16位操作,使用处

理器指令集的运行速度远远超过纯软件运行速度。但

英特尔处理器的加解密指令集仅限于酷睿以上的处理

器且只支持AES算法。

龙芯5000系列与4000系列相比,各方面性能大约

提升80%。

参考文献

[1] IntelAdvanced Encryption Standard(IntelAES)指令集-Rev 3.01[OL].

(2023-5-25)./content/www/us/en/developer/articles/

tool/.

[2] GM/T 0003.4-2012,SM2椭圆曲线公钥密码算法第4部分:公钥加密算法[S].

[3] GM/T 0002.4-2012,SM4分组密码算法[S].

[4] GM/T 0004.4-2012,SM3密码杂凑算法[S].

[5] 刘璐,徐栋国,裘定心.PROMPT48在TTL集成电路测试中的应用[J].

中国医疗器械信息,1995(3):19-22.

[6] 王毅,万英.基于IIC总线的温湿度测量系统的设计[J].福建师范大学学

报(自然科学版),2014,30(6):40-45,61.

3 结束语

龙芯处理器虽已支持商用密码指令集,但由于

操作系统及编译器适配的问题,还无法测试其性能

有多大的提升,但根据英特尔指令集的测试,乐观估

计其性能应该有10倍左右的提升。英特尔只有AES-

NI指令集,而龙芯的指令集完整地支持SM2/3/4,

(上接第85页)

成本高,运营商的投资成本大,引入IEEE 802.11ax标

准,将5G信号转化为Wi-Fi 6无线信号,智慧农业

园区可以接入海量设备,并且解决5G信号穿透力弱

的问题

[7-8]

(3)智能家居:智能家居中有很多的设备

需要连接到家庭Wi-Fi网络中,如智能灯泡、智

能插板、智能门锁、家用摄像头等,应用IEEE

802.11ax标准,降低了智能家居成本、对低频率的

单品非常适用

[9-10]

高速发展。■

参考文献

[1] 李辕,祁权.Wi-Fi 6技术发展现状综述[J].数字通信世界,2020(11):42-43.

[2] 陈涛,胡园园,王颖.WiFi关键技术与产品演进研究[J].软件导刊,

2020,19(03):215-219.

[3] -Fi 6: The next generation of wireless[R]. California: Cisco, 2019.

[4] 华为.华为Wi-Fi 6(802.11ax)技术白皮书[EB/OL]..

com/cn/material/networking/wlan/b3f46485597c4d72b43a6a2

7c6480646.2019-10-22/

[5] 李项军,张水利,赵海波.WiFi6技术介绍及在能源互联网中的应用

[J].延安大学学报(自然科学版),2021,40(03):83-87.

[6] 韩清娜.智慧城市与5G无线网络的规划设计研究[J].长江信息通信,

2022(12):217-219.

[7] 李哲光.基于Zigbee和NB-IoT无线传感网络的智慧农业[J].河北农机,

2021(10):143-144.

[8] 朱斌.基于物联网技术的智慧农业大棚监测系统研究[J].南方农机,

2023(6):84-86.

[9] 黄立,何一,马志骏,等.人机交互视角下的智能家居研究趋势分析

[J].计算机辅助设计与图形学学报,2023(2):165-184.

[10] 陈国嘉.智能家居[M].北京:人民邮电出版社:,2016.

4 结束语

IEEE 802.11ax技术是目前Wi-Fi应用中的主要

技术标准。IEEE 802.11ax标准通过使用OFDMA、

DL/UL MU-MIMO、1024-QAM调制、双频设计等

技术,提高数据传输速率,增大用户接入量,扩展无

线网络的使用场景。IEEE 802.11ax标准在智能家

居、智慧城市、智慧农业、智慧医疗、智慧交通、智慧

建筑、智能制造等领域有出色的表现,协助IoT领域

88

DIGITCW

2023.09

Copyright©博看网. All Rights Reserved.


发布者:admin,转转请注明出处:http://www.yc00.com/num/1713881358a2337127.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信