2024年4月23日发(作者:)
湖南农业科学(
HUNAN AGRICULTURAL SCIENCES
)
2023(6):88-95
2023年6月
引用格式:
康家和,施平丽,严华兵,等.
基于K-Means分析法的葛根粉电商产品发展现状研究[J]. 湖南农业科学,2023(6):88-95.
DOI:10.16498/.2023.006.018
DOI:
基于K-Means分析法的葛根粉电商产品发展现状研究
康家和
1,2
,
施平丽
2
,
严华兵
2
,
尚小红
2
,
曹 升
2
,
曾文丹
2
,
杜鑫潇
1
,
王爱勤
1
2. 广西农业科学院经济作物研究所,广西 南宁 530007)
摘 要:
该研究运用网络爬虫技术对淘宝网上的葛根粉商品进行信息收集,并使用K-Means分析法对葛根粉商品的月销量、
价格、收藏量、评论量和评分进行聚类分析,总结出我国葛根粉电商产品的发展现状,并为葛根粉电商产品经营提出相应建议。
研究发现,目前我国葛根粉电商产品主要集中在湖北、江苏、湖南、安徽、浙江、江西,占比为69.99%;价格区间为4.60~56.00
元/500 g的葛根粉电商产品为
“红海市场”商品,竞争最为激烈,价格区间为56.00~133.00元/500 g的葛根粉电商产品为“蓝
海市场”商品,是利润的主要来源,葛根粉电商中的高端产品因存在一定的溢价而购买人数较少,为“金牛市场”商品;绝
大多数葛根粉电商产品的收藏量与评论量都低,可能是因为葛根粉电商行业总体顾客关注度较低,市场规模较小;葛根粉电
商商品评分与月销量总体呈显著的正相关关系。在此基础上,提出提升商品精深加工、多元化水平,占据更大市场份额;改
进商品铺货策略,打造全系列商品体系;采用多种策略,提高商品综合评分等建议。
关键词:
葛根粉;电商平台;数据挖掘;K-Means分析
中图分类号:F323.7 文献标识码:A 文章编号:1006-060X(2023)06-0088-08
(1.广西大学农学院,广西 南宁 530004;
Research on the Development Status of Kudzu Root Powder E-Commerce Products Based on
K-Means Analysis Method
KANG Jia-he
1,2
, SHI Ping-li
2
, YAN Hua-bing
2
, SHANG Xiao-hong
2
, CAO Sheng
2
,
ZENG Wen-dan
2
, DU Xin-xiao
1
, WANG Ai-qin
1
(
1. College of Agriculture, Guangxi University, Nanning 530004, PRC;
2. Cash Crops Research Institute, Guangxi Academy of Agricultural Sciences, Nanning 530007, PRC
)
基金项目:
国家自然科学基金(32260680
);国家现代农业产业技
术体系——广西薯类创新团队首席专家项目(nycytxgxcxtd-11-01
);
中国博士后科学基金(2022MD723768
);广西重点研发计划(桂
科AB22080090
);广西农业科学院基本科研业务专项(桂农科
2021YT057);广西特色作物试验站——广西合浦特色薯类作物试验站
项目(TS202128);科技先锋队“强农富民”“六个一”专项行动——
富硒农业产业科技先锋队(经济作物研究所)项目(桂农科盟2022-14
)
作者简介:
康家和(1999
—),男,浙江宁波市人,硕士研究生,
主要从事农村发展研究。
通信作者:
王爱勤
Abstract
:
By using the web crawler technology to collect the information of kudzu root powder products on , and adopting
K-Means analysis method to conduct the cluster analysis on the monthly sales volume, price, collection volume, review volume and score
of kudzu root powder products, the study summarizes the development status of China's kudzu root powder e-commerce products, and
puts forward corresponding suggestions for the management of kudzu root powder e-commerce products. The study finds that China's
kudzu root powder e-commerce products are mainly concentrated in Hubei, Jiangsu, Hunan, Anhui, Zhejiang and Jiangxi provinces,
which account for 69.99% of the total. Kudzu root powder e-commerce products with a price range of 4.60 yuan/500 g to 56.00 yuan/500 g
are "red sea market" commodities, whose competition is the most intense; those with a price range of 56.00 yuan/500 g to 133.00 yuan/500 g are
"blue sea market" commodities, which are the main source of profits; the high-end products are "golden bull market" commodities, having
a smaller number of buyers due to a certain premium. The vast majority of kudzu root powder e-commerce products have low collection
and review volumes, maybe the kudzu root powder e-commerce industry is generally less concerned by customers and the market size
is relatively small. There is a significant positive correlation between the score and the monthly sales volume of kudzu root powder
e-commerce products. Hence, the study suggests improving the level of deep processing and diversification of commodities to occupy a
larger market share; improving commodity distribution strategies to create a full range of the commodity system; adopting a variety of
strategies to improve the comprehensive score of commodities.
Key words
:
kudzu root powder; e-commerce platform; data
收稿日期:
2023
-
02
-
01
mining; K-Means analysis
2022年中央一号文件指出,要持续推进农村
一二三产业融合发展,重点发展农产品加工、乡村
休闲旅游、农村电商等产业,实施“数商兴农”工程,
推进电子商务进乡村。《中国农村电子商务发展报告
(2021—2022)》显示,2021年全国农村网络零售额
为2.05万亿元,占全国网络零售额的
15.66%,同比
-
88
-
农业经济与管理
Copyright©博看网. All Rights Reserved.
康家和等:基于K-Means分析法的葛根粉电商产品发展现状研究
[1]
增长11.3%
。
立K-Means聚类模型,并结合案例分析探究不同价
格区商品的竞争格局、经营策略,以此验证模型的
有效性。石晓雨等
[13]
运用K-Means聚类模型对河北
不同年龄群体的乳制品消费偏好进行分析,并为河
北乳制品行业发展提出对策建议。严敏聪等
[14]
运用
K-Means分析法分析了广东多个A级景区避暑旅游
舒适度。
因此,该研究基于网络爬虫技术对电商平台上
的葛根粉商品进行信息收集,并使用K-Means分析
法对葛根粉商品的月销量、价格、收藏量、评论量
和评分进行聚类分析,从而分析我国葛根粉电商产
品的发展现状,进而为葛根粉电商产品经营提出有
针对性的建议。
在众多农产品中,葛属于豆科蝶形花亚科,是
中华人民共和国国家卫生健康委员会认定的药食同
源植物,素有“亚洲人参”和“南葛北参”的美誉
[2]
。
葛中对人体有益的成分主要是异黄酮类、黄酮类、萜
类化合物等
[3]
,葛根具有改善血液循环,调节血压,
改善冠状动脉硬化,改善心脏功能和心肌代谢等多种
功效
[4-5]
。葛根粉作为一种新兴的绿色保健食品,其
市场前景非常广阔。目前,淘宝、京东、拼多多等各
大电商平台均有葛根粉销售,葛根粉电商已经初见
规模。因此,该研究拟聚焦葛根粉电商产品分析,
以给予葛根粉电商产品经营一定的指导意见,进而
推动葛根粉电商产业的发展。
关于葛根资源开发与利用的研究较多。如杨旭
东等
[6]
指出葛根种质资源开发利用中存在的问题,
提出加强葛根种质资源的调查与研究的建议。尚小
红等
[7]
通过实地调研分析广西粉葛产业发展现状及
优劣势,提出加快粉葛产业链一体化发展等建议。
日本、韩国、泰国等国家每年都大量进口我国的葛根,
通过加工将其制作成葛根粉、葛晶、葛根酒等新型
葛食品
[8]
。然而,关于葛根粉电商产业的实证研究
较为缺乏。
就相应的实证研究方法而言,国内外对大数据
挖掘技术的研究与应用较多。Fong等
[9]
提出一种
新的特征筛选方法,该方法可以应用于高维数据挖
掘,并可通过不同类型的大数据进行验证。Žunić
等
[10]
采用聚类分析法与文本语义处理法对社交媒体
上的大数据信息进行处理,并用案例分析法验证挖
掘技术的有效性。张正阳等
[11]
运用Python网络爬
虫技术对农业网中小白菜的价格信息进行爬取和研
究。其中,聚类分析法的应用领域也非常广泛,如
K-Means分析法可以应用于电商经营、农产品消费、
景区旅游舒适度分析等领域。夏名首等
[12]
在对碧根
果电商商品价格、数量、月销量等数据的挖掘中建
1 数据来源及研究方法
1.1 数据来源
由于淘宝网具有数据量大、信息获取便利、商
家众多等特征,该研究选定淘宝网为数据来源渠道,
以淘宝网上的葛根粉商品为研究对象。考虑到网络
爬虫技术相较于传统大数据抓取技术拥有效率高、
误差率低等优势
[15]
,参考相关文献
[16]
,该研究使用
Python网络爬虫技术收集相关数据。该研究获取了
淘宝网上2022年3月1 263
种葛根粉商品价格、月
(共
销量、地域、评论量、收藏量、评分6个维度的数据
,由于文章篇幅的限制,该研究随机抽
计7 578
个)
。
取其中10种葛根粉商品的信息进行展示(表1
)
1.2 研究方法
在采用网络爬虫技术对淘宝网上的葛根粉商品
进行信息收集的基础上,该研究对葛根粉商品的价
格、月销量、评论量、收藏量、评分指标进行聚类
分析,以获得葛根粉电商产品的销售信息并进行分
析。该研究采用MATLAB
软件中的K-Means聚类
模型。K-Means聚类算法最早是由MacQueen
[17]
提
出的,此算法根据样本的某个属性特征将其划分为
表1 随机样本数据
样 本
商品1
商品2
商品3
商品4
商品5
商品6
商品7
商品8
商品9
商品10
价 格(元/500 g)
81.90
60.00
59.00
36.80
59.90
16.80
188.00
80.00
88.00
48.00
月销量(件)
6 997.00
6 457.00
5 483.00
3 743.00
3 537.00
2 741.00
253.00
76.00
44.00
42.00
地 域
广东广州
湖南张家界
安徽亳州
江苏盐城
上海
福建福州
湖南张家界
湖北随州
浙江金华
云南昆明
评论量(条)
262.00
18 119.00
421.00
6 936.00
1 738.00
2 746.00
1 030.00
280.00
33.00
114.00
收藏量(个)
6 055.00
76 181.00
5 450.00
11 203.00
2 727.00
4 251.00
6 221.00
962.00
75.00
839.00
评 分(分)
13.83
14.67
13.64
14.59
14.64
14.46
14.87
14.64
14.74
14.48
Copyright©博看网. All Rights Reserved.
农业经济与管理
-
89
-
湖南农业科学(
HUNAN AGRICULTURAL SCIENCES
)
2023年6月
K
个簇,使得同一簇的数据相似度高,而不同簇的
数据相似度低。因此,这一算法的核心就在于聚类
簇数量即
K
值的确定
[15]
,而
K
值的确定需要通过多
次验证和迭代,直到达成最好的聚类效果
[18]
。
一是从数据中
K-Means算法的基本步骤如下
:
随机挑选
K
个样本点作为原始的簇中心;二是计算
剩余样本点与簇中心的距离,并把各样本点标记至
离
K
个簇中心最近的类别;三是重新计算各簇中样
本点的均值,并以均值为新的
K
个簇中心;四是不
断重复第二步和第三步,直到簇中心的变化趋于稳
定,形成最终的
K
个簇。K-Means算法中,样本点
到聚类中心的距离一般采用欧氏距离计算公式或余
弦计算公式获得
[19]
,该研究涉及的相关计算则采用
欧氏距离计算公式。若样本点与簇中心之间的距离
用
d
(
x
,
y
)表示,则欧氏距离计算公式具体如公式
(1)所示。
该研究统计出淘宝网上1 263种葛根粉电商
,可将葛根粉电商产
产品的地域分布情况(表2
)
品的地域分布划分为4个类别。第
1类是高密度
区,以湖北、江苏、湖南、安徽、浙江、江西为代
表,该区累计拥有884种商品,占此次数据总量的
69.99%;第2类是较高密度区,
以广东、上海、云南、
北京、广西、河北为代表,该区累计拥有254种商品,
第3类为较低密度区,以辽宁、吉
占比为20.11%
;
林、福建、重庆、山东、四川、河南为代表,该区
累计拥有107种商品,占比为
8.47%;第4类为低
密度区,以黑龙江、贵州、陕西、甘肃、山西为代表,
该区累计拥有18种商品,占比为
1.43%。高密度区
中的湖北、湖南、安徽、江西依托产地优势,江苏、
浙江凭借较好的电商经营环境,都建立起较大规模
的葛根粉电商产业。广西作为葛根粉主要产区之一,
其葛根粉电商发展规模却相对第1类而言较小,可
其一,广西大多销售鲜食葛根,
能的原因主要有2点:
葛根粉加工业规模较小、产业不发达;其二,广西
电商产业发展基础比较薄弱。
(1)
2 结果与分析
2.1 葛根粉电商产品的地域分布
d
(
x
,
y
)
=
∑
2222
(
x
−
y
)
=
(
x
−
y
)
+
(
x
−
y
)
+
...
+
(
x
−
y
)
1122
iinn
i
=
1
n
表2 葛根粉电商产品的地域分布
省 份
湖 北
江 苏
湖 南
安 徽
浙 江
江 西
广 东
上 海
云 南
北 京
广 西
河 北
辽 宁
吉 林
福 建
重 庆
山 东
四 川
河 南
黑龙江
贵 州
陕 西
甘 肃
山 西
商品数量
(种)
251
172
127
119
109
106
70
52
43
37
30
22
18
18
18
16
14
13
10
8
6
2
1
1
主要分布城市
荆门(157种)、十堰(
27种)、宜昌(17种)、襄阳(16种)、恩施(11种)、随州(9种)、武汉(7种)、神农架(4
种)、鄂州(2种)、咸宁(
1种)
盐城(83种)、南京(
38种)、徐州(23种)、镇江(7种)、苏州(5种)、无锡(5种)、淮安(4种)、扬州(4种)、
宿迁(1种)、南通(
1种)、连云港(1种)
张家界(100种)、长沙(
19种)、邵阳(2种)、益阳(2种)、常德(1种)、衡阳(1种)、岳阳(1种)、株洲(1种)
亳州(58种)、合肥(
19种)、池州(14种)、安庆(9种)、六安(9种)、黄山(5种)、宣城(3种)、芜湖(2种)
杭州(62种)、金华(
28种)、衢州(9种)、绍兴(5种)、嘉兴(2种)、宁波(2种)、温州(1种)
上饶(52种)、南昌(
24种)、宜春(12种)、抚州(6种)、吉安(6种)、九江(4种)、赣州(1种)、鹰潭(1种)
广州(46种)、深圳(
11种)、佛山(3种)、梅州(3种)、茂名(2种)、韶关(2种)、清远(2种)、珠海(1种)
上 海(52种)
昆明(21种)、文山(
8种)、楚雄(6种)、红河(4种)、大理(1种)、丽江(1种)、玉溪(1种)、昭通(1种)
北 京(37种)
梧州(9种)、南宁(
7种)、桂林(7种)、贵港(5种)、玉林(2种)
保定(17种)、石家庄(
2种)、沧州(1种)、衡水(1种)、廊坊(1种)
大连(13种)、葫芦岛(
2种)、沈阳(2种)、鞍山(1种)
长春(15种)、白山(
2种)、延边(1种)
厦门(5种)、福州(
5种)、龙岩(2种)、泉州(2种)、漳州(2种)、三明(2种)
重 庆(16种)
枣庄(4种)、临沂(
3种)、青岛(3种)、滨州(1种)、济南(1种)、聊城(1种)、泰安(1种)
成都(11种)、达州(
1种)、广安(1种)
南阳(3种)、郑州(
2种)、焦作(1种)、开封(1种)、信阳(1种)、许昌(1种)、周口(1种)
大兴安岭(4种)、哈尔滨(
3种)、佳木斯(1种)
贵阳(2种)、黔东南(
2种)、黔南(1种)、遵义(1种)
西安(1种)、汉中(
1种)
定 西(1种)
大 同(1种)
-
90
-
农业经济与管理
Copyright©博看网. All Rights Reserved.
康家和等:基于K-Means分析法的葛根粉电商产品发展现状研究
2.2 葛根粉电商产品其他主要数据的描述性
分析
该研究对葛根粉电商产品除地域外的其他主要
。在价格方面,该研
数据进行了描述性统计(表3
)
究对数据进行了预处理,表中显示的价格为500 g
的标准价格,可比性较强。可知,销售价格最小值
为4.60元/500 g
,最大值为698.00元/500 g,标准
差为57.46
,价格波动较大。同时,此表还显示出葛
根粉电商产品月销量、评论量、收藏量、评分的描
述性分析结果。除评分外,其他数据的标准差都比
较大,通过分析可知数据的区间范围较大,波动性
较强。在此情况下,研究数据间的聚类关系会有较
大的价值和较好的效果,故该研究拟进行聚类分析。
表3 葛根粉电商产品其他主要数据的描述性分析
指 标
价 格(元/500 g
)
月销量(件)
评论量(条)
收藏量(个)
评 分(分)
平均值
61.04
107.38
312.95
1 391.23
14.52
标准差
57.46
518.59
1 174.58
4 460.93
0.91
最小值
4.60
0
0
0
11.90
最大值
698.00
7 015.00
18 119.00
76 181.00
15.00
根粉价格范围为56.00~133.00元/500 g
,价格的平
均值为80.20元/500 g
,平均月销量为141.80件,
这一簇内的葛根粉商品数量较多,为423种,占总
量的33.49%
,该簇类的葛根粉产品特征为“较低
价格、高月销量”。第2类是绿色聚类簇
:葛根粉
价格范围为363.00~698.00元/500 g
,价格均值为
459.40元/500 g
,平均月销量为39.10件,这一簇
内的葛根粉产品数量最少,只有11种,占总量的
0.87%,该簇类的葛根粉产品特征为“高价格、低
葛根粉价格范围
月销量”。第3类是淡蓝色聚类簇
:
为133.00~363.00元/500 g
,价格的平均值为190.80
元/500 g
,平均月销量为51.15件,这一簇内的葛根
粉产品数量较少,为66种,占总量的
5.23%,该簇
类的葛根粉产品特征为“较高价格、较低月销量”。
葛根粉价格范围为4.60~56.00
第4类是紫色聚类簇
:
元/500 g
,价格均值为33.46元/500 g,平均月销量
为94.17件,这一簇内的葛根粉产品数量最多,达
到763种,占总量的
60.41%,该簇类的葛根粉产品
特征为“低价格、较高月销量”。
葛根粉电商产品的价格与月销量聚类结果显示,
紫色聚类簇内的葛根粉定价区间为4.60~56.00元/500 g
,
商品有763种,平均月销量为
94.17件,这类商品可以
被定义为“红海市场”商品
[12]
。红色聚类簇内的葛根
商品有423种,
粉定价区间为56.00~133.00元/500 g
,
平均月销量为141.80件,这类商品一般为多年野生
葛根粉,加工工艺精湛,包装精美,品质较高、口
碑较好、价位中等,能给商家带来巨大利润,具有
很好的发展前景,是葛根粉商家需要重点关注的“蓝
海市场”商品
[12]
。而淡蓝色聚类簇和绿色聚类簇所
代表的是葛根粉中的高端产品,这类商品存在一定
的溢价,购买人数较少,可被定义为“金牛市场”
2.3 基于K-Means分析法的葛根粉电商产
品聚类分析
2.3.1 价格与月销量聚类分析
该研究将聚类簇数
量
K
值设置为4
,迭代7次后得到1 263种葛根粉
。红
电商产品的价格与月销量聚类分析结果(图1
)
色、绿色、淡蓝色、紫色圆点依次代表簇1
、簇2、
簇3
、簇4中的元素,
×
为聚类中心点,4个聚类
、(459.40,
中心点的坐标分别为(80.20
,141.80)
、(33.46,94.17)。从图1
39.10)、(190.80
,51.15)
可以看出,葛根粉电商产品的价格与月销量聚类结
果大致按照价格进行分类,分群特征明显,葛根粉
葛
电商产品可被分为4类。第
1类是红色聚类簇:
8 000
7 000
6 000
5 000
4 000
3 000
2 000
1 000
0
月
销
量
(
件
)
100600700
价 格(元/500 g)
图1 葛根粉电商产品的价格与月销量聚类分析结果
Copyright©博看网. All Rights Reserved.
农业经济与管理
-
91
-
湖南农业科学(
HUNAN AGRICULTURAL SCIENCES
)
2023年6月
商品
[12]
。葛根粉电商产品价格与月销量总体呈负相
关关系,销售情况以中低价格商品走量为主。
2.3.2 收藏量与月销量聚类分析
由于葛根粉电商
产品的收藏量和月销量均存在0值,故该研究先对
相应数据进行归一化处理。该研究使用MATLAB
软
件中的mapminmax归一化函数
[20]
,具体如公式(2)
所示。
(2 680.00
,2 561.30)、(25 542.00,25.65)。从图2可
以看出,红色聚类簇的元素最为集中,而绿色、紫
色、淡蓝色聚类簇的元素都很少且比较分散,葛
根粉电商产品可被分为4类。第
1类是红色聚类
簇,表现出明显的“低收藏量、较低月销量”特征。
平均收藏量为846.18个,平均月销量为
49.89件,
这一簇内有1 218
种商品,占总量的96.44%。第2
类是绿色聚类簇,表现出“较高收藏量、高月销量”
X
nom
X
−
X
min
=
X
max
−
X
min
(2)
的特征。平均收藏量为3 071.50
个,平均月销量为
这一簇内仅有6种商品,占总量的0.48%。
6 040.50件,
第3类是淡蓝色聚类簇,表现出“较低收藏量、较
高月销量”的特征。平均收藏量为2 680.00
个,平
均月销量为2 561.30
件,这一簇内的商品数量较少,
仅有14种,占总量的
1.11%。第4类是紫色聚类簇,
表现出“高收藏量、低月销量”的特征。平均收藏
量为25 542.00
个,平均月销量为25.65件,这一簇
X
nom
为原始数据
X
归一化后的值,
X
min
式中:
为
X
的最小值,
X
max
为
X
的最大值。
该研究将聚类簇数量
K
值设置为4,迭代6
次后得到1 263
种葛根粉电商产品的收藏量与月
销量聚类分析结果(图2)。4个聚类中心点的坐
、(3 071.50,6 040.50)、
标分别为(846.18
,49.89)
8 000
7 000
6 000
月
销
量
(
件
)
5 000
4 000
3 000
2 000
1 000
0
12
34
×10
4
收藏量( 个)
5678
图2 葛根粉电商产品的收藏量与月销量聚类分析结果
内仅有25种商品,占总量的1.98%。
葛根粉电商产品的收藏量与月销量聚类结果显
示,红色聚类簇代表的低收藏量、较低月销量葛根
粉产品数量占比为96.44%
,这说明大多数葛根粉产
品的收藏量与月销量呈现正相关关系,大多数产品
的收藏量低,顾客关注度低。而另外3个聚类簇的
葛根粉产品占比都比较小,其中,较高收藏量、高
月销量的绿色聚类簇为葛根粉头部商品。收藏夹中
的商品是买家经过筛选后有好感的商品,收藏行为
在一定程度上表现出了买家的购买意愿
[21]
,而绝大
多数的葛根粉产品都集中在具有“低收藏量、较低
月销量”特征的红色聚类簇,可能是因为葛根粉作
为一种新兴的保健食品,其吸引力还较低、关注人
数还较少,目前仍属于较为小众的保健产品。
2.3.3 评论量与月销量聚类分析
由于葛根粉电商
产品的评论量和月销量均存在0值,故该研究先对
-
92
-
农业经济与管理
相应数据进行归一化处理,具体如公式(2
)所示。
该研究将聚类簇数量
K
值设置为4
,迭代18次后
得到1 263
种葛根粉电商产品的评论量(包括默认
评论量与有效评论量)与月销量聚类分析结果(图
、
3)。4个聚类中心点的坐标分别为(
134.34,58.50)
、(688.27,4 271.90)、(12 004.00,
(3 129.60
,31.61)
40.62)。根据图3显示的聚类分析结果,该研究将葛
根粉电商产品分成以下4类。第
1类为红色聚类簇,
其特征为“低评论量、较高月销量”。评论量均值为
134.34条,平均月销量为
58.50件,这一簇包含了1
199种商品。第2类为绿色聚类簇,其特征为“较高
评论量、低月销量”。评论量均值为3 129.60
条,平
均月销量为31.61件,这一簇包含了
41种商品。第
3类为淡蓝色聚类簇,其特征为“较低评论量、高
月销量”。评论量均值为688.27条,平均月销量为
4
271.90件,这一簇包含了
15种商品。第4类为紫色
Copyright©博看网. All Rights Reserved.
康家和等:基于K-Means分析法的葛根粉电商产品发展现状研究
8 000
7 000
6 000
月
销
量
(
件
)
5 000
4 000
3 000
2 000
1 000
0
0.20.40.6
0.8
1.0
4
1.2
1.4
1.6
1.82.0
评论量( 条)×10
图3
葛根粉电商产品的评论量与月销量聚类分析结果
聚类簇,其特征为“高评论量、较低月销量”。评论
量均值为12 004.00
条,平均月销量为40.62件,这
一簇包含了8种商品。
葛根粉电商产品的评论量与月销量聚类结果显
示,红色聚类簇内集中了1 199
种产品,占总量的
94.93%,这说明大多数葛根粉产品的评论量处于低
水平。同时,通过对比第1
、2、4类聚类簇与第3
类聚类簇月销量的差异发现,绝大多数葛根粉产品
的月销量都低于均值的107.38件,淡蓝色聚类簇所
代表的头部产品拉高了整体的平均值。
2.3.4 评分与月销量聚类分析
该研究将聚类簇数
量
K
值设置为4
,对葛根粉电商产品的评分(包括
产品描述分、物流服务分、卖家服务分3项,每个
单项分值均为5分,总分为
15分)和月销量进行
聚类分析,迭代7次后得到1 263
种葛根粉电商
产品的评分与月销量聚类分析结果(图4)。4个
、(14.62,
聚类中心点的坐标分别为(14.54,57.32
)
、(13.86,52.02)。
4 271.90)、(14.81
,59.19)
根据图4显示的聚类分析结果,该研究将葛根粉
电商产品分成以下4类。第
1类是红色聚类簇,其
商品评分为14.21~14.67分,平均值为
14.54分,平
均月销量为57.32件,这一簇内的产品有
613种,
可被认为是目前葛根粉电商的主要商品,特征为“较
低评分、较低月销量”。第2类是绿色聚类簇,其商
品评分为14.32~14.96分,平均值为
14.62分,平均
月销量为4 271.90
件,这一簇内的产品有15种,特
征为“较高评分、高月销量”,可被认为是居于头
部的葛根粉电商商品,由知名、品牌公司经营,口
碑较好。第3类是淡蓝色聚类簇,其商品评分为
14.68~15.00分,平均值为
14.81分,平均月销量为
59.19件,这一簇内的产品有
508种,其特征为“高
评分、较高月销量”,可被定义为中坚产品。第4类
为紫色聚类簇,其商品评分为11.90~14.20
分,平均
值为13.86分,平均月销量为
52.02件,这一簇内的
,可
产品有127种,其特征为“低评分、低月销量”
被视为新兴商品,口碑仍需要一定时间积累。葛根
粉电商商品评分与月销量总体呈现明显的正相关关
系,评分较高的商品口碑较好,月销量相对较高。
8 000
7 000
6 000
月
销
量
(
件
)
5 000
4 000
3 000
2 000
1 000
0
11.512.012.5
13.0
13.5
评 分(分)
14.0
14.515.0
图4 葛根粉电商产品的评分与月销量聚类分析结果
Copyright©博看网. All Rights Reserved.
农业经济与管理
-
93
-
湖南农业科学(
HUNAN AGRICULTURAL SCIENCES
)
2023年6月
3 结论与建议
品的挖掘,适当增加此类葛根粉产品数量,同时关
注高端溢价产品,通过这类产品吸引消费者的注意,
打造低、中、高3个档次的葛根粉产品体系。商家
应明确不同价位葛根粉产品的市场定位,有所侧重
地改进商品铺货策略:在低价位葛根粉产品的铺货
方面,商家应注意奠定商品的销量和口碑基础;中
价位的葛根粉产品是赢得市场占有率的关键所在,
商家应将其作为重点产品进行铺货;在高价位葛根
粉产品的铺货方面,商家应聚焦高端市场突破与品
牌价值提升,从而在激烈的市场竞争中赢得先机。
3.2.3 采用多种策略,提高商品综合评分
淘宝网
上电商产品的评分由产品描述分、卖家服务分、物
流服务分3个方面构成,代表了商品的综合实力,
不仅影响商品权重,也影响商品在搜索页面的排名,
因此,商家要重视对商品评分的经营,实现分数的
积累,以形成良好的口碑。提高产品描述分要求商
家在葛根粉商品的介绍中做到真实客观,对商品规
格进行明确描述,不夸大产品功效,并制作出精美
的展示页面。提高卖家服务分的途径主要是加强对
商品客服的培训,提高其沟通水平,同时利用一些
插件开通订单关怀、物流提醒、签收提醒等功能,
使买家真正感受到商家的细心服务。由于淘宝网上
的商品物流多为第三方承包,物流服务分的可控性
相对较差,因此,卖家需要多方对比物流公司的服
务质量,在考虑成本的同时尽量选择服务态度好、
发货运输速度快、退换货便利的物流公司,以保障
消费者良好的消费体验。
3.1 结 论
该研究基于网络爬虫技术对淘宝网上的葛根粉
电商产品进行信息收集,并运用K-Means分析法对
葛根粉电商产品的月销量、价格、收藏量、评论量
和评分分别进行二维聚类分析,从而总结出我国葛
根粉电商产品的发展现状,得出主要结论如下。其
一,目前我国葛根粉电商产品主要分布在24个省份,
可被划分为4个类别,葛根粉电商产品主要集中在
高密度区,即湖北、江苏、湖南、安徽、浙江、江
西,占比为69.99%
。其二,葛根粉电商产品的价格
与月销量总体呈负相关关系,销售情况以中低价格
商品走量为主:定价区间为4.60~56.00元/500 g
的
葛根粉电商产品是葛根粉电商经营者需要重点关注
的“红海市场”商品,竞争最为激烈;定价区间为
56.00~133.00元/500 g
的葛根粉电商产品市场潜力
大,为“蓝海市场”商品,可以为经营者带来巨大利润;
葛根粉电商中的高端产品存在一定的溢价,购买人
数较少,为“金牛市场”商品。其三,绝大多数葛
根粉电商产品的收藏量与评论量都低,可能是因为
葛根粉电商行业总体顾客关注度较低,市场规模较
小。其四,葛根粉电商商品评分与月销量总体呈现
显著的正相关关系,评分较高的商品口碑较好,月
销量相对较高。
3.2 建 议
3.2.1 提升商品精深加工、多元化水平,占据更大
市场份额
葛根粉产品开发和经营者要掌握消费者
的消费习惯与消费能力信息,聚焦不同消费群体的
多元化、个性化消费需求,开展葛根粉精深加工,
提升葛根粉的品质和多元化水平,实现对葛根粉产
品的分类管理。如针对青年群体生活节奏较快的情
况开发代餐粉等功能性葛根粉产品;针对中老年群
体开发养生保健效果好、营养元素丰富、性价比较
高的葛根粉产品等。同时,葛根粉产品开发和经营
者要研发改进葛根粉中葛根素与淀粉的提取工艺,
减少葛根素等营养物质的流失,助推产品走上多元
化、系列化的生产轨道;开发多种制作工艺,提高
产品附加值,并辅以相应的宣传手段,加大宣传力
度,进一步提升产品知名度,以期占据更大市场份额,
提高商品的经济效益。
3.2.2 改进商品铺货策略,打造全系列商品体系
基于此次数据分析的结果可知,单一化的商品铺货
策略难以达到良好的经营效果,最佳方案应为进行
葛根粉商品全系列铺货:商家应注重对优质优价商
-
94
-
农业经济与管理
4 讨论与展望
该研究数据采集的样本仅来自淘宝电商平台,
数据采集面显得单一;同时,该研究仅对葛根粉电
商产品的月销量、价格、收藏量、评论量、评分进
行了二维聚类分析。因此,后续研究可以选择来自
多个电商平台的样本,综合考虑多种指标并且进行
高维度聚类分析,以获得更好的聚类效果,从而为
葛根粉电商产业的发展提供更为科学的参考。
参考文献:
[1] 中国农村电子商务发展报告(2021—2022)[EB/OL]. (2022-11-02)
[2023-01-06]. /dy/article/HL5PGCCA0519D9DS.
html.
[2] 林志銮,金晓怀,张传海,等. 离子液体超声波辅助提取白花葛
茎多糖工艺优化[J].
江苏农业学报,2020,36(1):187-193.
[3] 顾志平,陈碧珠,冯瑞芝,等. 中药葛根及其同属植物的资源利
用和评价[J].
药学学报,1996,31(5):387-393.
[4] JUN M,FU H Y
,HONG J,et al. Comparison of antioxidant
Copyright©博看网. All Rights Reserved.
康家和等:基于K-Means分析法的葛根粉电商产品发展现状研究
activities of isoflavones from kudzu root (
Pueraria lobata
Ohwi)[J].
:29-制品消费偏好集群分析[J]. 河北农业科学,2021,25(2)
33,89.
[14] 严敏聪,翁佳烽,林汝城,等
. 基于
K
-means的广东A级景区
避暑旅游舒适度分析[J]. 广东气象,2022,44(2):46-49.
[15] 李翠玲,李余康,谭昊然,等. 基于K-means聚类和RF算法
的葡萄霜霉病检测分级方法[J]. 农业机械学报,2022,53(5):
225-236,324.
[16] 胡雅淇,林 海
. 在线评论特征对生鲜电商农产品销量的影响:
来自淘宝羊肉大数据的证据[J]. 中国农业大学学报,2021,26(6):
206-218.
[17] MACQUEEN J. Some methods for classification and analysis
of multivariate observations[C]//LE CAM L M,NEYMAN J.
Proceedings of the Fifth Berkeley Symposium on Mathematical
Statistics and Probability. Berkeley,CA:University of California
Press,1967.
[18] 童婉迪. 基于优化的K-means算法的电信业手机用户细分及维
护策略研究[D].
合肥:安徽大学,2021.
[19] 王青青. 基于电商平台的农产品大数据关键信息挖掘研究[D].
西安:西安邮电大学,2020.
[20] 乔冰琴,段全虎,高翠莲
. 企业大数据分析挖掘及大数据BI工
具应用实践[J]. 会计之友,2021(24):131-137.
[21] 陈学旺,樊 丹. 淘宝网中店铺收藏量与网店绩效的关系研究[J].
商场现代化,2014(5):50.
Journal of Food Science,2003,68(6):2117-2122.
[5] YANG N,LI S
,LIU S,et al. Insulin resistance-related proteins
are overexpressed in patients and rats treated with olanzapine and
are reverted by pueraria in the rat model[J]. Journal of Clinical
Psychopharmacology,2019,39(3):214-219.
[6] 杨旭东,王爱勤,何龙飞. 葛根种质资源及其开发利用研究进展
[J]. 中国农学通报,2014,30(24):11-16.
[7] 尚小红,曹 升,严华兵,等. 广西粉葛产业现状分析及其发展
建议[J].
南方农业学报,2021,52(6):1510-1519.
[8] 张长贵,王兴华,谢伍容. 葛资源开发与利用研究[J]. 粮食与油
脂,2009(9):41-44.
[9] FONG S,BIUK-AGHAI R P
,SI Y-W. Lightweight feature
selection methods based on standardized measure of dispersion for
mining big data[C]//IEEE. 2016 IEEE International Conference on
Computer and Information Technology (
CIT). Nadi:IEEE,2016.
[10] ŽUNIĆ E,DJEDOVI
Ć
A,
Đ
ONKO D. Application of big data
and text mining methods and technologies in modern business
analyzing social networks data about traffic tracking[C]//IEEE. 2016
XI International Symposium on Telecommunications (BIHTEL
).
Sarajevo:IEEE,2016.
[11] 张正阳,任保见,刘 娜. Python网络爬虫在农业网络数据获
取中的研究[J]. 现代化农业,2022(7):50-53.
[12] 夏名首,刘玉林. 基于K-MEANS聚类的电商店铺经营策略分析
[J]. 商业经济研究,2017(5):52-54.
[13] 石晓雨,唐晓雨,王肖丽,等
. 基于K-means聚类的河北省乳
(责任编辑:袁萍萍)
Copyright©博看网. All Rights Reserved.
农业经济与管理
-
95
-
发布者:admin,转转请注明出处:http://www.yc00.com/news/1713828064a2326726.html
评论列表(0条)