基于大数据技术的中秋月饼销售数据分析
一、项目描述
本项目采用了网络爬虫、数据清洗、数据分析及数据可视化等大数据技术对中秋月饼的销售数据做了数据分析。通过对中秋月饼销售数据的采集、清洗、分析和可视化展示,可以直观的了解全国范围内各品牌月饼的受欢迎程度。
二、项目背景
大数据是现代社会高科技发展的产物,相对于传统的数据分析,它是海量数据的集合,它以采集、整理、清洗、存储、分析、应用等为核心,正广泛地应用在军事、金融、环保、通信等各个领域中。当前,发展大数据已经成为国家战略,大数据在引领经济社会发展中的新引擎作用更加明显。
大数据技术的近几年发展的很快,已经融入到了生活、工作的方方面面,同时为解决身边的问题提供了新思路和新方法。
中秋节在我国的传统节日中占据着非常重要的地位,而月饼是中秋节不可缺少的部分。本项目主要对中秋月饼的销售情况做了数据分析,解释了大家心中的一些疑问:哪些月饼卖得好?月饼的价格分布是怎样的?什么地方的月饼销量最高呢?本项目通过爬取淘宝网月饼的销量数据做了数据分析,来帮助解决这些问题。
三、系统设计
本系统主要包括数据采集、数据清洗、数据分析及数据可视化展示等模块。如下图所示:
通过网络爬虫从电商网站获取月饼的销售数据作为数据来源,然后再数据清洗。清洗后的部分数据如下图所示:
然后再做数据分析,并将分析结果以可视化的形式展示。
四、数据可视化展示
数据分析的结果展示如下:
商品销量排名top10:
由上图可以看到销量排名前10的产品中,稻香村月饼占据了3个席,说明稻香村月饼还是很受欢迎的。还有一个名字特别熟悉:五芳斋,可能很多人只知道五芳斋的粽子做的好,其实他的月饼也是很受欢迎。
店铺销量排名top10:
这里的店铺销量排名和第一张图的商品销量排名结果不谋而合,就不再过多的解释了。
全国月饼销量的地域分布地图:
从上图可以看出,广东、浙江、山东、福建、北京的月饼销量在全国都是遥遥领先的。查阅资料可以发现,它们几乎都有自己的特色,像广东的广式月饼、山东的鲁式月饼等。广式月饼重油重糖、京式月饼重油轻糖、鲁式月饼口味清淡、苏式月饼重甜。
月饼销售关键字的词云图:
从月饼销售关键字的词云图可以发现,广式月饼极其受欢迎,其次五仁月饼也一直卖的不错。还有现在出来的各种各样的新鲜口味,如美心、酥皮、心奶、燕窝、白莲等等。
通过以上对月饼销售数据的分析,相信对月饼的种类及销售情况有了更多的认知,对以后月饼的选购也有指导意义。