当当商品数据分析系统

作者：5f208d8a — 已发布 2021/01/21 05:17:00 GMT+0, 上次修改时间: 2022-05-08T05:58:05+00:00

在我国互联网兴起的浪潮中，涌现了淘宝网、京东网两大电商巨头以其B2B经营模式引领电商快速发展。而当当网以其独特的B2C经营模式、也占据着电商平台市场的较大份额。马云说过淘宝网并不是一家电子商务公司，而是一家数据公司、一个数据平台。淘宝网也好、当当网也好，随着用户的增多、商品种类的剧增，所产生的商品信息数据，用户消费记录数据、用户评论数据等都有着潜在的价值。

项目描述

本系统主要对当当网商品的价格、评论、畅销度、地理主题等维度进行分析。主要完成以下功能：

1）数据采集通过爬虫scrapy框架进行了关键字检索爬取。

2）数据预处理使用pandas、numpy进行归一化处理。

3）数据挖掘使用NLP、KNN、K-means等算法对用户评论进行情感分析。

4）数据展现用Echarts进行数据可视化，直观呈现给用户。

项目背景

当当网的图书一直是中国图书市场和中国文化生活趋势的风向标，占据了图书零售绝大部分的市场份额。本项目通过数据可视化的方式对当当网的商品销售情况进行图解，并针对数据分析结果给出更好的建议。

项目功能

1.数据采集

用户进行热销书籍检索，根据价格、评论（好评率、评论量）推荐给用户。

当当商品数据分析系统-3.jpg

2.数据分析

对当当网主打的商品进行数据分析，包括价格、评论、好评率、地域分析等维度。

3.数据可视化

利用平台交易份额、数字化阅读方式、图书分类、购书分布、最受欢迎作者、读者年龄分布、阅读率城乡比等多个维度的信息，组成完整的可视化大屏信息。

当前市场销量最好的是教育类书籍，这表示书籍市场大部分客户为学生家长及学生，商家可以加大对教育类书籍的种类及数量，适当加大折扣力度，提高市场竞争力。

电子类书籍均以小说为主，很多消费者在购买纸质书的同时也会购买电子书，对于当代人生活节奏加快，越来越多人利用碎片时间学习，建议电子书不要局限在小说，也应在工具书上多推出电子版，增加客户群提高销量。

项目架构

用户进入当当商品数据分析系统后，对关注的商品进行关键词的检索。系统会检查数据库中是否有相关商品的信息数据，如果存在，就会以可视化的形式展现相关商品的信息。并综合多维度的评估后，将最适合用户的商品推荐给用户。

当当商品数据分析系统-6.jpg