当当商品数据分析系统

作者:5f208d8a — 已发布 2021/01/21 05:17:00 GMT+0, 上次修改时间: 2022-05-08T05:58:05+00:00
在我国互联网兴起的浪潮中,涌现了淘宝网、京东网两大电商巨头以其B2B经营模式引领电商快速发展。而当当网以其独特的B2C经营模式、也占据着电商平台市场的较大份额。马云说过淘宝网并不是一家电子商务公司,而是一家数据公司、一个数据平台。淘宝网也好、当当网也好,随着用户的增多、商品种类的剧增,所产生的商品信息数据,用户消费记录数据、用户评论数据等都有着潜在的价值。

项目描述

        本系统主要对当当网商品的价格、评论、畅销度、地理主题等维度进行分析。主要完成以下功能:

        1)数据采集通过爬虫scrapy框架进行了关键字检索爬取。

        2)数据预处理使用pandas、numpy进行归一化处理。

        3)数据挖掘使用NLP、KNN、K-means等算法对用户评论进行情感分析。

        4)数据展现用Echarts进行数据可视化,直观呈现给用户。

项目背景       

        当当网的图书一直是中国图书市场和中国文化生活趋势的风向标,占据了图书零售绝大部分的市场份额。本项目通过数据可视化的方式对当当网的商品销售情况进行图解,并针对数据分析结果给出更好的建议。

项目功能

    1.数据采集

        用户进行热销书籍检索,根据价格、评论(好评率、评论量)推荐给用户。

当当商品数据分析系统-3.jpg

    2.数据分析

        对当当网主打的商品进行数据分析,包括价格、评论、好评率、地域分析等维度。

当当商品数据分析系统-7.jpg

    3.数据可视化

        利用平台交易份额、数字化阅读方式、图书分类、购书分布、最受欢迎作者、读者年龄分布、阅读率城乡比等多个维度的信息,组成完整的可视化大屏信息。

        当前市场销量最好的是教育类书籍,这表示书籍市场大部分客户为学生家长及学生,商家可以加大对教育类书籍的种类及数量,适当加大折扣力度,提高市场竞争力。

        电子类书籍均以小说为主,很多消费者在购买纸质书的同时也会购买电子书,对于当代人生活节奏加快,越来越多人利用碎片时间学习,建议电子书不要局限在小说,也应在工具书上多推出电子版,增加客户群提高销量。

当当商品数据分析系统-2.jpg

项目架构

        用户进入当当商品数据分析系统后,对关注的商品进行关键词的检索。系统会检查数据库中是否有相关商品的信息数据,如果存在,就会以可视化的形式展现相关商品的信息。并综合多维度的评估后,将最适合用户的商品推荐给用户。

当当商品数据分析系统-6.jpg