当当商品数据分析系统
项目描述
本系统主要对当当网商品的价格、评论、畅销度、地理主题等维度进行分析。主要完成以下功能:
1)数据采集通过爬虫scrapy框架进行了关键字检索爬取。
2)数据预处理使用pandas、numpy进行归一化处理。
3)数据挖掘使用NLP、KNN、K-means等算法对用户评论进行情感分析。
4)数据展现用Echarts进行数据可视化,直观呈现给用户。
项目背景
当当网的图书一直是中国图书市场和中国文化生活趋势的风向标,占据了图书零售绝大部分的市场份额。本项目通过数据可视化的方式对当当网的商品销售情况进行图解,并针对数据分析结果给出更好的建议。
项目功能
1.数据采集
用户进行热销书籍检索,根据价格、评论(好评率、评论量)推荐给用户。
2.数据分析
对当当网主打的商品进行数据分析,包括价格、评论、好评率、地域分析等维度。
3.数据可视化
利用平台交易份额、数字化阅读方式、图书分类、购书分布、最受欢迎作者、读者年龄分布、阅读率城乡比等多个维度的信息,组成完整的可视化大屏信息。
当前市场销量最好的是教育类书籍,这表示书籍市场大部分客户为学生家长及学生,商家可以加大对教育类书籍的种类及数量,适当加大折扣力度,提高市场竞争力。
电子类书籍均以小说为主,很多消费者在购买纸质书的同时也会购买电子书,对于当代人生活节奏加快,越来越多人利用碎片时间学习,建议电子书不要局限在小说,也应在工具书上多推出电子版,增加客户群提高销量。
项目架构
用户进入当当商品数据分析系统后,对关注的商品进行关键词的检索。系统会检查数据库中是否有相关商品的信息数据,如果存在,就会以可视化的形式展现相关商品的信息。并综合多维度的评估后,将最适合用户的商品推荐给用户。