下载地址:https://download.csdn.net/download/qq_31293575/18340399
python mysql图书爬虫可视化源码+论文(原价1.3k)
本 科 生 毕 业 设 计 (论 文)
题目:畅销图书销售评论数据分析与可视化
教学单位
姓 名
学 号
年 级
专 业
指导教师
职 称
2021年 4 月 28日
目录
第1章畅销图书销售评论数据分析与可视化. 5
1.1选题背景及意义. 5
1.2国内外研究现状. 6
1.3 开发环境与开发工具简介. 7
1.3.1 开发环境. 7
1.3.2 工具介绍. 8
1.4 毕业设计主要内容. 9
第二章 系统相关技术. 10
2.1情感分析算法介绍. 10
2.2文本情感分析分类. 10
2.3基于词典的文本情感分析方法. 11
2.4自然语言处理介绍. 11
2.5情感测评. 11
2.6数据采集与预处理. 12
第三章 系统分析. 18
3.1需求分析. 18
3.2 情感计算流程分析. 18
3.3 数据流程分析. 18
3.3.1商品ID数据流程. 18
3.3.2评论数据流程. 22
3.3.3情感分析流程. 26
3.4 数据字典. 30
第4章 系统结构设计. 31
4.1 总体结构设计. 31
4.2 数据库设计. 31
4.3代码设计. 33
第五章 情感分析系统实现与测试. 34
5.1 系统功能实现. 34
5.1.1通过图书ID获取图书数据. 34
5.1.2通过图书ID展示数据报表. 35
5.1.3 通过图书种类、商品页数、评论页数爬取. 37
5.2情感计算. 37
5.3系统测试. 42
5.3.1测试目的. 42
5.3.2模块测试. 42
5.3.3 系统调试. 42
总结与展望. 43
参考文献. 44
致谢. 46
引 言
伴随着社会发展的发展趋势,人们早已进到大数据时期,不但数据类型多种多样,并且数据量巨大,一般的运用数据的方式早已不可以达到时期的要求。怎样在这一大数据时期, 高效率而又方便快捷的获得本身所必须的人性化数据, 就变为一个大伙儿急需解决处理的难题。Python语言表达拥有简单易学的特性, 英语的语法清楚,在数据实际操作层面拥有一定的优点,也因而变成了数据采集和可视化行业的受欢迎语言表达。本毕业论文主要是掌握和科学研究数据的采集和数据可视化的现况,并开展数据采集和数据可视化脚本制作的开发设计[1]。脚本制作的完成,是应用python来做为编程语言,其关键分三个一部分:数据的采集、数据的清洗和数据的可视化。采集数据时关键应用selenium库,采集的知网论文查重数据,并将采集到的原始数据存储到MySQL数据库文件,以后对原始的毕业论文数据开展清洗、过虑、归纳和升级储存,而且应用django库来对清洗后的数据开展解决、统计分析和数据可视化。本脚本制作根据对互联网技术上的有关数据,开展采集、清洗、可视化等实际操作,获得可视化的結果,借此机会来提高数据的展现实际效果,促使客户可以更为清楚和全透明的去观查数据,从而能发觉数据中隐藏的信息,在短期内内了解数据身后的使用价值与规律性,来处理社会意识的一些难题这些[2]。
本为的网络爬虫程序主要采用Python脚本语言。使用wx库构造图形界面便于操作,即通过点击对应按钮触发相应功能。数据存储使用mysql保存,以便于数据的读取并将数据可视化。情感分析采用BosonNLP情感分析,通过对评论文本作出自然语言的感情分析。
毕业论文、课程设计、公司项目参考