项目:基于中文新闻分词绘制词云图
一、项目关键实现:jieba中文分词、分词结果统计、词云图展示、前端树形结构展示
二、项目关键技术:jsp,servlet,mvc模式,ajax,echarts,mysql数据库,jieba分词,python。
三、项目关键步骤:前后端词云数据交互,前后端折线图数据交互,前端页面展示。
四、项目展示:
文末有源码地址,希望多多支持!!
1、数据导入展示:
将所有类别的新闻导入数据库中。以树形目录形式展示新闻类别,每个树形节点代表新闻分类,括号中代表该类新闻的数量,选择每个新闻,以列表形式显示新闻标题,点击新闻标题,可以查看详细信息。
1.1将excel里的新闻数据导入mysql
首先分别建立八个类别的新闻数据表与总新闻数据表:
1.2在前端页面建立新闻类别的树形目录
index.jsp:
finance.jsp:
其他类型新闻展示界面类似
1.3 新闻详细内容查看界面
点击标题后的查看即可显示对应内容
1.4 前端目录结构
2、文章统计:
2.1 建立新闻数据统计表
2.2 将数据库的数据从后端导出
建立Bean层:
建立Dao层
建立DB层:
建立servlet层
2.3 将后端的数据通过ajax传到前端页面
2.4 效果展示:
3、文章分词:
使用中文分词算法解析所有新闻正文,并统计每个词语出现的数量,并以词云图的方式展示,点击词云图中该词语,显示其数量。
3.1建立python项目,将各类型新闻内容分别放在txt文件中(以教育新闻为例)
3.2 用python连接mysql数据库,然后将jieba分词的结果导入mysql
建立分词统计表后,导入jieba依赖:
import jieba
import jieba.analyse
import pymysql
运行项目,得到分词统计结果:
3.3 将分词结果表中的数据用ajax技术导入到前端词云界面
3.4 效果展示:
总词云:
分类词云:
以上即为项目的所有内容。
项目源码地址:https://pan.baidu.com/s/1HJ9hBG0CSPDWJYkDz1QdDg
提取码9999,希望多多点赞,评论支持