Java教程

大型数据库的应用项目之基于中文新闻分词绘制词云图

本文主要是介绍大型数据库的应用项目之基于中文新闻分词绘制词云图,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

项目:基于中文新闻分词绘制词云图

一、项目关键实现:jieba中文分词、分词结果统计、词云图展示、前端树形结构展示

二、项目关键技术:jsp,servlet,mvc模式,ajax,echarts,mysql数据库,jieba分词,python。

三、项目关键步骤:前后端词云数据交互,前后端折线图数据交互,前端页面展示。

四、项目展示:

      文末有源码地址,希望多多支持!!

1、数据导入展示:

将所有类别的新闻导入数据库中。以树形目录形式展示新闻类别,每个树形节点代表新闻分类,括号中代表该类新闻的数量,选择每个新闻,以列表形式显示新闻标题,点击新闻标题,可以查看详细信息。

1.1将excel里的新闻数据导入mysql

首先分别建立八个类别的新闻数据表与总新闻数据表:

1.2在前端页面建立新闻类别的树形目录

index.jsp:

 

finance.jsp:

其他类型新闻展示界面类似

1.3 新闻详细内容查看界面

    点击标题后的查看即可显示对应内容

1.4 前端目录结构

 

2、文章统计:

2.1 建立新闻数据统计表

 

2.2 将数据库的数据从后端导出

建立Bean层:

 

建立Dao层

 

建立DB层:

 

建立servlet层

2.3 将后端的数据通过ajax传到前端页面

2.4 效果展示:

 

3、文章分词:

 使用中文分词算法解析所有新闻正文,并统计每个词语出现的数量,并以词云图的方式展示,点击词云图中该词语,显示其数量。

   3.1建立python项目,将各类型新闻内容分别放在txt文件中(以教育新闻为例)

    3.2 用python连接mysql数据库,然后将jieba分词的结果导入mysql

建立分词统计表后,导入jieba依赖:

import jieba

import jieba.analyse

import pymysql

运行项目,得到分词统计结果:

3.3 将分词结果表中的数据用ajax技术导入到前端词云界面    

3.4 效果展示:

总词云:

分类词云:

以上即为项目的所有内容。

项目源码地址:https://pan.baidu.com/s/1HJ9hBG0CSPDWJYkDz1QdDg

提取码9999,希望多多点赞,评论支持

这篇关于大型数据库的应用项目之基于中文新闻分词绘制词云图的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!