1.数据分析与挖掘技术
(1)什么是数据分析与挖掘技术:
(2)数据分析与挖掘技术能做什么事:
发掘用户潜在需求;
实现信息的个性化推送;
发现疾病与症状之间的规律等
(3)数据挖掘的过程:
定义目标
获取数据
数据探索
数据预处理
挖掘建模
模型评价与发布
2.相关模块简介与安装
(1)相关模块的简介:
numpy:高效处理数据
pandas:主要进行数据探索和数据分析
matplotlib:作图模块
scipy:主要进行数值计算
statsmodels:主要用于统计分析
Gensim:主要用于文本挖掘
sklearn,kera:前者机器学习,后者深度学习
(1)导入csv数据:
cdv:一种常见的数据格式
import pandas as pda
pda.read_csv(“地址”)
(2)导入Excel数据:
(3)导入MySQL数据库里的数据:
import pymysql
conn=pymysql.connect()
(4)导入html数据:
(5)导入txt文本数据: