【学习打卡】第9天清理数据重复值、缺失值、拆分

本文主要是介绍【学习打卡】第9天清理数据重复值、缺失值、拆分，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

课程名称：人人都能学会数据分析

课程章节：更高效的数据处理与可视化绘图

课程内容：清理数据重复值、缺失值、拆分

课程收获：

#全部显示行列数据: pd.set_option（）

显示所有列：pd.set_option('display.max_rows',None)

显示所有行：pd.set_option('display.max_columns' , None)

设置数据的显示长度，默认为50：pd.set_option('max_colwidth', 50)

#读取数据

pd.read

提取需要的数据：usecols=【】

eg: data=pd.read_csv('movie_data.csv,usecols=['average','genre','language','release-date','title','votes'])

# 查重去重

查重：duplicate. 去重 drop_duplicate

eg : dupl_df=data.duplicate('title'), dupl_data=data.drop_duplicate('title）

验证去重是否成功，可用检查字符数的方法

print(len(dupl_df),' ', len(dupl_data))

#缺失值 np.nan

判断pd. isna(), 返回布尔值 true为缺失

填充缺失值 fillna(value=)

EX: 用均值填充：

dupl_data['average'].fillna(value=dupl_data['average'].mean())

#分列 str.split(',' , expand=True)

EX: dupl_data['release date'].str.split('(',expand=Ture)）

下载视频

这篇关于【学习打卡】第9天清理数据重复值、缺失值、拆分的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

Java教程

【学习打卡】第9天清理数据重复值、缺失值、拆分

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯

【学习打卡】第9天 清理数据重复值、缺失值、拆分

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯

【学习打卡】第9天清理数据重复值、缺失值、拆分