Python教程

Python:pandas处理DataFrame

本文主要是介绍Python:pandas处理DataFrame,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

DataFrame

1.读入数据
df = pd.read_excel('info.xlsx')
type(df)
# 输出
<class 'pandas.core.frame.DataFrame'>
2.获取前5行
df.head(5)
# 输出
	姓名	年龄	性别	籍贯
0	张三	31	男	上海
1	李四	24	男	北京
2	赵五	47	女	深圳
3	刘六	21	男	广州
4	谭七	19	女	香港
3.获取第3-4行
df[2:4]
# 输出
	姓名	年龄	性别	籍贯
2	赵五	47	女	深圳
3	刘六	21	男	广州
4.获取特定的列
df[['姓名', '籍贯']].head(2)
# 输出
	姓名	籍贯
0	张三	上海
1	李四	北京
5.使用整数下标选择行和列
df.iloc[0:3, 0:3]
# 输出
	姓名	年龄	性别
0	张三	31	男
1	李四	24	男
2	赵五	47	女

注:通过iloc属性实现

6.使用整数和标签的混合来选择行和列
df.loc[df.index[0:3], ['姓名', '性别']]
# 输出
	姓名	性别
0	张三	男
1	李四	男
2	赵五	女

注:通过loc属性实现

7.重置索引为姓名
df = df.set_index('姓名')
# 输出
	年龄	性别	籍贯
姓名			
张三	31	男	上海
李四	24	男	北京
赵五	47	女	深圳
刘六	21	男	广州
谭七	19	女	香港
8.更改列名
df.columns = 'a','b','c'
输出:
	a	b	c
姓名			
张三	31	男	上海
李四	24	男	北京
赵五	47	女	深圳
刘六	21	男	广州
谭七	19	女	香港
9.对数据进行计算
df['a'] = df['a']+2020
# 输出
	a	b	c
姓名			
张三	2052	男	上海
李四	2045	男	北京
赵五	2068	女	深圳
刘六	2042	男	广州
谭七	2040	女	香港

参考:https://mp.weixin.qq.com/s/b-rHS18WQoPJ78NbKaSaXQ

这篇关于Python:pandas处理DataFrame的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!