Pandas
的基础结构分为两种:
数据框(DataFame)是拥有轴标签的二维链表,类似于 Excel 中的行列关系。
列标签为列名,行标签为索引。
iterrows()
是在数据框中的行进行迭代的一个生成器,返回每行的索引以及一个包含行本身的对象。
建立测试数据集。
import pandas as pd import numpy as np df = pd.DataFrame({ 'a': range(5), 'b': list('abcde'), 'c': np.random.randn(5), 'd': np.random.randn(5), 'e': np.random.randn(5) }) df ''' a b c d e 0 0 a -0.132885 0.565630 -0.837642 1 1 b -0.290722 2.363767 -0.581337 2 2 c 0.919731 -0.191452 -0.109648 3 3 d -0.509702 -2.129329 0.419094 4 4 e -0.041131 -0.672666 0.784658 '''
行遍历测试。
# 行遍历 for index, row in df.iterrows(): print(index) print(row) ''' 0 a 0 b a c -0.132885 d 0.56563 e -0.837642 Name: 0, dtype: object 1 a 1 b b c -0.290722 d 2.36377 e -0.581337 Name: 1, dtype: object '''
iterrows()
返回值为元组 (index, row)
。
参考链接:Pandas.DataFrame 的 iterrows()方法详解
参考链接:python里使用iterrows()对dataframe进行遍历