1 row_num = len(df.index.values) 2 3 col_num = len(df.columns.values)
row_indexs = df.index.values
col_indexs = df.columns.values
df.loc[0].values
df.loc[:, '姓名'].values
# 单行获取
df.iloc[0].values
# 单列获取
df.iloc[:, 1].values
df.loc[行范围(标签表示), 列范围(标签表示)].values
或者是索引:
df.iloc[行索引范围, 列索引范围]
如:选取0-10行姓名和语文成绩列
df.loc[:10, ['姓名', '语文'] ].values
# df.iloc[:11, [1, 4]].values # 此处切片为左闭右开区间
# 获取第2行第2列的数值
print(pd.iloc[1, 1])
"李四"
首先,我们需要数据:
df1 = pd.read_excel('test.xlsx', sheet_name='score')
df2 = pd.read_excel('test.xlsx', sheet_name='score2')
# 两者合并,得到我们需要的数据
df3 = pd.merge(df, df2.iloc[:, [1,2]], how='inner', on='姓名')
# how是连接方式,这里选择内连接,on是依据哪一列连接
df3.to_excel('bobTest.xlsx', sheet_name='score3')