pandas dataframe数据聚合groupby、agg、privot基于sum统计详解及实例
知道了sum、那么min、max、mean、median都是举一反三的事情了。
在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。
在Pandas中,上述的数据处理操作主要运用groupby
完成。
聚合(aggregate)操作是groupby
后非常常见的操作,会写SQL
的朋友对此应该是非常熟悉了。聚合操作可以用来求和、均值、最大值、最小值等;
goupby的底层逻辑:和apply的千层万缕,还是老规矩、看图说话: