pandas去重复行并分类汇总的实现方法

JiangCaifu

2019-01-29

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子：

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用：df.duplicated()

pandas去重复行并分类汇总的实现方法

第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True，表明要舍掉原来的索引，不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式：求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图：

pandas去重复行并分类汇总的实现方法

分类汇总 pandas

JiangCaifu

0 关注 0 粉丝 0 动态

相关推荐

Mysql常用函数大全(分类汇总讲解)

ROUND(x,y)返回参数x的四舍五入的有y位小数的值 SIGN 返回代表数字x的符号的值 SQRT 返回一个数的平方根 TRUNCATE(x,y) 返回数字x截短为y位小数的结果二、聚合函数。AVG返回指定列的平均值 COUNT返回指定列中非N

ApacheMySQL 2019-04-18

简述智能交换机的分类汇总

根据智能交换机每个端口速度的不同，可以把交换机分为两类，一类是对称交换机，另外一类是非对称交换机，那么下面的文章就对这两个交换机进行学习研究。一般来讲，不对称交换机主要应用于三种环境中，分别是用于服务器/客户端模式的网络、用户交换机之间的连接、交换机与路由

family000 2010-03-22

HDFS 常用操作分类汇总整理

与Linux文件权限类似 r: read; w:write; x:execute，权限x对于文件忽略，对于文件夹表示是否允许访问其内容如果Linux系统用户zhangsan使用hadoop命令创建一个文件，那么这个文件在HDFS中owner就

seenq 2015-06-03

机器学习常见算法分类汇总大全

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法，以供您在工作和学习中参考。博主在原创基础上加入了遗传算法（2.9）的介绍，这样一来，本篇博文所包含的机器学习算法更加全面丰

horizonheart 2019-01-23

分类汇总 UML精粹学习笔记

UML有三种使用方式：用作草图绘制，用于蓝图绘制，用于程序编制。倾向于将UML用于草图绘制，绘制草图的实质是选择，重点是进行交流，常用的介质是白板。草图是故意不完备的，要突出重要的信息。草图用于正向工程，蓝图用于逆向工程。详细文档应该根据代码生成。UML最

dansan 2010-06-11

分类汇总：Linux下Subversion命令大揭秘下篇

上节已经对Linux下Subversion命令作了相关介绍，本节除了继续介绍简单的Subversion命令外再和大家说一下不经常使用的命令，希望通过本节介绍你能学到更多知识。

同一天空下 2010-05-18

分类汇总：Linux下Subversion命令大揭秘上篇

我们在前面介绍了Subversion的定义及如何安装等内容，大家应该已经掌握了。Subversion版本控制离不开命令，下面我们来学习一些新的内容，Linux中的Subversion命令。如果在提交的时候提示过期的话，是因为冲突，需要先update，修改文

owenbeta 2010-05-18

JiangCaifu

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号