认识pandas

pandas是数据分析必不可少的工具之一

那么pandas主要用来做什么?(或者说擅长做什么呢)

  • 轻松处理浮点与非浮点的缺失数据

  • 通过DataFrame或者更高维的对象可以完成列的增加与删除

  • 自动和显式地完成数据对齐

  • 强大且灵活的group by功能可对数据集执行拆分应用组合操作,用于聚合和转换数据

  • 轻松的将Python中的ragged, differently-indexed以及numpy数据结构转为DataFrame对象

  • 可以对大数据集上完成基于智能标签的切片,花式索引和子集

  • 直观的合并和连接数据集

  • 灵活的重塑和数据集的旋转

  • 轴的分层标记(可能每个标记有多个标签)

  • 健壮的IO操作,包括对csv文件、excel文件、数据库以及HDF5格式文件的读和写完成时间序列的特定功能,如:日期范围生成和频率转换,移动窗口统计,移动窗口线性回归,日期偏移和滞后等