平台论坛博客文库

› 论坛 › 程序设计 › Python › 关于pandas的interpolate方法如何使用的疑问

关于pandas的interpolate方法如何使用的疑问 [复制链接]

lmw0320

白手起家

论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2019-04-03 09:55 |只看该作者 |倒序浏览

如果在筛选的情况下，对单列进行插值应用，该怎么做？
我目前遇到个难题，横向数据上有几组数据（每组数据之间的差别较大，不好直接忽视组别而暴力插值，否则数据偏差较大）。因此我考虑对数据进行分组后，再分别插值（组别较多，没法手动处理）。
我个人开始考虑了几个办法：
1. 用groupby('组别')['字段名'].interpolate（）,对指定字段进行插值，但是无法插入数据（空值数量仍旧不变）
2. 用for 循环对组别进行遍历（用unique()方法获取单一值），再进行插值，和上述办法一样，不报错，却也无法填充数据。
3. groupby方法生成的是特殊的SeriesGroupBy格式，而interpolate是适用DataFrame和Series格式的，我即使将其强制转换成Series格式，都没有效果。

恳请高手指点迷津。。。或者不用interpolate方法，只要能用到线性插值，来填充缺失值的，都可以。。

文库|博客

返回列表

Chinaunix › 论坛 › 程序设计 › Python › 关于pandas的interpolate方法如何使用的疑问

关于pandas的interpolate方法如何使用的疑问 [复制链接]

浏览过的版块