免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3795 | 回复: 0
打印 上一主题 下一主题

关于pandas的interpolate方法如何使用的疑问 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2019-04-03 09:55 |只看该作者 |倒序浏览

如果在筛选的情况下,对单列进行插值应用,该怎么做?
我目前遇到个难题,横向数据上有几组数据(每组数据之间的差别较大,不好直接忽视组别而暴力插值,否则数据偏差较大)。因此我考虑对数据进行分组后,再分别插值(组别较多,没法手动处理)。
我个人开始考虑了几个办法:
1. 用groupby('组别')['字段名'].interpolate(),对指定字段进行插值,但是无法插入数据(空值数量仍旧不变)
2. 用for 循环对组别进行遍历(用unique()方法获取单一值),再进行插值,和上述办法一样,不报错,却也无法填充数据。
3. groupby方法生成的是特殊的SeriesGroupBy格式,而interpolate是适用DataFrame和Series格式的,我即使将其强制转换成Series格式,都没有效果。

恳请高手指点迷津。。。或者不用interpolate方法,只要能用到线性插值,来填充缺失值的,都可以。。


您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP