如果在筛选的情况下,对单列进行插值应用,该怎么做?
我目前遇到个难题,横向数据上有几组数据(每组数据之间的差别较大,不好直接忽视组别而暴力插值,否则数据偏差较大)。因此我考虑对数据进行分组后,再分别插值(组别较多,没法手动处理)。
我个人开始考虑了几个办法:
1. 用groupby('组别')['字段名'].interpolate(),对指定字段进行插值,但是无法插入数据(空值数量仍旧不变)
2. 用for 循环对组别进行遍历(用unique()方法获取单一值),再进行插值,和上述办法一样,不报错,却也无法填充数据。
3. groupby方法生成的是特殊的SeriesGroupBy格式,而interpolate是适用DataFrame和Series格式的,我即使将其强制转换成Series格式,都没有效果。
恳请高手指点迷津。。。或者不用interpolate方法,只要能用到线性插值,来填充缺失值的,都可以。。
欢迎光临 Chinaunix (http://bbs.chinaunix.net/) | Powered by Discuz! X3.2 |