真心求教!请问使用np.digitize进行单个文件数据分组分组可以实现,但批处理bins报错,由于bins只能单调增或者单调减,请问如何才能实现多个文件数据分组的批量处理?
感谢各位不吝指教!
In[11]:
for file in sorted(csv_file_paths):
#print(file)
df = pd.read_csv(file, header=0,encoding = 'utf-8',index_col=0)
#构建划分区间,相邻两条记录间‘时间差>600’‘计算速度<2’则为停止,否则为行驶
df['tag1'] = df['计算速度'].apply(lambda x: 0 if x < 2 else 1)
g1 = df.groupby(df['tag1'])
sbin = g1.get_group(1).index.tolist()
sbin.append(int(df.index[-1])+1)
#数据分割,获取分段数据
df['index'] = df.index
df['tag2'] = np.digitize(df['index'],bins = sbin)
g = df.groupby(['tag2'])
#分段处理数据,获取各段停留状态的时间差的和
list3 = []
for name,df in g:
x = np.array(df['时间差'].values)
if x.shape[0] == 0:
continue
stayTime = df['时间差'].groupby([df['tag1']]).sum()
if 0 in stayTime.keys().values:#判断0这个索引是否在返回值里边,如果在就打印
#print(df)
print(stayTime.values[0])
#list3.append(stayTime.values[0])


雷达卡


京公网安备 11010802022788号







