比如这么一个向量:上海,租金:10000,平米数:60。使用one hot编码 001来为上海编码,那么这个特征向量抛开缩放,应该是这种形式的3维向量吗?[001,10000,60]还是应该以稀疏的形式[0,0,1,10000,60]这样的形式呈现?
再比如一个时间序列的例子,如果一个向量中包含一个连续的时间序列,它的表达形式是什么样的呢?比如它包含日期,波动率,成交量三个信息,那么它的输入形式是否可以是[[日期1,波动率1,成交量1],[日期2,波动率2,成交量2],[日期3,波动率3,成交量3]]这样复杂的多维度形式。还是只能以[日期1,波动率1,成交量1,日期2,波动率2,成交量2,日期3,波动率3,成交量3]这样连续的形式输入?
有实操过特征工程的小伙伴,可不可以帮忙上车呀?



雷达卡



京公网安备 11010802022788号







