数据分析Python统计——主成分分析用法
from sklearn.preprocessing import *
raw=data.iloc[:,4:10]
zraw1=StandardScaler(copy=True,with_mean=True, with_std=True).fit_transform(raw)#z变换,with_std=False对中处理
#============主成分分析===============
from sklearn.decomposition import PCA
pca=PCA(n_components=6)
pca.fit(zraw1)
pca.explained_variance_ #主成分特征值,解释方差
pca.explained_variance_ratio_#主成分的解释方差百分比
pca.components_#特征向量
# #-----保存主成分------
pca1 = PCA(n_components=2).fit_transform(zraw1)#累计贡献率
raw[[\"z1\",\"z2\"]]=pd.DataFrame(pca1)
raw
# #-----主成分回归------
x=pd.concat([data.iloc[:,[2,3]],raw[[\"z1\",\"z2\"]]],axis=1)#2:年龄,3:学历
y=pd.DataFrame(data.iloc[:,10])
from sklearn.linear_model import SGDClassifier
sgdLog_clf=SGDClassifier(loss=\'log\',random_state=123)
sgdLog_clf.fit(x,y)#拟合训练集数据
sgdLog_clf.score(x,y)#非监督模型是transform
#============主成分分析===============
from sklearn.decomposition import PCA
pca=PCA(n_components=6)
pca.fit(zraw1)
pca.explained_variance_ #主成分特征值,解释方差
pca.explained_variance_ratio_#主成分的解释方差百分比
pca.components_#特征向量
# #-----保存主成分------
pca1 = PCA(n_components=2).fit_transform(zraw1)#累计贡献率
raw[[\"z1\",\"z2\"]]=pd.DataFrame(pca1)
raw
# #-----主成分回归------
x=pd.concat([data.iloc[:,[2,3]],raw[[\"z1\",\"z2\"]]],axis=1)#2:年龄,3:学历
y=pd.DataFrame(data.iloc[:,10])
from sklearn.linear_model import SGDClassifier
sgdLog_clf=SGDClassifier(loss=\'log\',random_state=123)
sgdLog_clf.fit(x,y)#拟合训练集数据
sgdLog_clf.score(x,y)#非监督模型是transform