楼主: casey_c
1694 1

[程序分享] TPOT:一个自动化的机器学习 Python 工具 [推广有奖]

  • 0关注
  • 10粉丝

博士生

92%

还不是VIP/贵宾

-

威望
0
论坛币
96 个
通用积分
2.0091
学术水平
2 点
热心指数
15 点
信用等级
2 点
经验
11502 点
帖子
278
精华
0
在线时间
94 小时
注册时间
2016-11-22
最后登录
2022-5-2

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币



以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文


本节内容由 Randal S. Olson 编写,是Penn 生物医学信息学研究所 开发区下的一个 TPOT 数据科学自动化工具的 demo https://github.com/rhiever/tpot


本节以代码示例为主,重点说明机器学习过程中的难点,以及 TPOT 如何实现机器学习自动化。



一、为什么要实现数据科学自动化?
1、模型参数调整是重要的

  1. import pandas as pd
  2. import numpy as np
  3. from sklearn.ensemble import RandomForestClassifier
  4. from sklearn.cross_validation import cross_val_score

  5. mnist_data = pd.read_csv('https://raw.githubusercontent.com/rhiever/Data-Analysis-and-Machine-Learning-Projects/master/tpot-demo/mnist.csv.gz', sep='\t', compression='gzip')
  6. mnist_data.head()
复制代码
1.jpg

  1. %matplotlib inline
  2. import matplotlib.pyplot as plt
  3. import seaborn as sb

  4. plt.figure(figsize=(8, 8))

  5. for record_num in range(1, 65):
  6.     plt.subplot(8, 8, record_num)
  7.    
  8.     digit_features = mnist_data.iloc[record_num].drop('class').values
  9.     sb.heatmap(digit_features.reshape((28, 28)),
  10.                cmap='Greys',
  11.                square=True, cbar=False,
  12.                xticklabels=[], yticklabels=[])

  13. plt.tight_layout()
  14. ;
复制代码
2.jpg

  1. cv_scores = cross_val_score(RandomForestClassifier(n_estimators=10, n_jobs=-1),
  2.                             X=mnist_data.drop('class', axis=1).values,
  3.                             y=mnist_data.loc[:, 'class'].values,
  4.                             cv=10)

  5. print(cv_scores)
  6. print(np.mean(cv_scores))
复制代码
[ 0.9420414   0.9620217   0.94888635  0.94000857  0.95071429  0.94427775  0.94955702  0.94240389  0.93467696  0.95554603]0.947013394966
  1. cv_scores = cross_val_score(RandomForestClassifier(n_estimators=100, n_jobs=-1),
  2.                             X=mnist_data.drop('class', axis=1).values,
  3.                             y=mnist_data.loc[:, 'class'].values,
  4.                             cv=10)

  5. print(cv_scores)
  6. print(np.mean(cv_scores))
复制代码
[ 0.96445396  0.97829812  0.97015991  0.96629053  0.96828571  0.96170882  0.97084881  0.96698585  0.96483705  0.97641509]0.968828385431
以上内容转自 数析学院,如需完整内容可以直接查看原文

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python 机器学习 TPO pot 自动化

已有 1 人评分经验 收起 理由
残阳_等待 + 60 精彩帖子

总评分: 经验 + 60   查看全部评分

沙发
casey_c 发表于 2017-12-5 10:18:58 |只看作者 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 23:31