楼主: 资料狂人
308463 6

[网帖精选] Python数据挖掘、机器学习算法案例 [推广有奖]

VIP管理员

泰斗

58%

还不是VIP/贵宾

-

威望
9
论坛币
986839715 个
学术水平
4401 点
热心指数
3205 点
信用等级
3469 点
经验
552542 点
帖子
7279
精华
143
在线时间
11736 小时
注册时间
2010-3-18
最后登录
2018-2-17

初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

资料狂人 在职认证  发表于 2014-10-22 11:35:23 |显示全部楼层
Python数据分析与机器学习
Python培训时间2017年11月4-7日 (四天)
Python培训地点北京市海淀区厂洼街3号丹龙大厦
Python培训授课安排上午9:00至12:00; 下午1:30至4:30; 答疑

Python培训费用4200元 / 3600元 (仅限全日制本科生及硕士研究生优惠价);食宿自理

我要报名

Python特训目的

      通过对数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析,使学员快速掌握Python 数据分析和数据挖掘(含机器学习)的思想和方法,形成科学有效的知识和能力结构体系框架,为提升工作中的数据分析能力打下良好的基础。


Python讲师介绍:

       Gino:早年获得名校数学与计算机专业学士和统计学专业硕士,近20年来一直进行着数据分析的理论和实践,数学、统计和计算机功底强悍。为人低调谦和,讲课富于激情和感染力。

       他在高校担任过数学、计算机和统计学老师,也曾在某一世界500强公司核心部门担任高级主管负责数据建模和分析工作,在实践中攻克统计建模和数据分析难题无数,数据处理与分析科学精准,在实际应用中取得良好的预期效果。

      他至今培训了来自高校、研究所、国外和各行各业的上千名学员,每一次培训都好评如潮。来自学术和业界的学员均在培训中受益颇多。

       Bob:早年计算机专业科班出身,功底深厚,较早的认识Python的价值和强大的功能,多年来一直使用Python进行数据分析的工作,并且使用Python开发多个数据挖掘及信息系统的项目,积累了丰富的经验。也是国内较早的进行Python培训的讲师之一,在湖广等地帮助很多人通过掌握Python找到了满意的工作。培训中讲解的案例实用,全部来自开发实际,含金量高,以前学员认识到其价值后强烈要求加课进一步学习。


Python目标人群:
1.急需入门数据挖掘和建模,想使用Python从事数据分析有关工作;即将或已经在数据分析或机器学习岗位工作的人;
2.想在实际数据分析工作中进一步提升技能,短时间内获取数据分析和挖掘工作经验的人。


Python培训特色:

1.全程没有艰深的公式,几乎全部以实际案例带动启发理解,以通俗易懂的语言讲清楚深刻的数据分析和机器学习算法思想,随时互动、答疑解惑;

2.注重学以致用、注重应用场景再现。抓住工作中经典的数据分析模型和案例加以剖析,使得学员在实际工作中很快能上手进行实际问题的解决;

3.注重实际工作经验分享,让学员在工作学习中少走弯路,以培养兴趣为引导、以阐明基本原理思想为基础,让学员掌握数据分析工作中的关键环节和技术。


Python培训软件及资料:
自带安装好anaconda的笔记本电脑,具体安装方式开课前发。课件也将提前发送。


Python课程大纲:

(内容超过4天课时,上课时内容和难度可能会根据学员的实际情况有所调整,添加深度学习内容,原则是根据学员的特点、需求讲授最需要的):


第1天: Python 基础精要(初中级别, 整个课程的基础)

一,Python数据分析基础

1、Python语法初步:主要是代码编写规范,变量的、标识符的学习,注释的一些说明。

1)  变量要求,容易出错的命名方式。

2)  代码的规范要求。

3)  代码的注释操作和注释文档

4)  变量的赋值和Python 脚本文件的编码要求。

2、Python数字和内置对象

1)  python的交互式操作.raw_input与input的区别

2)  python内置对象: type,cmp,repr,str,isinstance,xrange,None与NULL等

3)  数字与字符的计算和逻辑运算,及数字精度的注意事项。

3、Python元组

1)  元组的特性

2)  元组的初始化、删除、增加、修改、替换

3)  元组的切片及相关的内建函数

4、Python列表和字符串

1)  列表与字符串的特性

2)  列表与字符串的初始化、删除、增加、修改、替换

3)  字符的格式化操作

4)  列表与字符的切片操作及相关的内建函数

5)  特殊的字符及字符的编码与解码

5、Python集合与字典

1)  字典的特性

2)  字典的初始化、删除、增加、修改、替换

3)  映射类型的操作及相关的内建函数

6、Python语法:条件和循环

1)  条件分支语句的用法及注意事项

2)  While循环语句的用法

3)  For语句,range与xrange函数的用法

4)  Break与continue,pass、else的运用

5)  迭代器与iter函数

7、文件操作

1)  File和open函数及其参数的学习

2)  文件目录操作

3)  文件内容的操作

8、错误和异常的处理

1)  错误与异常的区别

2)  Try-except-finally语法讲解

3)  断言,触发异常

4)  常用的异常,及自定义异常

9、模块、包

1)  搜索路径及命名空间

2)  import与from-import语法

3)  包的讲解

10、函数

1)  函数的讲解

2)  函数参数

3)  函数编程:lambda,匿名函数

4)  内建函数apply,filter,map,reduce

5)  变量作用域:globa,闭包,命名空间

6)  递归

7)  生成器

11、面向对象编程

1)  类的定义、属性和实例化

2)  类的组合、继承

3)  类的方法调用和修饰符

4)  类的内建函数


二、Python进阶:

1、 Python中链表、栈的实现和操作

2、 Python中二叉树的实现和操作

3、 Python中简单排序算法、快速排序和归并排序的实现和操作


三、正则表达式

1、 正则表达式使用的字符讲解

2、 正则表达式的应用:匹配模式,编译形式,分割和替换

3、 Re模块的讲解


四、Python应用:

1)  模拟实现ATM机取钱

2)  冒泡算法和二分查找

3)  模拟海关

4)  蒙特洛模拟


第2天: 使用numpy、pandas等进行数据清洗和整理,充分统计分析数据(数据分析和挖掘前最重要的工作,直接决定了建模分析的质量,往往也是最耗时的工作)

一、Numpy基础:

1、Numpy语法初步:主要是认识和掌握Numpy的基本语法和操作

1)  Numpy的数组

2)  Numpy的数组的索引和切片操作

3)  Numpy的通用函数

4)  Numpy的数据处理

5)  Numpy的对文件的操作

2、Numpy实例

通过模拟随机漫步来说明如何运用数组运算,让学员深刻认识Numpy


二、Pandas基础:

1、Pandas基础知识

1)  Pandas的数据结构series和DataFrame

2)  Pandas的索引、选取和过虑。

3)  Pandas的排序和汇总统计

4)  Pandas处理缺失的数据

2、Pandas数据的规整化

1)  Pandas合并、清理数据集

2)  Pandas连接数据集

3)  Pandas移除重复、值替换和映射转换数据集

4)  检测及过虑异常值

5)  排列和随机采样

6)  Pandas的字符串操作


3、Pandas数据的聚合与分组

1)  Pandas的对数据分组操作

2)  Pandas的对数据聚合操作

3)  Pandas的交叉和透视表的应用

4、Pandas对时间序列的处理

1)  Pandas的时间序列基础

2)  Pandas的时间序列初始化和偏移运算

3)  Pandas的时间频率处理及日期的移动

4)  Pandas重采样

5、Pandas数据加载与存储

1)  读写文本格式的数据

2)  Pandas使用json数据

3)  Pandas读写数据库

6、Pandas的案例实操作

1)  大学考试成绩统计数据分析

2)  Python就业数据分析

3)  电影市场的分析

4)  股票的交易分析

5)  智慧水务的水质数据分析

6)  上市公司的财务分析


第3天和第4天:Python机器学习算法和数据挖掘案例精要(根据学员在工作中遇到的各种经典的机器学习算法和实际常见案例进行分析,帮助大家快速上手、学以致用)

目标:

1. 掌握机器学习分类的各种方法(决策树、朴素贝叶斯、随机森林、支持向量机、神经网络等)和经典案例

2. 掌握文本分类实际案例

3. 掌握推荐系统的机器学习

4. 选择正确的方法和模型

5. 掌握特征选择和特征工程


项目:

1. 垃圾短信或邮件的识别与分类(Logistic回归)

2. 使用随机森林进行预测

3. 图像识别和预测的方法和应用

4. 利用朴素贝叶斯进行文本分类(含算法和TF-IDF策略)

5. kaggle神器XGBoost 应用案例

6. Titanic灾难事件的机器学习各种算法分析比较

7. iris数据集机器学习分类方法的比较

8. 推荐系统构建方法

9. 网页广告图片屏蔽器

10. 支持向量机算法原理和应用场景

11. 客户画像和精准营销

12. 网站文本挖掘

13. 手写识别

14. 最近邻(kNN)算法及其案例

15. 使用PCA方法进行降维

16. k-means聚类等应用实例

17. 购物篮分析

18. Python机器学习量化投资实例


优惠:

现场班老学员9折优惠;
同一单位3人以上同时报名9折优惠;
折扣优惠不叠加。


报名流程:
1:点击“现场报名”,网上填写信息提交;
2:给予反馈,确认报名信息;
3:进入结算中心,通过订单支付;
4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南。


联系方式:

魏老师

QQ:28819897142881989714

Tel: 010-68478566

Mail:vip@pinggu.org


支持楼主:购买VIP购买贵宾 购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
 
载入中......



stata SPSS
资料狂人 在职认证  发表于 2014-10-22 11:35:24 |显示全部楼层
Python 视频
从零基础掌握Python
级:http://www.peixun.net/view/304.html
高级:http://www.peixun.net/view/338.html


购买流程:
1:把需要购买的视频放入购物车;PS:全程购买优惠200元哦,购买时注意购买优惠组合!
2:进入结算中心进行支付;
3:支付成功进入邮箱查收视频邮件。
**视频下载链接及相关资料都在邮件中**

初级大纲:

01. Python概览

1.1 选择合适操作系统的版本

1.2 安装和配置外部接口(IDE)

1.3 创建Python项目

1.4 帮助文档的使用


02. 深入 Python流程控制

2.1 if条件语句

2.2 while循环语句

2.3 for循环语句

2.4 嵌套语句

2.5 循环控制语句


03. 函数及数据结构

3.1 定义函数

3.2 一般性的函数参数格式

3.3 特殊参数格式及用法

3.4 参数用法小结

3.5 Python主要内置函数及用法

3.6 全局变量和局部变量

3.7 数据结构


04. 数据处理与计算

4.1 数据分析标准库

4.2 Numpy生成和创建数组

4.3 数组索引和切片

4.4 数组的算术和统计运算

4.6 简单线性代数

4.5 数据的读取


05. 数据描述与分析

5.1 汇总和计算描述统计

5.2 处理缺失数据

5.3 数据加载、存储与文件格式


06. 绘图与可视化

6.1 基本绘图命令概览

6.2 描述性统计图形概览

6.3 图形元素属性的简单设定

6.4 饼图示例


07. 数据挖掘初探

7.1 一元线性回归

7.2 最优化方法—梯度下降法

7.3 简单的假设检验


08. 异常处理(附录)


高级大纲:

01. 线性代数的实践

1.1 创建矩阵

1.2 矩阵的基本运算

1.3 解多元一次方程

1.4 判断正定矩阵

1.5 求解协方差矩阵

1.6 求相关系数矩阵

1.7 线性规划选址


02. 统计分析:回归模型探讨

2.1 线性回归拟合

2.2 广义线性回归拟合

2.3 Logit回归拟合

2.4 Robust回归拟合

2.5 分位数回归

2.6 岭回归


03. 统计分析:假设检验

3.1 T检验

3.2 单因素方差分析再探讨

3.3 重复抽样的单因素方差分析

3.4 多因素方差分析

3.5 单因素卡方检验

3.6 双因素卡方检验


04. 预测算法:回归模型的机器学习应用

4.1 机器学习数据概览

4.2 广义线性回归模型的机器学习应用

4.3 岭回归的机器学习应用

4.4 Logistic回归的机器学习应用


05. 分类算法:判别分析与聚类

5.1 决策树分类器

5.2 kmeans聚类算法及可视化表达

5.3 谱聚类及可视化表达

5.4 主成分分析

5.5 判别分析


0.6 时间序列分析

6.1 平稳性检验

     6.1.1 自相关或偏相关系数的平稳性检验

     6.1.2 ACF和PACF可视化展示

     6.1.3 单位根检验

6.2 平稳时间序列模型预测

     6.2.1 平稳时间序列分析

     6.2.2 绘图判断残差正态性

     6.2.3 平稳时间序列模型预测

6.3 非平稳时间序列处理

6.4 VAR模型


07. 绘图工具深入学习

7.1 Matplotlib绘图

     7.1 1 Matplotlib基本设置

     7.1.2 修改参数,移动坐标轴

     7.1.3 添加文字注释

     7.1.4 Matplotlib基本图形的绘制

7.2 Chart绘图


联系方式:
魏老师
QQ:28819897142881989714
Mail:vip@pinggu.org
Tel: 010-68478566




回复

使用道具 举报

qiuzw1985 发表于 2014-11-26 11:05:04 |显示全部楼层
zhengqushijianqu xuexiyixia~~
回复

使用道具 举报

qiuzw1985 发表于 2014-11-26 11:05:09 |显示全部楼层
zhengqushijianqu xuexiyixia~~
回复

使用道具 举报

苏小敏 发表于 2015-8-28 16:56:14 |显示全部楼层
说实话,我觉得这个视频的价格有点贵哦
回复

使用道具 举报

LeviathanQ 发表于 2016-3-24 11:04:49 |显示全部楼层
看一下~新来的
回复

使用道具 举报

lajiw 发表于 2016-3-30 14:59:10 |显示全部楼层
学习了 谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-2-18 05:23