楼主: ada89k
3271 22

[机器学习] 盘点Github上有趣的10款机器学习项目 [推广有奖]

  • 3关注
  • 66粉丝

内部工作人员

院士

87%

还不是VIP/贵宾

-

威望
2
论坛币
122459 个
学术水平
119 点
热心指数
144 点
信用等级
80 点
经验
45065 点
帖子
1616
精华
3
在线时间
2070 小时
注册时间
2017-2-7
最后登录
2018-10-19

ada89k 在职认证  发表于 2018-1-13 17:43:19 |显示全部楼层
本帖最后由 ada89k 于 2018-1-13 17:53 编辑

盘点Github上有趣的10款机器学习项目


​​互联网上有着各式各样的这类工具,而Github事实上则成为了所有开源软件的交流平台,包括数据科学社区里所用的工具。机器学习在数据科学界的重要性和中心地位已经不言而喻,本文将介绍Github上10个有趣的机器学习项目

01
FaceRecognition - 世界上最简单的人脸识别库

链接:https://github.com/ageitgey/face_recognition

QQ截图20180113172918.png


本项目号称世界上最简单的人脸识别库,可使用 Python 和命令行进行调用。该库使用 dlib 顶尖的深度学习人脸识别技术构建,在户外脸部检测数据库基准(LabeledFaces in the Wild benchmark)上的准确率高达 99.38%。

QQ图片20180113171153.png


可以使用其它python库做人脸实时识别



02
MUSE- 多语言词向量 Python 库

链接:https://www.paperweekly.site/papers/1097

QQ截图20180113173103.png


由 Facebook 开源的多语言词向量 Python 库,提供了基于 fastText 实现的多语言词向量和大规模高质量的双语词典,包括无监督和有监督两种。其中有监督方法使用双语词典或相同的字符串,无监督的方法不使用任何并行数据。

03
style2paintsv2.0 - 线稿自动上色

项目:https://github.com/lllyasviel/style2paints

QQ截图20180113171204.png


style2paintv2.0是使用无监督训练,它可以按照指定的颜色风格给线稿上色,github上有多个给线稿自动上色的模型,和其它几个相比,style2paints的“提示笔”是最精确的。

QQ截图20180113171216.png



04
Arnold- 最擅长玩《毁灭战士》的游戏AI

论文:https://www.paperweekly.site/papers/1440

项目:https://github.com/glample/Arnold

QQ截图20180113171222.png


本项目来自卡耐基梅隆大学,是 2017 年 VizDoom《毁灭战士》AI 死亡竞赛冠军 Arnold 的 PyTorch 开源代码。它包括了:

1、训练DOOM毁灭战士的源码

2、有17个用来训练和评估的地图

3、5个预训练的模型,你可以用它可视化和游戏对打,它还包括了那些赢得了ViZDoom毁灭战士竞赛的模型。

05
FoolNLTK- 中文处理工具包

链接:https://github.com/rockyzhengwu/FoolNLTK

QQ截图20180113171229.png


本项目特点:
• 可能不是最快的开源中文分词,但很可能是最准的开源中文分词
• 基于 BiLSTM 模型训练而成
• 包含分词,词性标注,实体识别,都有比较高的准确率
• 用户自定义词典

06
YOLOv2- PyTorch - PyTorch 版 YOLOv2

链接:https://github.com/ruiminshen/yolo2-pytorch

QQ截图20180113171235.png


YOLOv2是最流行的目标检测框架之一,这个项目使用PyTorch实现来提高YOLO的产品化能力。它也拿ONNX把模型转换成Caffe2方便部署到开发者的项目里。

QQ图片20180113171243.png



07
SimpleRailway Captcha Solver - 基于 CNN 的台铁订票验证码辨识

项目:https://github.com/JasonLiTW/simple-railway-captcha-solver

QQ截图20180113171251.png


本项目利用简单的 Convolutional Neural Network 来实作辨识台铁订票网站的验证码,训练集的部分以模仿验证码样式的方式来产生、另外验证集的部分则自台铁订票网站撷取,再以手动方式标记约 1000 笔。

目前验证集对于 6 码型态的验证码的单码辨识率达到 98.84%,整体辨识成功率达到 91.13%。

08
AlphaZero-Gomoku- 用 AlphaZero 下五子棋

论文:AlphaZero: Mastering Chess and Shogi bySelf-Play with a General Reinforcement Learning Algorithm(https://www.paperweekly.site/papers/1297

论文:AlphaGo Zero: Mastering the game of Gowithout human knowledge(https://www.paperweekly.site/papers/942

项目:https://github.com/junxiaosong/AlphaZero_Gomoku

QQ截图20180113174145.png


这是一个将 AlphaZero 算法应用在五子棋的实现,由于五子棋相比围棋或国际象棋简单得多,所以只需几个小时就可以训练出一个不错的 AI 模型。

QQ截图20180113171509.png


每移动400步的布局


09
gym-extensions- OpenAI Gym 扩展集

链接:https://github.com/Breakend/gym-extensions

QQ截图20180113171514.png


这是一个 OpenAI Gym 库的扩展包,实现了包括:多任务学习、迁移学习、逆增强学习等功能。

10
OpenPose- 多人实时检测系统

项目:https://github.com/CMU-Perceptual-Computing-Lab/openpose

QQ截图20180113171519.png


OpenPose代表了第一代实时多人检测系统,在单张图片上它可以检测人的身体、手、脸部关键点一共130个:
1、15或18个身体基本关键点,并且运行时检测的人数不变
2、2x21个手的基本关键点。目前情况是运行时是基于检测到的人的数量
3、70个脸部基本关键点。目前情况运行时是基于检测到的人的数量

QQ截图20180113171531.png





已有 2 人评分经验 论坛币 收起 理由
aclyang + 40 精彩帖子
zl89 + 80 精彩帖子

总评分: 经验 + 80  论坛币 + 40   查看全部评分

本帖被以下文库推荐

钱学森64 发表于 2018-1-13 17:52:25 |显示全部楼层
谢谢分享
回复

使用道具 举报

厄尔蒙加 在职认证  发表于 2018-1-13 19:04:30 |显示全部楼层
谢谢分享~
回复

使用道具 举报

飞虎娇娃 在职认证  发表于 2018-1-14 15:28:11 |显示全部楼层
还在学习机器学习,谢谢楼主分享,
回复

使用道具 举报

eeabcde 发表于 2018-1-16 10:47:37 |显示全部楼层
谢谢分享
回复

使用道具 举报

cxw0000 在职认证  发表于 2018-2-11 10:39:18 |显示全部楼层
谢谢分享~
回复

使用道具 举报

bjk592113 发表于 2018-2-11 10:47:32 |显示全部楼层
不错的分享,现在实体店项目正好用得上最后一个
回复

使用道具 举报

西门高 发表于 2018-2-11 10:49:39 |显示全部楼层
谢谢分享
回复

使用道具 举报

Fernnnnn 发表于 2018-2-11 12:20:12 |显示全部楼层
謝謝分享,mark一下
回复

使用道具 举报

thinr 在职认证  发表于 2018-2-11 14:08:34 |显示全部楼层
不错,值得mark
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-10-20 15:07