364898 32

[软件应用] 数据科学专业课程:使用Spark和R语言进行探索性数据科学[中文字幕]   [推广有奖]

企业贵宾

巨擘

0%

还不是VIP/贵宾

-

威望
4
论坛币
624047 个
通用积分
147.0356
学术水平
918 点
热心指数
988 点
信用等级
842 点
经验
398662 点
帖子
9795
精华
48
在线时间
17322 小时
注册时间
2014-8-19
最后登录
2022-11-2

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
国外数据科学课程视频&pdf
Enabling Exploratory DataScience with Spark and R
(使用Spark和R语言进行探索性数据科学)

16.jpg


演讲嘉宾为Hossein Falaki
Hossein Falaki is a software engineer at Databricks working on the next big thing. Prior to that he was a data scientist at Apple’s personal assistant, Siri. He graduated with Ph.D. in Computer Science from UCLA, where he was a member of the Center for Embedded Networked Sensing (CENS).
Hossein是Databricks的软件工程师。在Databricks工作之前,Hossein是苹果个人助理Siri的数据科学家。他在加州大学洛杉矶分校的获得计算机科学博士学位,他是嵌入式网络传感中心(CENS)的成员。
Academics
My Ph.D. research was focused on making mobile phones smarter networked devices when they were used in health applications. My Ph.D. dissertation is available here. As a Master's student at the University of Waterloo, I was a member of the Tetherless Computing Lab, where I worked on the KioskNet Project with Prof. S. Keshav. I also studied scanning strategies for opportunistic communication over Wi-Fi on mobile devices.(first person)

00.jpg

02.jpg


R is a favorite language of many data scientists. In addition to a language and runtime, R is a rich ecosystem of libraries for a wide range of use cases from statistical inference to data visualization. However, handling large datasets with R is challenging, especially when data scientists use R with frameworks or tools written in other languages. In this mode most of the friction is at the interface of R and the other systems. For example, when data is sampled by a big data platform, results need to be transferred to and imported in R as native data structures. In this talk we show how SparkR solves these problems to enable a much smoother experience. In this talk we will present an overview of the SparkR architecture, including how data and control is transferred between R and JVM. This knowledge will help data scientists make better decisions when using SparkR. We will demo and explain some of the existing and supported use cases with real large datasets inside a notebook

213_headshot_1_v1.jpg


R语言是许多数据科学家最喜欢的语言之一。除了语言和运行时,R语言具有丰富的生态系统库,可用于从统计推断到数据可视化的各种用途。
然而,使用R语言处理大型数据集是很困难的,特别是当数据科学家使用其他语言编写的框架或工具时。在这种模式下,大多数阻力出现在R语言和其他系统的界面上。例如,当数据被一个大数据平台取样时,需要将结果作为原生数据结构转移、导入到R语言中。
在该讲座中,我们展示了SparkR是如何解决这些问题的,以实现更流畅的体验。当中我们将介绍SparkR架构概况,包括如何在R语言和JVM之间传输数据和控制。这些知识将帮助数据科学家在使用SparkR时做出更好的决策。我们将在一个笔记本环境中演示现有的例子。演示将强调Spark cluster、R和交互式笔记本环境,如Jupyter或Databricks,便于对大数据进行探索性分析。

03.jpg



Enabling Exploratory DataScience with Spark and R
使用Spark和R语言进行探索性数据科学 [视频讲解·中文字幕]

04.jpg



使用Spark和R语言进行探索性数据科学·pdf
使用Spark和R语言进行探索性数据科学.pdf (1.12 MB)

05.jpg



CDA数据分析研究院团队译制

本讲座选自Spark Summit Europe 2015


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据科学专业课程 使用Spark和R语言进行探索性数据科学 Spark R语言 数据科学

已有 3 人评分经验 论坛币 收起 理由
aclyang + 40 精彩帖子
happy_287422301 + 20 鼓励积极发帖讨论
zl89 + 80 精彩帖子

总评分: 经验 + 80  论坛币 + 60   查看全部评分

本帖被以下文库推荐


https://www.cda.cn/?seo-luntan
高薪就业·数据科学人才·16年教育品牌
沙发
good1234 学生认证  发表于 2017-9-15 15:16:56 |只看作者 |坛友微信交流群
感谢楼主分享:使用Spark和R语言进行探索性数据科学----给力啊!!!

使用道具

藤椅
西门高 发表于 2017-9-15 15:44:56 |只看作者 |坛友微信交流群
谢谢分享

使用道具

板凳
NOTHINGWMM 发表于 2017-9-15 16:44:18 |只看作者 |坛友微信交流群
全英文  看不懂啊

使用道具

报纸
军旗飞扬 发表于 2017-9-15 19:56:07 |只看作者 |坛友微信交流群
谢谢楼主分享!

使用道具

地板
gxnnhgm66 发表于 2017-9-16 00:20:56 |只看作者 |坛友微信交流群
谢谢楼主分享!

使用道具

7
happy_287422301 在职认证  发表于 2017-9-16 08:26:42 |只看作者 |坛友微信交流群
感谢分享!

使用道具

8
yuhangzheng 发表于 2017-9-16 08:28:25 |只看作者 |坛友微信交流群
感谢分享

使用道具

9
huanghuiqun 发表于 2017-9-16 10:14:31 |只看作者 |坛友微信交流群
不错不错
报个名哈

使用道具

10
Crsky7 发表于 2017-9-16 13:36:08 |只看作者 |坛友微信交流群
Enabling Exploratory DataScience with Spark and Python

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 13:51