四种类型的数据科学家
有些是BI分析师,很少编写代码(他们甚至使用GUI来访问数据库,因此他们甚至不编写SQL查询-该工具为他们执行查询;但是他们必须了解数据库架构。)但是他们是定义指标的人并与管理层合作以识别数据源或创建数据。他们还致力于设计数据仪表板/可视化,同时考虑到各种最终用户,从安全,财务,销售,市场营销到执行人员。许多人拥有MBA学位。
数据工程师从这些BI分析师那里获得了建立数据管道的要求,并使数据流遍及整个公司和外部,其中很少的数据(通常是汇总数据)最终存储在各种员工便携式计算机上以进行分析或报告。他们与sys管理员一起设置针对每种类型的用户定制的数据访问权限。他们熟悉数据仓库,不同类型的云基础架构(内部,外部,混合),以及如何优化数据传输和存储,在速度,成本和安全性之间取得平衡。他们非常熟悉Internet的工作方式以及数据集成和标准化。他们擅长编程和部署由第三类数据科学家设计的系统,如下所述。有时,特别是对于高级职位,他们被称为数据架构师。
机器学习数据科学家设计和监控预测和评分系统,具有较高的学历,是所有类型数据(大,小,实时,非结构化等)的专家。他们执行许多算法设计,测试,微调,和维护。他们知道如何选择/比较工具和供应商,以及如何在自制的机器学习或工具(供应商或开源)之间做出决定。他们通常开发原型或概念证明,最终由数据工程师以生产模式实现。他们选择的编程语言是Python和R。高级的人已经学会了如何自动执行日常任务。
数据分析师是初级数据科学家,他们从事大量的数据处理,数据清理工作,并从事一次性分析和通常是短期项目。他们与BI或ML数据科学家互动并提供支持。他们有时使用更高级的统计建模技术。
1


雷达卡



京公网安备 11010802022788号







