目录

敏捷数据科学 - 过程( Process)

在本章中,我们将了解理解该过程所需的数据科学过程和术语。

“数据科学是数据接口,算法开发和技术的结合,以解决分析复杂问题”。

数据科学过程

数据科学是一个跨学科的领域,包括科学方法,过程和系统,其中的类别包括机器学习,数学和统计知识与传统研究。 它还包括黑客技能和实质性专业知识的组合。 数据科学从数学,统计学,信息科学和计算机科学,数据挖掘和预测分析中汲取原则。

构成数据科学团队一部分的不同角色如下所述 -

客户(Customers)

客户是使用该产品的人。 他们的兴趣决定了项目的成功,他们的反馈在数据科学中非常有价值。

业务发展

这个数据科学团队可以通过第一手资料或通过创建登录页面和促销活动来签署早期客户。 业务开发团队提供产品的价值。

产品经理

产品经理重视创造最佳产品,这在市场上很有价值。

互动设计师

他们专注于围绕数据模型的设计交互,以便用户找到合适的价值。

数据科学家

数据科学家以新的方式探索和转换数据,以创建和发布新功能。 这些科学家还结合了来自不同来源的数据,以创造新的价值。 他们在与研究人员,工程师和Web开发人员一起创建可视化方面发挥着重要作用

研究人员(Researchers)

正如名称所示,研究人员参与研究活动。 他们解决了数据科学家无法做到的复杂问题。 这些问题涉及机器学习和统计模块的强烈关注和时间。

适应变化

数据科学的所有团队成员都需要适应新的变化并根据需求开展工作。 应采用敏捷方法和数据科学进行若干改动,如下所述 -

  • 选择通才而不是专家。

  • 小团队优先于大型团队。

  • 使用高级工具和平台。

  • 持续和迭代地共享中间工作。

Note

在敏捷数据科学团队中,一个由通才组成的小团队使用可扩展的高级工具,并通过迭代将数据细化为越来越高的价值状态。

请考虑以下与数据科学团队成员工作相关的示例 -

  • 设计师提供CSS。

  • Web开发人员构建整个应用程序,了解用户体验和界面设计。

  • 数据科学家应该致力于研究和构建Web服务,包括Web应用程序。

  • 研究人员在代码库中工作,该代码库显示解释中间结果的结果。

  • 产品经理尝试识别和理解所有相关领域的缺陷。

↑回到顶部↑
WIKI教程 @2018