正如您在上图中看到的,在过去5年中,数据科学的关注度增长了5倍。
然而,许多人仍然不清楚数据科学咨询与常规咨询有什么不同。毕竟,咨询应该是关于怎样做出以数据为驱动的决策。关键区别是数据科学咨询顾问给客户留下了可重用的操作模型。然而,大多数常规咨询项目回答的确实是重要的问题,但只是一次性的,并没有留给客户可重复操作的决策模型。
数据科学咨询还有更多相关内容,我们将回答您这方面的所有问题:
- 什么是数据科学咨询?
- 什么是数据科学咨询生态系统?
- 选择数据科学顾问时需要考虑哪些问题?
- 数据科学咨询项目的陷阱误区有哪些?
什么是数据科学咨询?
数据科学咨询是通过提高客户的分析技能、发展客户能力和提升客户对其业务策略的理解来为客户实现业务上改进的活动。
此流程可以分为四个主要标题。战略、咨询、开发和培训。
战略
咨询的战略部分探讨了数据可以实现什么,并制定相关计划。
这部分需要有关应用案例的广泛知识。根据不同客户所在的不同行业,数据收集方法、规则和目标可能完全不同。举个例子,在某个案例中,客户目标可能是优化工厂的能耗,这个可以通过机器收集数据和从企业所有者本身完成必要的文书工作来实现,而对于快速消费品公司,则需要尝试创建数据流水线以最大化销售能力,数据收集可能会受到繁琐手续的限制,而且消费者保护和个人数据保护这两方面还需要考虑法律相关的工作。
不同部门之间的协作是成功的关键。 客户业务部门和 IT 部门都需要提供支持,以便定义问题以及找出可能的解决方案。数据科学的性质使得这一过程变得更加跨学科和跨部门。
战略部分通常会回答以下问题 6 个问题;
- 需要做什么?
- 要收集什么?
- 如何收集?
- 存储在哪里?
- 如何保护?
- 如何实施?
咨询
咨询是该流程的传统步骤,这是一个使用数据信息解决业务问题的步骤。通过这种方式,战略部分就变成了洞察问题本质。咨询部分的性质使其需要依赖于战略部分。通常,咨询是战略发展的自然结果。但是,如果模型的有效性由提供咨询的同一个人评估,则可能导致利益冲突。因此,将步骤分开可以更容易地找出并发现问题以及深入了解业务问题。
通常,咨询部分围绕 4 个主要问题;
- 洞察到的问题是什么?
- 需要做什么?
- 应该怎么完成?
- 流程应该是怎样的?
开发
开发是设计和构建现代数据产品或内部工具的活动。这更像是数据科学咨询的 IT 部分。针对特定问题的定制解决方案需要高度重视开发过程。
正如史蒂夫·鲍尔默之前说,这部分有3个主干部分:
开发人员!开发人员!开发人员!
培训
培训就是帮助客户的团队提高数据素养,这将确保客户团队的其他成员了解该流程并加入到系统的改进中。此外这还将确保团队成员能够抓住要点方面,为持续改进整个流程作出有意义的贡献。如果团队成员能够提供数据机制的实时有效性汇报,那么反馈机制就能很好地发挥作用。
数据科学咨询行业
行业成员可以分为四种类型。分别是 MBB、老牌科技公司、初创公司和大数据大公司
MBB
这些是传统的咨询公司。凭借着专业的服务水平,他们为各行业客户提供咨询服务已持续很长一段时间。如今,他们正在通过使用更多数据支持类型的服务(如高级分析)来更新和升级其咨询服务相关活动。
麦肯锡成立了专门的数据分析团队,并为此建立了其他一些风投公司。 QuantumBlack 是其中之一,其成立目的是为了重新构想企业组织如何学习其竞争对手并不断改进。他们为各个行业的客户提供服务。
BCG 为其高级分析部门成立了 BCG Gamma。BCG Gamma 团队由世界级的数据科学家和业务顾问组成,他们专门研究如何利用高级分析来获得突破性的业务成果。 BCG Gamma 将计算机科学、人工智能、统计和机器学习领域中的高级技能与深厚的行业专业知识相结合。
贝恩通过旗下的贝恩高级分析集团来提供其数据科学相关的特定咨询活动。他们的工作聚焦于三个方面-初步研究,高级分析和大数据-且这些都植根于我们(贝恩)的技术专长,客户体验和我们所拥有的最新的数据收集、分析平台和工具相关的知识。我们会为每一位客户提供正确的服务条目组合,因为我们认识到每一个客户的业务挑战都是独一无二的。
老牌科技公司
这一类公司最重要的成员是IBM和埃森哲。
埃森哲分析 为寻求利用大数据分析的企业和组织提供大数据和相关技术服务。埃森哲在研发、学术联盟和新兴技术的孵化方面投入巨资,以推进行业对大数据和分析的思考。我们(埃森哲分析)的 900 多名数据科学家目前为 2,000 多家客户提供分析服务,其中 70 家是《财富》全球 100 强公司。迄今为止,我们已经帮助 50 多家全球客户使用自己的数据来创造数据资产、业务价值和竞争优势。
IBM提供大数据咨询服务。 大数据服务提供战略、工程、产品组合和组织服务,以支持您的大数据业务需求。这些服务包括实施和提供大数据、分析和认知解决方案和相关功能的持续维护、增强和支持。
初创公司
大数据初创公司正在迅速崛起,因为大数据本身正迅速从新兴技术转向成熟技术。五年前创业的公司现在已经成为行业关键角色了。这些公司都是业内的年轻角色,它们具有高度多样化的能力。他们通常在特定类型的行业领域中提供大数据服务。
Datascope Analytics 就是其中之一。Datascope是一家数据科学咨询公司。他们与客户密切合作,利用受设计界启发的创新性流程,帮助客户确定有价值有创新的数据使用方式。他们还使这些想法成为现实,从快速概念验证到可扩展的生产系统,都全部实现。
Maana 是另一个例子。Maana 是以知识为中心的相关技术的先驱。 Maana 知识平台将人类专业知识和数据转化为数字知识,让员工做出更好、更快的决策。Maana已得到多个投资者的支持。
大数据-大公司
这些是主导大数据行业的公司,它们努力快速增长并主导了市场。这些公司抢占了行业的先机,而且基本来说,它们塑造了行业的实践方式和规则。
Cloudera 就是其中之一。Cloudera是商业Hadoop公司,它开发并发布了开源软件Hadoop,为世界上最大和最流行的网站提供数据处理引擎的支持。Cloudera 由来自 Facebook、谷歌、甲骨文和雅虎的大数据领域领先专家创立,其使命是将 Hadoop、MapReduce 和分布式存储功能引入企业界各类大大小小的公司、互联网领域和政府部门。
另一个是 帕兰提尔科技。帕兰提尔技术公司为世界各地的公共机构、商业企业和非营利组织开发和构建数据融合平台。该公司提供Palantir Gotham,一个集成、管理、保护和分析企业数据的平台;还有Palantir Metropolis平台,一个集成、丰富、建模和分析定量数据的平台。
选择数据科学顾问时需要考虑的 3 个因素
团队成员有高级学位吗?
这是决定与谁合作的主要因素之一。数据科学正日益成为一个由自称是数据科学家的人主导的行业。通常,博士在这个领域是最佳称职人选。 布罗克·弗格森的指南 展示了在学术领域成为数据科学家的历程,这些都表明了成为数据科学家需要投入多少精力。
他们有足够的经验吗?
参考是很重要的。同样重要的是,咨询顾问是否也曾参与过类似的项目。这也表明,顾问是否可以提出有意义的深刻见解,并了解特定行业的做法。
他们能否提供长期计划?
您需要确保咨询商提供的计划是否可行,以及是否可以定期升级。数据科学是一个不断进步的领域,因此,了解它们所能提供的服务潜力非常重要。要把它看作是一项长期投资,您可能还需要再次咨询并更新业务计划,因此一定要确保他们能够提供更大的规划周期。
数据科学项目的陷阱误区
数据科学竞赛社区Kaggle进行了一项调查,询问数据科学家在工作中面临的障碍。他们的大部分回答揭示了数据科学项目中可能出错的问题:

在这些问题中,有3个类别与数据科学项目相关:
- 数据相关问题
- 脏数据
- 数据不可用或难以访问
- 隐私相关问题
- 组织/项目相关问题
- 缺乏管理支持
- 需要回答的问题描述不清晰
- 数据分析结果未被决策者采用
- 缺乏领域专家
- 需要与 IT 协调
- 将调查结果融入决策
- 其他
- 工具限制
总之,您的数据科学项目是否成功取决于您的数据质量和团队效率。有了高质量的数据和敬业的团队组织,您已经消除了影响数据科学家效率的最重要障碍。对于数据科学等领域的 AI 解决方案,可参考