灭血历史网 新闻 > 首页 > 军事社区 > 消息 > 正文 >

诸葛io赵乾坤:自助式数据分析的未来之路

2017-01-12 01:00:51 来源: 反馈

\

  来源:数据猿 作者:赵乾坤

  我们认为“自助式数据分析”会是后续数据分析的一个发展方向。目前,诸葛io也是在朝着这个方向转换和发展。

  在做诸葛io之前,我们最开始实际上也在给企业做一些DMP的产品和项目,当时也是从第三方数据切入的。比如:最早我们通过微博的数据给企业CRM里面的用户进行画像的丰富或者是通过其他社交网络上的数据补全用户的一些行为特征或者是消费模式。后来做诸葛io是因为我们认为企业内的第一方数据的价值是远远高于第三方数据的,所以我们先要帮助企业解决第一个问题,即通过内部数据驱动业务,挖掘数据价值。

  一、自助式数据分析的兴起:BI发展的3个十年

  自助式数据分析是最近几年兴起的一个概念。传统的数据分析需要传统的IT、数据部门去支持,最后通过数据分析师来帮忙实现。这个过程中间的依赖性比较强。所谓自助式数据分析主要是指业务人员能够自主、敏捷的通过一些数据分析工具满足自己分析的需求。在这一过程中,业务人员基本上不需要IT部门的支持,比如:二次开发、重新建模等一系列逻辑。

  我们可以先回顾一下,正式的数据分析起源于所谓的BI,即商业智能。当时,BI核心的概念是基于商业的事实,通过一系列的概念和方法,最后去对这些事实进行分析,以达到辅助企业做商业决策的目的。这些核心的技术和方法基本上和现在的数据分析是一致的,从最基础的数据收集,到数据的整合,再到数据的挖掘、算法、洞察、可视化甚至是数据报告的协同工作等,整个过程其实是非常繁杂的。

  这里面涉及到三类人员,第一类是IT人员,IT人员主要是做基础技术架构的实施。在这个过程中,他需要负责数据采集、整合、存储甚至是一些基础数据仓库架构的搭建以及一些检索的支持。往往这一部分的实施周期非常长,少则几个月,多则半年、一年。第二类人员就是需求方,即业务人员。业务人员的目标相对比较明确,他会提出自己的一些场景需求,有一些类似的假设需要去验证,或者是有一些需要探索的数据维度。中间一层就是分析师,分析师需要理解业务的需求,理解背后的数据模型,基于它去进行数据建模,包括一些统计模型的构建,最后形成一些报告或者可视化的图表。

  在整个过程中间,从业务人员到分析师再到IT人员,整个流程是非常冗长的,响应的速度也非常有限。由于现在的业务敏捷性和快速性,导致很多业务端提出的需求在分析师和IT人员实施完之后,其实已经变得没有价值了。所以,这是90年代第一个十年的BI发展。基于这样的需求,后续我们演进到了BI的第二个十年。

  第二个十年由于处在企业信息化的红利中,所以在部分成熟的企业里面,数据采集、信息化技术以及一些行业的数据积累越来越多,使得第二个十年的BI系统实施变得更加敏捷和迅速。在第二个十年里面,因为计算能力的提升,使得我们能够部分做到准时甚至是实时性的计算。同时由于云计算的兴起,让整个部署的复杂度也降低了,整个IT服务被快速的标准化。

  第三个十年基本上是在2006年以后,出现了一个新的发向,我们叫做“ Analytics Anywhere”,即随处可用的数据分析。这需要从几个方面来讲,第一是我可以通过云端任意访问;另外是通过移动端也可以去查阅BI报表。但是,实际的背后是有两块核心的方向,一块叫做智能化数据分析,一块叫做自助式数据分析。

  智能化数据分析相当于自动探索的模式,即如果你给我一些数据,我就能够部分的从数据本身的分布或者是特征上帮助你发现一些背后潜在的相关性。比如:Google的Google Spreadsheet,就是类似于Excel的工具,如果你用过会发现,上传一个Excel文档,Google在不需要人工干预的情况下,会自动给你生成一些报表,而这些报表都是基于你的数据类型、数据分布以及它们之间的相关性,通过统计模型统计出来的。

  传统的BI在第三个十年已经到了一个新的阶段,就是BI或者数据分析要实现去中心化。以前有三类人需要牵涉到整个BI系统的环境或者是业务的搭建过程中,现在去中心化的意思就是,企业不再需要有一个专门的BI部门去完成整个业务的需求,而是业务部门的人员需要参与到数据分析的日常工作中间去。他有需求不需要向BI部门去提,而是自己有一个平台或者工作能够实时地满足自己的需求。自助式数据分析在国外的典型代表是tableau,tableau现在已经开始做一些自助式数据分析的深入尝试了。tableau支持灵活的可视化定制,通过简单的拖拽就可以实现数据的基础分析,同时也会提供一些专业的行业分析算法和模板。

相关阅读

热点话题

热点文章

点击: