Splunk:玩转“暗数据”的超级独角兽

文/ 何己派 编辑/ 谭璐

假如你是公司老板,正头疼人才流失过快的问题,该如何预知员工的离职倾向并采取行动?

大数据可以帮忙。

“比如这个员工老在晚上12点看什么网站、总是半夜刷门禁卡等,一些明显异常的行为会被捕捉到,用以判断他是否会离职,什么时候离职,下一步去哪家公司。”Splunk中国区总经理严立忠说,公司预知员工的异常行为,就可以设置机密文件的访问权限,避免人员流动造成资产流失。

事实上,大数据公司Splunk做的,是更大的生意——将大数据转化为行动和价值。2003年,三位年轻人在美国旧金山成立Splunk,彼时大数据行业仍处于莽荒时代。2012年,Splunk成为全球第一家上市的大数据公司。

目前,Splunk的市值超过200亿美元,每年保持30%以上的营收增速,财富100强企业中超过90家是其客户。

数据暗涌

全世界产生的数据正以惊人的速度增长,其中80%以上处于分散孤立的非结构状态。这些数字环境下未知和未被开发的数据,由系统和设备交互生成,Splunk将其定义为“暗数据”(dark data)。

Splunk 中国区总经理严立忠

“很多人以为自己在用大数据,其实只是把传统的商业数据汇总再挖掘,他们没有关注到‘暗数据’的存在。”严立忠以银行数据为例解释道,不少银行的信用卡业务部门独立运作,传统的银行数据对信用卡中心而言,没有打通和充分挖掘价值,就是一种“暗数据”。

Splunk的主要业务在于收集、索引和利用所有应用程序、服务器和设备生成的机器数据,旗舰产品是Splunk Enterprise。

类似iOS系统对应苹果手机、安卓系统对应安卓手机,Splunk Enterprise是大数据的“操作系统”,使用者多是IT运维人员,能处理大量数据并将数据分析结果可视化,便于使用者进行分析决策。

数据收集只是第一步,只有落地到场景才能发挥价值。在Splunk Enterprise的基础上,五条按应用场景分类的业务线由此展开,包括应用交付、IT运维、安全合规和防欺诈、业务分析、物联网和工业数据。

安全业务是Splunk表现最突出的产品线之一。严立忠告诉《21CBR》记者,传统的企业安全,防火墙解决网络安全,防病毒解决终端安全,这都是针对某一个点的问题来解决。Splunk所讲的“安全”是个大概念,除了技术安全,也包括银行风控、合规性等商业层面的安全。

Splunk的客户遍布各个行业。在格外强调网络安全的金融业,纳斯达克是Splunk的客户之一。利用Splunk进行用户行为分析,监测和应对内外部威胁,纳斯达克的分析人员获得数据后开展调查的速度提升了超50%。

除了“刚需”的安全与IT运维,越来越多的实践案例产生在业务分析场景里。国内某家手机厂商使用Splunk系统进行用户行为监测。用户上下班用手机刷了什么交通卡,访问了哪些应用,会频繁用手机的哪些功能——通过对这些使用习惯的数据统计,手机厂商可以清楚知道下一代产品的改进方向。

而在汽车行业,宝马、特斯拉都是Splunk的重要客户。Splunk帮特斯拉采集从研发到用户使用的全过程信息,收集用户习惯数据并记录用户开车频率、偏好的速度,让产品迭代更快。

另一个有意思的案例是7-11便利店。在多雨的印尼,当地人对雨伞的需求量很大。通过Splunk,印尼7-11接入了当地天气预报的数据与雨伞余量关联分析,如果预测未来7天下雨则增加雨伞的进货量。

平台价值

严立忠将Splunk业务的独特之处,归结为数据类型。不少公司对大数据的关注停留在“量大”上面,处理的数据多为传统的业务和交易数据,这部分数据的商业价值已被做数据库的厂商开采得很彻底。

Splunk最大的竞争力,在于能处理任何来源、类型的数据,包括分析日志、物联网、开源Hadoop、传统的Oracle数据库,甚至封闭的IBM大型机数据。

从技术的角度来看,Splunk让同行难以模仿的一点在于,没有事先创建数据模型。传统的数据分析需要经历定制、建模的过程且难以实时预测。Splunk的做法则是收集所有非结构化数据,放入系统后,不先做筛选,待用户有需要才随时查询系统,让实时获得分析结果成为可能。

“用历史的数据分析三年前的商业成果是没有意义的,大数据解决的应该是精准预测与实时响应。”严立忠说。

国内不少大数据服务商采用的是项目制模式,强调个性化的定制开发。严立忠说,Splunk做的则是创建一个大数据分析平台,大量生态的厂商在平台上完成标准化对接,为企业用户提供解决方案。即使用户不购买细分场景的产品,只使用平台,也能满足日常大部分要求,如同使用只安装了windows的电脑。

做平台生意,扩建生态很重要。在Splunk的合作伙伴名单上,可以看到IBM、AWS、思科、微软等多家行业巨头的名字。

严立忠列举了三类合作伙伴,顾问咨询类的厂商如埃森哲、安永,会围绕项目中涉及大数据分析的部分,向用户推荐Splunk;应用开发商基于Splunk提供的应用程序接口(API),帮助用户解决具体需求;云计算厂商则与Splunk合作搭建云平台,让用户在特殊的云环境下分析监控数据。

矛盾的市场

据IDC预测,2020年全球数据总量将达到44个ZB,届时中国的数据量将达到8060个EB,占全球数据总量的18%。中国这片尚未充分开垦的大数据沃土,吸引着新玩家入场,Splunk也面对号称“中国版Splunk”的本土厂商们的竞争。

“有点矛盾,中国的用户并不是不懂大数据。他们很懂,但采用起来不见得那么快。”严立忠说,一方面与商业环境有关,在国内,传统的IT选型需要进行公开招标,企业会找三家供应商PK,项目决策的链路相对复杂。

另一方面,争取更多用户的认可需要时间。严立忠告诉《21CBR》,曾有一家国内大型手机厂商听完Splunk的产品讲解后,决定自己用开源技术做一套平台,但最终发现“系统化的需求完全解决不了”。

事实上,用户意识的提升比想象中快。

两年前,刚加入Splunk的严立忠拜访了许多客户,不少客户对大数据的认知仅停留在概念层面。现在,严立忠明显感觉,国内企业用户对新技术的应用更大胆,更务实。

2014年进入中国市场,Splunk的业务与客户拓展的年增速保持在200%左右,主要行业均已进入,金融、高科技、互联网等领域的客户增长尤其明显。

Splunk对中国市场有更大的期待,早在2013年底,Splunk就将首个海外研发中心落户上海。而在集团内部,在保持总体策略基本一致的前提下,Splunk也允许在中国市场有更多个性化的做法,部分决策甚至能当场拍板通过。

2019年,除了继续拓展本土合作伙伴构建生态,严立忠的主要精力放在跟进重点客户的产品落地与反馈上,“数据平台未来会变成一个通用概念,任何企业要建IT、建数据化服务,一定绕不开它。”