从肿瘤医生到世界前十数据科学家

铅笔道 | 戎枳潓 2015-11-26 2015-12-07 icon-tag 张溪梦

                     GrowingIO用户行为 数据分析:张溪梦.jpg

导语

“刚开始觉得《mad MAN》美剧里,设计师的设计Creative特别酷。后来才知道这并不是拍脑袋决定的,需要通过精确的数学模型算出来。”这种认知的转变,源自张溪梦(下文称Simon)15年的职场沉浮。

谁也没想到,在医学院呆了两年、作为同期唯一一位被天津肿瘤学院录取担任脑科医生的Simon,在10年之后会成为世界排名前十的数据科学家之一。

他的人生,似乎一边半途而废,一边怀抱热望。放弃5年医学专业,瞒着家人辞去金饭碗,怀揣着“成为最好的数据分析师”的梦想去新东方学习英文,出国攻读MBA,先后进入Linde Group、Epson、Petco、Ebay、LinkedIn,从市场分析专员到商业数据分析高级总监... ...这条路一走就是10年,每一步都步步为营。

Simon说,传统数据分析中,工程师需在网页中埋各种代码(埋点),以此获取数据源,这会消耗工程师25%的时间,剩下时间则是陷入大量的沟通中。期间,他体会到了数据分析的痛苦:效率低、无规模化、周期长……

于是,瞄准相对空白的中国市场,他成立GrowingIO——一家大数据分析公司,运用无埋点采集方式,迅速生成数据分析结果,针对企业服务领域的客户成功、市场推广、产品体验、客户服务等提供精益化运营的分析模块及解决方案,目前产品支持Web、H5、IOS、Android。

使用该产品,工程师只需要嵌一段3行的JS代码在网页端,即可将整个数据分析的流程(从采集、数据传输、输出存储、数据转化、可视化、高级分析模式)通过一个产品展现。

8月24日第一版产品上线,截止至今,产品处于内部邀请及小范围公测阶段。8月底,GrowingIO获得220万美元天使轮融资,投资方为经纬中国的创始人邵亦波、LinkedIn的创始人Reid Hoffman、美国最大风险投资基金之一NEA。

曾经为了苦练铁拳,手指甲盖几乎掉了的他,最终在全国大赛中斩获前三;享受低价买进高价卖出的eBay过程,却唯独不愿碰股票——容易对喜欢的东西上瘾,是他拒绝股票的理由。同样,对热爱事物的执着,让他放弃了硅谷数据科学家的光环,成为一名普通的创业者。

“This is amazing”是他曾经的口头禅。如今,“This is amazing”成为产品内测阶段受众的普遍认知。面临今年“增长黑客”劲头正旺、大数据概念越发普及的市场环境,张预言“这条路不会太长”。

一、十年数据沉淀

5年医学院班长,毕业后进入天津市肿瘤医院担任脑肿瘤手术医生的Simon,10年之后故事来了个弯道超车:先后加入Linde Group、Epson、Petco、Ebay、LinkedIn,成为世界排名前十的前沿数据科学家之一。

7点上班、12点离开医院,30个小时连轴转的手术却改变不了很多病人的状况。“如果一个疾病有了学术名称,那么这个疾病就是无法治愈的。”医学院的第一节课就让张无法理解。

“我希望做的事情有逻辑。但是人体太复杂了,我并不是真正的理解这是为什么,一个东西你若很难理解它形成的原因,就不能找到解决方案。”

于是,作为应届唯一一位被天津肿瘤医院录取的他,辞去了这份工作,开始申报新东方学习英语、出国攻读MBA。随后,这个名字颇有武侠风的Simon,遇到了自己的“西门吹雪”——一位在硅谷工作十年、腕关节及韧带因为高强度工作致残的印度人。

“他打字打得太多了,整个手腕已经抬不起来,当时公司给他特制了一个键盘。那个人对SAP背后的3000张基础表格了如指掌,每一张表里面大约有50个到100个字段,它不光是名字,还有逻辑。”

被追求极致的精神激励,Simon在MBA毕业后,先后进入Epson、Petco、Ebay,担任市场分析师、数据分析师。Epson的用户画像、Petco销售渠道模型、Ebay购物车的支付效率… …他第一次系统了解了数据与营销的直接关联。

“数学很深奥,销售行为可以用模型预测,用数据和计算机技术,可以把整个商业流程相对无缝地关联起来。”

这就是Simon的工作,他需要从几个同时动态滚动的图、表、数字的屏幕中找到关联。为了研究支付效率,他一度在Ebay上频繁买卖。2010年,Simon带着Ebay年度交易额全公司卖家第一、买家第二的称号,离开了Ebay,走向了人生中的重要转折点——加入LinkedIn。

“我想做最好的数据分析师。Ebay我做再多努力,可能只增加1%的业务,并不能改变Ebay的整个情况。”于是,张选择了相对早期的创业公司LinkedIn,成为公司的第一位商业数据分析人员。

彼时,Simon的任务是通过数据分析支持销售部。2010年底到2011年下半年,9个月时间,500个项目,消耗了张大量的时间。“活太多了,都是散碎的活,甚至是一些让人愤怒的小事,但是你不做的话,人家销售就没法往前推。”

忍无可忍,治标不治本的方式严重拖沓了效率。“再雇10个也完不成这些事。150个销售,我一个人直接跟他们打交道,我手再快也不可能把所有人都搞定。” 年轻气盛的Simon向上级提出建议:成立独立的小团队。一年夹在产品与销售间生存的状态,让Simon无法保持数据公正性。

“销售的数据导向肯定是支持销售的,所以只有把数据放在支持的组织之外,才能保持中立性。”

数据分析软件化。“很多人的问题都有共同性,我把所有问题变成模拟的自动化程序给他们,而不是他们天天来问我东西,就可以大幅度提高效率。”

提议并没有受到重视。不愿意尝试新事物、不愿意改变既定流程是推行的主要阻力。后来,颇有些赌气意味,以“不尝试就离开”为条件,Simon最终在销售部进行试点。

4个人的小团队,耗时4个月,粗糙版DEMO开始使用。试用期间,数据处理能力从9个月500个项目提升到可以处理每年将近20万个项目,同期销售额提高270%。随后,市场、广告、客户运营、风控等部门,开始接入Simon的部门。

4年之内,他连升四级,从Data Scientist到Sr director;团队成员从最初的一个人,拓展到80余人。“数据分析本身就能创造价值,这种价值是很多人难以估量的”,浸淫数据领域10年之久的Simon,用结果证明了他的判断。

二、回国创业

“数据需要公正、真实,比如说我在咖啡馆里运行数据,我就说全世界的人都在喝咖啡,这是非常不对的。”一直站在数据分析前线的Simon,用“痛苦的折磨”形容他的数据分析之路:

1、太慢。“Ebay用了四年时间不断积累,多少人和多少的公司会用这四年的时间来做呢?”

2、技术复杂。“需要打通不同的技术性工种。前端工程、数据传输工程、数据库管理、前端可视化等,还需要做报表的、做分析的、能知道趋势、能推进算法。”

3、效率低。“在一个公司里面,都是CEO、VP、director来进行决策,这样传统的方法效率并不高。让公司有效率,间接的是让公司里面的员工有效率。只有把数据决策的驱动权给员工后,效率才会提高。每个人被相对数据驱动后,就不会有拍脑子坐决定,更不会造成错误判断。”

10年,从遇到他的第一位“西门吹雪”到自己被誉为华人界的“西门吹雪”,“成为最好的数据分析师”是一直没变的梦想——2015年,他被Data Science Central评为世界前十的数据科学家之一。现如今,怀抱“将最好的数据科学、数据分析师模拟化”的梦,他准备创业,试图让数据分析的价值在所有公司释放。

相比美国相对成熟的数据分析市场,中国尚处于苏醒期。

“在美国和数据直接相关的企业接近2000家,但是美国的市场很有意思,他是按照功能分区的。做数据库的、做数据传输的、做数据存储、做可视化的、做模型的,所以他会很慢。包括中国的一些企业也是基于美国的这套方法论。一体化很少,但是我认为效率的增加需要数据分析一体化。”

2015年3月,Simon瞄准国内相对空白的市场,回国创业。同期,进行了为期1个月的市场访谈,前后接触近80家公司,涵盖创业公司、领先互联网公司、传统企业等大中小不同体量的公司。“跟他们说我要做的事情,问他们需要什么。”

“不可能”是被调研企业的第一反应。这与根深蒂固的“业务端驱动技术部门的思维”有关。长期以来,数据仅作为支持业务部门的工具。“不相信产品功能,也没有意识到数据的真正价值。”,Simon总结道:“聊了一圈,他们往往会说‘我们不知道该做什么、怎么做,我们只需要你告诉我怎么做就行了’。”

这正是Simon需要的答案。2015年5月,公司成立,取名GrowingIO。名字源于growthhacker(增长黑客)——兴于美国互联网创业圈,后盛行于国内。今年年中,范冰的同名书籍上市,更是将这一概念推波助澜:低成本甚至零成本地用技术、数据的方式,为企业提供解决方案,从而让产品、用户获得有效增长。

三、因地制宜的产品原型

将美国的产品形态延伸至国内,需要本土化。针对中国目前数据分析的现状,Simon总结了4个痛点:

1、人工埋点效率低。埋点是传统数据分析的方式,工程师通过在网页里面埋各种代码的方式,获取数据源——LinkedIn埋了几千万行代码,Ebay则高达百万个。“通常来说,埋点会消耗工程师25%的时间,剩下的时间则是陷在大量的沟通里。因为数据需求是业务部门提出来的,提出来以后需要跟他们沟通。”

同时,由于工程师的流动性,如果离职工程师没有留下说明,唯一的办法就是新工程师一行行人工排查代码。“长期积累以后,网页就像被打了补丁,东一个、西一个,没有很好的整理,大量的补丁反而会拖慢网页的运行速度。”

2、周期慢。“昨天的数据最快也要24小时才能看到。但是你急需知道一种新的东西,甚至要等上几天、几个月,严重的会影响决策。”

3、成本高,不具备规模化。“一个产品结构需要不同类型的技术人员,这对于早期创业公司来说成本非常高。同时,由各业务部门驱动的定制化需求,并不能规模化。”

基于此,Simon设计了GrowingIO的产品原型:

1、无需埋点。工程师只需要嵌一段3行的JS代码在网页端,即可将整个数据分析的流程(从采集、数据传输、输出存储、数据转化、可视化、高级分析模式)通过一个产品展现。

2、实时信息。用户在界面,直接圈点最关心的界面(比如按钮、轮播图、网页、移动页面等),即可马上呈现信息分析。

3、规模化智能分析。网页的所有元素可以进行拆迁。将用户的需求数据标签化后,从而针对业务类型给出专业的商业分析数据页,满足不同部门员工需求。

4、数据保密。第一方数据属于第一方,通过设置管理权限保证数据安全。“我们不会销售数据。我们仅提供分析功能产品的服务,里面有权限管理,不是所有人都能看到所有东西。”

为了适配不同的浏览器,技术团队花了近3个月的时间测试。“猎豹浏览器、360安全浏览器,浏览器里面又分很多版本,很多各种公司还有自己开发的浏览器。往往同样一个网站,是在不同的浏览器上打开,所以我们要获取网站上的所有元素的浏览量和点击量。”

8月24日第一版上线至今,产品一直处于内部邀请及小范围公测阶段,测试企业大多集中在SaaS领域(人力资源系统、CRM、企业协同、物流等等),获得为期1个月的免费体验期。待产品真正上市之时,GrowingIO将通过客户流量和用户数量加权的方式,收取年服务费进行盈利。

8月底,GrowingIO获得220万美元天使轮融资,投资方为经纬中国的创始人邵亦波、LinkedIn的创始人Reid Hoffman、美国最大风险投资基金之一NEA。

随着大数据概念的普及,从粗犷式运营走向精细化的数据驱动是大势所趋。

“这个市场的培育期不会太久。”如Simon所说,在“让每一个企业都有数据科学家”的理念下,Ommiture,Google Analytics,Mixpanel,TalkingData,Umeng等企业也纷纷加入了这一相对空白的领域,市场正在苏醒。


GrowingIO是新一代基于用户行为的数据分析产品,数据采集无需埋点,用户行为分析更专业。登陆www.growingio.com 免费注册申请试用,或者关注微信公众号 GrowingIO 获取更多用户行为数据分析干货。