驻云科技创始人蒋烁淼:被误解的大数据

蒋烁淼 亿欧 2017-08-16 08:23:16

8月10日下午,亿欧B2B子栏目在上海举办了“数据赋能—企业数据应用之道”垂直沙龙,戈壁创投管理合伙人朱璘、帆软软件联创陈炎、驻云科技创始人蒋烁淼、Chinapex创略创始人Jimmy Hu、驿氪创始人闵捷、观远数据创始人苏春园、奥凯大宗创始人白睿均有到场分享其对于数据服务市场的演变和理解。

blob.png

驻云科技创始人兼CEO蒋烁淼做了《被误解的大数据》主题演讲,主要核心观点有:

1、在万物互联和人工智能的前提下,才能触发真正意义上的第三次工业革命。

2、互联网化是要构建一个符合业务边界的子网。

3、数据不是越多越好,有边界、有场景化的数据,才能发挥更大作用。

4、中国绝大多数企业,根据传统规则建立的数据体系并不科学。

以下是蒋烁淼的演讲速记,经亿欧整理编辑,供行业内人士参考。

很高兴来到这里,简单介绍一下,我是驻云科技的蒋烁淼,是湖畔大学的学员。我们在湖畔大学,学习了很多东西,马云经常说DT时代,我对DT时代有一点小小的看法。

我最近比较兴奋,孙正义说睡不着觉,有两个东西让他睡不着觉,第一个东西是人工智能,听到人工智能这个词,大家会有很多联想。第二个让他睡不着觉的东西,很多人都忘记了,或者错误的把它理解为另外的东西,叫做IOT,但他用的实际的词是万物互联

在万物互联和人工智能的前提下,才能触发真正意义上的第三次工业革命

当时蚂蚁金服的首席战略官跟我们讲到一个观点,第二次工业革命以后,到第三次工业革命之间,人类的总体生产力并没有出现指数级的上升。不像蒸汽机的发明,电力的使用,它带来生产效率的提高是指数级的。现在很多工业产业,还是第二次工业革命带来的,而不是信息革命带来的,信息革命更多是一个辅助。所以我认为在万物互联、人工智能的背景下,才会真正产生第三次工业革命。

PC互联网时代,我们催生了很多词汇。像OA、ERP、生产线、供应链、CPU等,这些词之间的相同点在于,它们是线性的一条链路。生产线是链,CPU和诺依曼式也是一行行指令执行的。

但是如今,每个人拿着手机,都被网络连接着。今天人工智能最重要,其实深度学习神经网络在五十年代就有论文了。为什么五十年代做不出来?因为最基本的计算能力没有。没有计算能力,那么复杂的所谓黑盒学习的多个神经元连接的人工智能就不可能成功。但是今天GPU高速发展,最新最快的GPU可以比去年最快的GPU快八倍。一个模型,用CPU跑预计要三天时间,用GPU跑,只要五秒。

大家现在做IOT,有一种我觉得是伪IOT,比如拿着手机去控制开灯,开空调,没有什么意义。但共享单车是IOT的一个最佳应用实践,因为它把每辆自行车连入了网络,才让自行车产生新的商业模式。今天人类社会的演变,从传统的OA、ERP等词汇,到GPU模式的改变,互联网的改变,社交方式的改变。因为微信,现在传播方式已经大大改变了。所以今天我们要思考,在万物互联的情况下,怎么互联网化

互联网最烦的事情是什么呢?

有个现象,比如我们可以用滴滴打车,而不会用微信摇一摇。微信边界太广了,而滴滴打车的业务边界很清楚,效率就高。所以我们要构建的,是一个符合业务边界的网络,是互联网环境下的子网。你要对于你业务边界充分定义,让子网当中连接的每一个子点以最高的效率执行。

为什么我说大数据被误解了?如果今天所有的数据,还是基于传统的线性模式。举个例子,比如一家蛮有名的电商公司,他们商业模式,有天猫店、京东店可以拿到一些数据,他们还有一些专柜,很多是走批发货的,比如这个城市某个超市,有他的代理商,合作非常简单。拿多少货,就结算多少钱,根本不到零售端取得消费者数据。很多人把大数据理解成BI,在我看来,BI的意义却不大。

很多企业没有用互联网方式在数据产生端,构建一个模式,因为没有数据。不像盒马鲜生,完全数字化,所有消费者行为的数据都有,所以它要分析处理,大数据才有意义。现在商业模式积累的数据、产生的数据结果分析数据,起源的本身模式就是错误的。没有数据,或者是数据不对了。

还有数据清洗的问题。

我们在广州有一家很大的购物中心做了实验,把淘宝的一部分消费者个人的数据引入到了线下,最后发现只有性别有用,其他数据用处非常少。

我们在这个购物中心重新定义了数据,把场内数据用起来。通过混合支付,只用一个POS机,就可以让客户用微信、支付宝都可以支付。但我们的目的不是收商铺的钱,而是收集数据。比如用户在耐克购买了一双鞋,在附近又买了其他的东西。我们将这些相关数据记录下来,并进行直接处理,我们的目的不是为了收商铺POS钱,而是收集了数据。

比方几点几分谁在耐克买了双鞋,这是在这个购物中心产生的数据,同时你还会买其他的东西。我们做到这一点以后,通过对数据的直接处理,结果很像支付宝的口碑。你到星巴克喝了一杯咖啡,PAS给你一个小票,上面写着“20块钱耐克代金券,今天有效。”为什么给耐克代金券呢?因为你买的耐克多,所以我在这么推荐。

包括未来还试图引入消费贷,这双阿迪达斯的鞋太贵了,学生党买不起。没关系,你是周边的人,经常到购物中心消费,消费记录非常好,现在花呗给你找打折。另外可以把一些消费者进行社群连接,比如同时喜欢阿迪和耐克的人,或者有明显长链消费属性的人组成各自的社群,通过微信群等各种方式运营起来,就会产生收益。我们估测可以为购物中心带来10%以上的销售额增长。

其实大家可以发现,这个例子里面,数据有边界,有场景,数据不是越多越好。数据场景化之后,会让数据发挥更大的作用。

如果在数据产生的一瞬间,定义它的用途,重新构建数据流和数据背后的结果,反而更容易催生垂直行业人工智能的应用。比如我们帮农业的上市公司在做一件很简单的事情,搜集全国客户所有的农田的土壤酸碱度、种植量、农产品的类型、对应的期货的采购价格、以及整个成熟度产量,我们就可以给这些农业产品销售人员,提供一个农业产品销售助手。他到当地采集了土壤酸碱度等各种的数据,告诉农民,你种这个种子,打这个农药,赚钱最多。马上这个垂直应用就出来了。

如果你不改造这家农业公司的业务形态,你都没有数据,怎么能做出这样的人工智能呢?有一个概念叫“数据治”,意思是数据很多,通过治理它,让数据能够有用。今天中国绝大多数企业面临的问题,是通过传统的流程、规则建立了自己的数据体系,但这些数据体系本身就不科学。但是今天中国绝大多数企业,面临的问题,就是通过传统的流程规则,建立了自己的数据体系,但是这些数据体系本身就不科学

回到非互联网型企业,最重要的是,不是他们要不要用大数据,而是他们和终端消费者、合作伙伴、供应链距离太远了,没有用数据支撑。虽然这些数据本身就存在,但是它没有用系统解决它,这一步没有做到,最后只能用大数据卖个小产品,只有这样的价值。不是说数据没有用,而是它不能改变公司的形态。

最后总结,我认为真正意义上数据的价值,是小数据加场景,这个小不是指数据非常少,而是数据必须要在规则边界内实现它的应用价值,能够变现的数据才有价值,而不是纯粹搜集更多的数据。实际上人工智能的研究也是这样的。今天人工智能最新方向,是如何通过更少的样本数据,训练更有效的人工智能。而不是用更多的数据去训练。

谢谢大家。

长按二维码关注我们