第七百七十三章 马芸:我还有话说!
叶风讲的虽然浅显易懂,但确实精彩万分pfmssヽcc
“数据处理,必须经过这几个步骤,完成之后才会有智慧pfmssヽcc”
此时台前的叶风,像极了传教老师pfmssヽcc
下面的众人,像极了专心听弟子pfmssヽcc
“第一个步骤是数据收集pfmssヽcc这里有两个方式,第一个方式是拿,专业点的说法叫抓取或者爬取,例如万象搜索就是这么做的,它把网上的所有的信息都下载到它的数据中心,然后你一搜才能搜出来pfmssヽcc比如你去搜索的时候,结果会是一个列表,这个列表为什么会在搜索引擎的公司里面呢,就是因为他把这个数据啊都拿下来了,但是你一点链接,点出来这个网站就不在搜索引擎它们公司了pfmssヽcc”
“比如说网易有个新闻,你拿万象搜出来,你不点的时候,那一页在万象数据中心,一点出来的网页就是在网易的数据中心了pfmssヽcc另外一个方式就是推送,有很多终端可以帮我们收集数据,比如说华风智能手机上面的健康管理应用,可以将你每天跑步的数据、心跳的数据、睡眠的数据都上传到数据中心里面pfmssヽcc”
“第二个步骤是数据传输pfmssヽcc一般会通过队列方式进行,因为数据量实在是太大了,数据必须经过处理才会有用,可是系统处理不过来,只好排好队,慢慢的处理pfmssヽcc”
“第三个步骤是数据存储pfmssヽcc现在数据就是金钱,掌握了数据就相当于掌握了钱pfmssヽcc要不然别人怎么知道你想买什么呢?就是因为它有你历史的交易的数据,这个信息可不能给别人,十分宝贵,所以需要存储下来pfmssヽcc”
“第四个步骤是数据分析pfmssヽcc刚才说的存储数据是原始数据,原始数据多是杂乱无章的,有很多垃圾数据在里面,因而需要清洗和过滤,得到一些高质量的数据pfmssヽcc对于高质量的数据,就可以进行分析,从而对数据进行分类,或者发现数据之间的相互关系,得到知识pfmssヽcc”
“比如90年代盛传的沃尔玛超市啤酒和尿布的故事pfmssヽcc”
叶风刚刚举了一个例子,还没说完,大家就会心笑起来pfmssヽcc
在坐的各位,都是精英,基本上都听过这个故事pfmssヽcc
尤其是红旗大卖场的总裁曹世茹,她知道在美国有一个有趣的现象:尿布和啤酒赫然摆在一起出售pfmssヽcc但是这个奇怪的举措却使尿布和啤酒的销量双双增加了pfmssヽcc这不是一个笑话