如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
BigData:用数据改变世界作者徐涛李蓉慧骆轶航许悦来源第一财经周刊时间:2012-05-1017:36再多的统计数据与模型也不能防止整个经济的下滑和小概率事件发生带来的股灾,无数人正在失去华尔街那份体面的工作。而处理社交网络的大数据却是朝阳行业,人们开始发现大数据或许能让他们和华尔街一样赚钱——即便现在还没有那么多。Robin走进纽约Maidson大街99号17层时,像个异类。他有可能也叫Roby,反正他没带名片。他迟疑地看着里面端着酒杯彼此交谈的年轻人,而自己头发花白。好在他看到了投影仪的幕布上硕大的字样:“BigData”(大数据)。他已和数字打了20年交道,不过是在金融行业。采集数据、建立模型、预测价格的走向,这是他每天都在做的事。“我不喜欢这份工作,这些数据是冷冰冰的,当你处理完这些数据后,你没有成就感。”他说,“我想要做些改变,去面对那些更加活生生的、有趣的数据。”所以他来了这个由咨询公司Dalberg组织的讨论会。他说的那些活生生的、有趣的数据来自于社交网络—Twitter、Facebook、Foursquare以及不断新冒出来的新应用。在Twitter和Facebook刚出现时,鲜有人知道除了吐槽炫耀自恋外这些碎碎念有什么用,但现在这些被称为数据,是价值尚未发掘完全的资源。尽管在过去的几十年里,像Robin这样的程序员和数学家不断在和数据打交道,但是SoLoMo(Social、Location、Mobile)带来的海量数据依然是个新挑战—在一分钟内,Twitter上新发的信息数超过10万;在Facebook上有超过600万的浏览量。而且和单纯的数字不同,这些数据是含义丰富的文字,以及比文字更复杂的图片、音频和视频。实际处理起来,这并不比金融行业中的数据更加有趣。Robin想要离开的真正原因可能是华尔街的萧条。再多的统计数据与模型也不能防止整个经济的下滑和小概率事件发生带来的股灾,无数人正在失去华尔街那份体面的工作。而处理社交网络的大数据却是朝阳行业,人们开始发现大数据或许能让他们和华尔街一样赚钱—即便现在还没有那么多。最主要的盈利模式只有一个。“在线广告已经成为了过去十年财富创造最可靠的来源。把消费者和销售者配对起来,以及创造新的消费者和销售者,这对于任何市场来说都是最重要的问题。”JeffHammerbacher告诉《第一财经周刊》。2006年以前,他还是Robin的华尔街同行,但后来他成了最早加入Facebook的数据分析师之一,以研究科学家的身份帮助马克·扎克伯格搭建了最早的数据分析模型。换个更直白的说法:弄清楚用户点击广告的动机和方式。Facebook开启了互联网公司在盈利模式上的想象力,尽管有谷歌在先,但在线显示广告,甚至商业信息可以作为网站内容一部分这件事,还是给人们提供了不一样的思维方?式。从公元前6世纪的亚历山大图书馆,到把一切都数字化的谷歌,再到SoLoMo时代,数据的获取正在变得越来越细致,也越来越个人化。创新咨询公司Frog(原FrogDesign)在一份全球市场调查中发现,消费者对信用卡公司、在线零售商和科技公司的信任度最高,超过87%的调查者都乐意与这些公司分享个人数据。与此同时,因为对后台操作不了解,人们往往不知道自己已经分享了哪些个人数据。在Frog的另一份调查里,只有20%的人认为分享了自己的网络搜索关键词。而事实上,你并没有办法避免分享这部分数据。大数据的挖掘和分析就像任何行业一样,一开始只是JeffHammerbacher这样的个人研究者,但很快会发展出分工细致的专业服务公司。离Dalberg办公室步行10分钟之遥的地方,有家叫SocialFlow的创业公司,它也许可以算作是内行。它和Twitter是合作伙伴,在BigData行业中生机勃勃。它分析数据,告诉广告商什么是正确的时间,谁是正确的用户,什么是应该发的正确内容。广告商爱这家公司,这让这家公司已经有了40多名员工。这家成立于2009年的公司在2011年说服了在微软研究大数据的专家GiladLotan从波士顿搬家到纽约来和他们一起创业。Lotan看起来很年轻—他的专家资质来自于从2008年起就研究Twitter上的庞大数据,而不是像Robin那样直到今天才想要一探究竟。“你还记得2008年伊朗大选风波吗,每个人都在Twitter上转发,让人惊讶。”Lotan说。之后,他开始围绕伊朗大选做关于信息传播的模型。当时他还在微软工作,这些研究很快被用在了微软Bing搜索上,这是首个可以直接搜索社交媒体信息的搜索引擎。“每秒都有大量新内容产生,而且是非结构化的。这和传统的搜索很不一样。”Lotan说。Lotan喜欢将这些大量的数据分析后的结果可视化,使得那些非技术人员也能轻易明白这些数据在表