主页 > 大数据动向 >

神预测了川普赢得大选后,告诉你为什么说是三大技术的胜利?

作者:秩名 发布时间:2016-11-10

36大数据

  美国走进了DT时代!

  2016年11月9日,唐纳德·川普(DT,Donald Trump)在大多数媒体、华尔街精英和知识分子的反对声中拿下超过270张选举人投票,成为美国新一任总统,也印证了DT(Data technology)时代真的来了。

36大数据

  我们在9月底川普和希拉里的第一场总统候选人辩论后便预测川普会赢。那么,到底是什么原因助推川普步步紧逼希拉里,直到赢得大选?总结来说,原因有三!
  首先是大数据技术的胜利!

  早在 2012 年奥巴马竞选时,民主党的竞选团队中就吸纳了一批有类似特质的科技人员,开发了一套数据库 Narwal 用于管理投票情况。助奥巴马连任成功,功不可没。

  与过去相比,现今的总统选举在利用大数据分析这一块更加旗鼓相当。希拉里和川普同样都有大数据分析团队,拼的就是谁做得更好。

  任何数据分析工作的执行,都需要做好三方面的准备:

  1 收集和整理数据

  从目前来看,大数据分析现在是大型政治选举的桌面筹码。当需要帮助政治家尽可能有效地拉选票时,大数据收集和整理就必不可少。

  先扒一下希拉里和川普背后的两家大数据公司。

  TargetSmart 给民主党派和州民主党派以及他们的同盟提供大数据分析和服务;Deep RootAnalytics,给共和党及其从属团队提供数据分析。

36大数据

  Deep Root 和 TargetSmart 都是利用 Alteryx 的软件来说明他们容纳、净化、混合以及分析来源不同的大规模资料。这种分析软件以一种最有效的方法,来分析所有选民的年龄结构,根据不同年龄段来分段并且打分,然后利用这些资讯来优化他们在媒体上的花销,特别是在非常重要的电视广告上。

  Deep Root 利用它的分析模型来告诉参选者,在他们已有电视预算的条件下,哪些地方能获得最大的收获。正如 Seawright 表示,资料分析在每天的决策过程中发挥很重要的作用。

  资料将会指示客户该将他们的竞选广告放到哪,才能让他们的目标人群最有可能看到,也会提示他们花销的纪录,透过让客户在情景中能够意识到这个问题,不仅提供他们所做的与目标人群相关的理由,而且也会分析竞争对手或同盟所做的,对目标人群的影响,这就允许他们能够对正在进行的分配任务具有策略性,并对广告投放更聪明——把广告投放在最不显眼而又最高效的地方,同时根据其他人或组织的移动来及时做出反应。

  TargetSmart 也提供相似的分析服务,但是透过利用资料来优化移动不仅只是在电视广告投放上,也在客服中心活动、传统邮件及社区拉票,TargetSmart 在它的 360 度投票者联系技术上比他们的老对手走得更远。

  2“精准”,了解个性化需求

  大数据技术显然已经推翻了美国历史上总统选举的定律:谁筹的钱越多谁胜出可能性越大、谁花的钱越多谁就会赢。

  但要做到“精准”是一个与业务定制的过程。

  曾经奥巴马团队能取得颠覆性的胜利,是因为他们做到了三个最根本目标:让更多的人掏更多的钱,让更多的选民投票给奥巴马,让更多的人参与进来!这些都缘于他们对选民的认知达到了“微观”层面:每个选民最有可能被什么因素说服?每个选民在什么情况下最有可能掏腰包?什么样的广告投放渠道能够最高效获取目标选民?这些都缘于他们对选民的认知达到了“微观”层面:每个选民最有可能被什么因素说服?每个选民在什么情况下最有可能掏腰包?什么样的广告投放渠道能够最高效获取目标选民?

  机器学习是数据挖掘中常用的方法,它的基本原理是让计算机从历史数据中“学习”其中的规律,并利用该规律对未来数据进行预测,这个过程也就是建模和预测的过程。因此,当用户数据因业务而异时,每一组数据中都会有自己独特的数据模型,这也就是与实际业务相定制的过程。比如,奥巴马的数据团队就会对每一个群体的选民都进行建模,进而预测他们的捐款行为方式(通过网络捐款,还是会汇款)。

  因此,在激烈的市场竞争中,谁能够深入的了解他的每一个用户的个性化需求,谁就能在竞争中击败对手,获取胜利。

  但希拉里在这点上明显逊于川普,川普的竞选口号”Make America Great Again”表达了一种变革的力量,比奥巴马change口号后的并没有实际改变的现状更符合民意。而希拉里“Stronger Together”的口号显然无法满足当下的诉求。

  那么,既然数据科学家团队都这么强,为什么川普能赢?这就涉及到第三点,要根据情况调整模型。
  其次,是互联网时代的胜利!

  模型需要根据实际情况进行动态调整。用户因环境、喜好或其他因素常常会导致其行为规律发生一定的变化,使得其产生的数据也随之变化,这些变化将会影响模型的精准性。

  但在第一次辩论结束后,据CNN于辩论后公布的最新数据,有62%的民众认为希拉里技压全场,只有27%的民众认为川普占了上风。而彭博发出的数据显示,川普已经领先了两个百分点。

36大数据

  但如今互联网时代,主流媒体的“民意”不太靠谱。川普的成功竞选,代表了互联网的胜利。

  这是因为,传统媒体,如报纸和电视都是单向传播,没有交互性。虽然也可以用抽样问答的形式来统计,但因为是小样本,采样者因个人的主观意愿很容易对采样人群的偏向性,造成结果的大幅度偏离。所以传统媒体虽然收了很多钱做广告宣传,但是宣传效果怎么样,广告受众真实想法如何,是完全不知道的。

  只有新媒体像facebook、 twitter可以做到。因为这两者都是典型的双向传播。大数据公司只有通过互联网渠道拿到反馈数据进行模型的调整。

  结果希拉里沉浸在传统媒体的“民意”调查里,成了冤大头。要知道,希拉里得到的竞选经费是川普的好多倍。

  3 动态调整模型

  利用社交媒体资料来更广泛地理解人们的消费方式,还有人们与社交媒体连接的方式,这对于大数据分析而言将会更有价值。

  透过利用个人可辨识的资讯,比如将美国2.55 亿国内投票者资料与类似 Facebook、Google、Yahoo 及 MSN 等数码平台上的使用者匹配。他们不能够将每个推特用户与注册的投票者相匹配,但是能得到一个内部可以利用的相当规模的资料。如果按正确的方法来做这件事,它就会注入到你的模型中。
  三、川普的当选,是恐惧的胜利!

  据《环球科学》分析,为什么在各类民意调查中特朗普均落后,主流媒体更是一边倒地支持希拉里,最终的投票结果却无疑使他们大跌眼镜?其实,这一幕在2016年全球政治中似曾相识——尽管绝大多数专家意见都表明英国退出欧盟弊大于利,但在6月24日举行的全英公投中,52%的英国人选择了让英国退出欧盟,最终推动了这一改变历史的决定。

  在52%的选民投票决定退欧之后,一切都如专家预测中的一样发展:英镑立刻贬值,苏格兰分裂的可能性进一步升高,有很多人感觉被自己的祖国背叛了,而很多人投了退欧之后又马上后悔做出了这样的决定。

  而特朗普的竞选纲领,与退欧倡导者的观点不谋而合。退欧倡导者不仅宣扬政治主权的宣扬,还通过编织谎言、谩骂难民来煽动民众的恐惧,声称要“make Britain great again”。当然,也不是说留欧派就完全没有利用大家对退欧后经济滑坡的恐惧来宣传,但显然退欧派使用的技巧在情绪上更有煽动性。

  如果这些技巧在英国取得胜利,那么它们在美国也很可能取得胜利。

  那么,为什么恐惧会胜出呢?

  其实,情绪和记忆的关系是很复杂的。研究表明,从总体上来看,如果一项陈述非常情绪化,我们会更容易记住它。

  这是因为,如果在一个观点中加入情绪,我们就要同时在记忆中存储两样东西:这个观点本身,以及它所带来的情绪,这让大脑储存它们的过程变得更加复杂,也就产生了更大的记忆网络,更容易在之后被唤起。

36大数据

  此外,情绪,尤其是恐惧,对决策的影响是相当大的。如果我们处于恐惧状态,或者被迫专注于基于恐惧的论证过程中,我们的大脑就会进入一种被称为“外围处理”(peripheral processing)的状态。

  外围处理是指我们基于一项事物的外围性质,如情绪、演讲者的长得好不好看等因素来做决策,而这些都依赖于信息传达的方式,而非信息本身。

  这就是为什么像“欧盟在欺负英国”呀,还有“美国可能有ISIS间谍”这些言论一出,很多人都不再依据客观证据来做决策。

  因此,要基于深度学习算法进行情感分析,来指导建模。
  最后,DT时代,不懂大数据技术,真可怕!

网友吐槽

推荐阅读