公司通过把我们所说的、做的和在线的一切都转化为消费者特征分析的实验,赚了数十亿美元。最近,一些用户已经经受够了,限制了他们对社交媒体的使用,或者完全删除了他们的账户。但根据一项新的研究,这并不能保证隐私。如果您可以链接到其他用户,他们的活动也可以暴露您。现在,计算机科学家已经证明,你的10个最近的联系人的Twitter流可以预测你未来的推特甚至比你自己的流更好。
“从这种二手监视中找出一个人的性格要比看上去容易得多,”奥地利维也纳医科大学的计算社会学家大卫·加西亚(DavidGarcia)说,他没有参与这项研究。
伯灵顿佛蒙特州大学(UniversityofVermontofBurlington)的研究人员没有预测任何人的实际推文,而是利用一种叫做熵的测量方法,估算了一个人未来的词汇的可预测性。更多的熵意味着更多的随机性和更少的重复。他们查看了927个用户的推特流,每个用户有50-500个关注者,而每个用户最多有15个推特用户。在每个人的流中,他们计算出单词序列包含多少熵。(平均而言,推特用户比海明威拥有更多的熵,比詹姆斯·乔伊斯(JamesJoyce)更少。)然后,他们将这个数字插入信息论中的一个名为Fano‘s不等式的工具中,以计算一个人的流对他或她下一条推文中的第一个单词的预测能力。准确度的上限平均为53%。但是预测每一个连续的单词有点不准确。