粉丝的数据,真正路人的数据,是完全不一样的。
三百人给出的假象,又怎么能比得过五十万人的随手一点呢?
束青要是按照前面假象来做分析,那就真的扯犊子了。
她要的,唯一有用的,恰恰是无法辨认的“五十万”。
为了搜集到这些,束青可谓是绞尽脑汁,这也是为什么她会去拜托卓颜——半年的时间里,卓颜团队一直在线下做着对阮渔的问卷调查。
让卓颜去做的话会方便很多,她紧跟着阮渔,综艺、站台、直播、宣传、品牌合作等等,她说要收集关于阮渔的舆论信息,一般来讲,合作方都会很配合。
青云惊鸿这类自己人,就更别说了,那简直是豁出家底来配合她,要什么有什么,甚至可以改他们品牌自己的活动流程。
除此之外,卓颜还安排了人时不时地扫街,问路人对当前流量、明星、娱乐圈的看法,里面会混入阮渔,又或者问题里什么都没有,让路人自己发挥。
这半年来,卓颜将简单整理后的文字、音频、影像资料等定期传给束青,她团队里还专门有人带队负责此事。
好在幸不辱命,一切忙碌都有了结果。
束青:“阮渔的粉丝量一直在增加,我将她海内外所有的账号粉丝数字作了处理,剔除了重复、机器等,最后得到了这样的折线图。”
至于如何剔除,就是一个很麻烦的过程了。她还让雀寻去申请了沧兰洲官方政府的居民数据库支持,对于海外的也有着另一种算法。
虚假的上千万粉丝量中,活粉不少,但肯定达不到这几千万的繁花如锦,顶多占个一小半而已。
现在各大app对于民众的隐私侵权到令人发指的地步,束青去调取了官方数据,也跟几个合作的软件公司做了联合,得到了她想要的。
束青:“这些是抓取到的对阮渔的网络评论,当然,在这个过程里,过滤掉了通稿这类。”
卓颜团队的通稿、合作方的大批量宣传、水军等等真的不少,但好在这些都有迹可循,采用的措辞、行文习惯全都比较固定,特别是水军,最明显不过了。
另外,比较烦的还有虚假流量。
“做数据”、“打call”,这些明面上的流量数据开始反过来裹挟相关者,然后劣币驱逐良币,不愿意同流合污者被甩在后面,内卷以后,现如今的假数据膨胀率简直惊人。
束青:“卓颜那边跟人一起清理了一批虚假流量,那一段时间,数据方便的反馈就弱化了许多。”
她刚好也趁机与前后的时间段进行对比,使得自己这份报告里的内容更加真实。
从阮渔出道到第一次穿越,这个阶段里对阮渔的一些关注度是不太够的,束青丢失了不少数据,就算找技术人员去爬网络资料,困难度也挺高的。
她要求得太细碎了,互联网也太大了,数据量过于庞大,不啻于大海寻针。
最关键的是,时间已经过去了,想探索阮渔那时在线下的知名度、风向等,已经无法做到了。
所以束青还需要对这些作新的处理。
她当年毕业时候为了做数据处理,愁了三个多月,死活得不到自己想要的,最后好不容易毕了业,闭着眼跟自己说就这样了凑合过吧还能不要毕业证书咋的?
虽然那个时候她同学都笑骂学神装逼,不给他们这些学渣活下去的勇气,束青的毕业论文写得极为漂亮。
但她不满意。
就像是这一次,束青用了半年多的时间,来论证一个自己突如其来的灵感假设。
她成功了,所以现在,束青站在了这个报告会上。
安静的氛围里,她侃侃而谈,讲述着自己这篇论文的所有信息。
最后,她回到了一开始给出的那张图片上。
在针对穿越契机的研究中,最容易被关注的是阮渔粉丝量的增长,从二十万到一百万、三百万,再到一千万、五千万,他们试图研究这个数据与她穿越的关系,最后发现太乱了,结合得一点都不紧密,导出后的p值显示不相关。
束青也跟着做过这个,不过这一次,她没将粉丝量算进去。而是以剔除后的真正粉丝数,结合网络上对阮渔的舆论,尝试千百次,最后才定下了这一部分的赋值。
又寻找到了网络与线下的合理权重,分别作了对比更改。
“每一个瓶子,是每一次穿越。里面的内容物,是我赋值以后的总和。可以看出,每一瓶的总和是接近的。”
折小霜和陈一他们组曾经提到过,系统的到来并不单纯,尽管这只系统很蠢,但背后可能存在着很强烈的阴谋。
那个时候,有人说,系统可能是来银尾星通过阮渔收集信仰的。
很早之前有神话传说,里面的神仙鬼怪是需要被人供奉的,得到的信仰越多,自己的实力也就越强,然后就可以庇佑自己的信奉者,再循环往复。
皇帝们还流行给一些神仙封官,送这些神仙来自君权的肯定,定为国教,盖庙立祠允许祭祀。
民间还有野祀,五通神等孤魂野鬼,这些不被官方认可的鬼怪,得到了百姓的信奉后仍然可以获得力量。