不要吵了!大数据告诉你,谁才是《老友记》的C位

2019-01-10信息快讯网

不要吵了!大数据告诉你,谁才是《老友记》的C位-信息快讯网

距《老友记(Friends)》最后一集播出至今已有14年之久,但人们对它热情几乎未减分毫。

来自印度的数据科学家Yashu Seth也是资深《老友记》粉丝,一次观看中,他开始思索,到底谁才是《老友记》中真正的主角?

是有情人终成眷属的Ross 和Rachel 吗?是讽刺幽默的Chandler 吗?是洁癖星人Monica吗?是妇女之友Joey吗?还是我们最喜欢的歌手Phoebe?

一千个读者就有一千个哈姆雷特,每个人对于谁是主角都有不同的答案。但是,我们可以利用数据分析出,到底是谁站在《老友记》中的C位!

为了确定这个问题的答案,Yashu Seth从GitHub中下载了《老友记》十季的剧集对白,并且用不同的参数来找出这六个人中谁是最突出的。

不要吵了!大数据告诉你,谁才是《老友记》的C位-信息快讯网

整个分析是使用R语言完成的,因为要涉及到将原始的对白文件转换成结构化的表格形式,然后再进行探索性的数据分析。

你可以在GitHub中找到源代码:https://github.com/yashu-seth/friends-analysis-blog

首先,让我们看看每个人的台词。我们无法得到每个角色在屏幕中实际出现的时间,但每个人的台词量可以作为一个合理的估算标准,所以究竟是哪位朋友的台词最多呢。

Rachel 和Ross 都有9千多句台词,他们两的戏份差不多.Phoebe 说的最少,只有7400句。Chandler,Monica 和Joey 的台词量几乎相同。接下来,让我们再来看看每一季每个人的台词量。

不要吵了!大数据告诉你,谁才是《老友记》的C位-信息快讯网

这张图给我的直观感受就是,编导均衡分配六个朋友的台词。 Ross 在前三季和最后一季的台词数最多,剧中这几季是Ross-Rachel的感情线发展的最好的时候,所以Ross台词最多有没有可能是这个原因呢?

Chandler 在第四季和第六季中拥有最多的台词,而Joey在第五季以小优势击败了他。Rachel 主宰着第七季到第九季,在几乎所有的剧集里,Monica在六人中都有超过半数人的台词量。

好几季中,Phoebe的台词量都最少。但她依旧用她自己的方式让我们爱上了她,难道不是吗?

既然我们已经看了台词的数量,接下来再看看所说的单词数量是否也有相同的分布。

不要吵了!大数据告诉你,谁才是《老友记》的C位-信息快讯网

可以看出,单词的数量或多或少遵循相同的分布。那么现在谁处于上位呢?Ross 和Rachel之间的竞争很激烈啊。

现在,让我们来看看他们出现在荧屏上的次数,这里我假定一个角色只有在有台词的情况下才算在屏幕中出现。

不要吵了!大数据告诉你,谁才是《老友记》的C位-信息快讯网

数据结果非常有趣,Chandler在银幕上出现的次数最多 ,出场次数高达1400多。Ross 和Rachel 的出场次数也不少,分别是1330次和1370次。Phoebe依旧是小可怜,出现的次数最少。

单人出场次数也是一个很好的参考指标。在这一部分中,我假定六个角色中只有一人出场的场景,此处包含其他配角的场景也计算在内。

不要吵了!大数据告诉你,谁才是《老友记》的C位-信息快讯网

这种情况下,Ross 显然是赢家,这一次Rachel 与他差了一大截。

最后,我们来分析一下他们在剧集标题中到底被提到过多少次。

不要吵了!大数据告诉你,谁才是《老友记》的C位-信息快讯网

这次Rachel 是冠军,她总计被提到27次,排名第二的为Ross,他被提到24次。Monica 被提到次数最少,一共只提到过8次。

分析结论:

1,Rachel 和Ross 的台词数量最多,并且两人之间的差异微不足道。单词数量的情况与台词量类似;

2,Chandler 在银幕上的出场次数最多,Rachel  和Ross 的出场次数也处于上位;

3,Ross 显然是个人银幕出现次数最多的赢家,Rachel与他的差了一大截 ;

4,Rachel 在剧集标题中提到的次数最多,但Ross只落后了3集。

不要吵了!大数据告诉你,谁才是《老友记》的C位-信息快讯网

Ross 和Rachel的地位真的很接近,但是Ross 在个人场景中的表现大大超过了Rachel ,因为他们在其他参数上差异很小,所以我必须把C位给Ross

当然抛开数据分析,我们也想知道,你心中的老友记C位到底是谁呢?


综合自:大数据文摘

制作编辑:童薇菁

责任编辑:柳青

*独家稿件,转载请注明出处。

正面刚!还记得那个被特朗普赶出白宫的CNN记者吗?CNN为他正式起诉特朗普和白宫
跨年夜南京路“兵哥哥”被C位上镜 在线圈粉无数游客
谁在给流量数据造假打造温床
大数据、人工智能都齐了!沪港台学子比拼金融科技创新
算法智能带来麻烦 大数据社会需要考虑算法治理
为打击数据流量造假,微博转发、评论计数显示上限调整为100万
上海银行和税务实现数据直联,民企融资更快
硕果满枝销路广 农旅结合有奔头(总书记的深情牵挂——来自贫困乡村的精准脱贫故事)
语病多多的《知否》,竟然已经是古装剧的业界良心了……
国家卫健委回应出生人口大幅下降问题:权威数据近期发布
亮瞎了这份大数据!《基督山伯爵》受小镇青年追捧,四川人除了麻将还爱悬疑书!
太魔性!男校长C位带领全校师生课间齐跳鬼步舞,网友:堪比男团
躺赚!《老友记》主演靠重播年入两千万,长尾效应让好作品持续发光
出行高峰是哪几天?东航大数据预测春运,11.5万班次迎接大客流
地球“中国数据”上线,中科院发布地球大数据共享服务平台
“未来医院”呼之欲出:“抗癌登月”精准医学大数据云计算等服务落户上海
《夜魔侠》《卢克·凯奇》《铁拳》断更,连《老友记》在Netflix上也悬了,原因一样
她可能是史上最酷的coser,星辰、宇宙和外星人,比科幻还要科幻
©2014-2024 dbsqp.com