爬了《权游》7季剧本,话最多的人居然是?
接下来的几周我将围绕权利的游戏做一些分析。这篇开篇的文章将展示一些我初步的发现。 其中很多发现都很有趣,因为他们都很好地代表了这个电视剧中的角色和情节。 这篇文章中所有的数据都是从 http:// genius.com 上爬下来的,令人惊喜的是这个网站上权游每集的剧本都有。我自己用R写了好几个不同的爬虫,经过大量的数据处理,最后得到了权游前七季的剧本。虽然没法保证能达到官方的准确度,但我读了好几集,觉得还是比较准确的。 如果一定要你猜的话,剧中哪个角色和Jon Snow是最像的? 我的数据集中包含了前七季中所有角色,从Jon Snow到“第六号士兵”,每个角色说过的每个单词。首先一个最简单的分析角色的方法就是看他们使用最频繁的单词。在移除了所有停止词(a, of, the等)后,我看了一下每个人最爱用的单词。当然这里每一个人指的是最近几季中最重要的16个角色。全剧一共有超过400个角色呢,所以我得挑选一下。 你可以从下图看到结果。这可能是我做的最满意的一张图了,因为它完美地描述了每个角色。 每个角色最常用的单词与相对频率(这个单词占他们所说所有单词的百分比) 一些结论: 如果上面的问题你猜了Jamie的话,这里的数据同意你的看法。(Jon Snow & Jamie: us) 这可能反映了他和Jon Snow都具有领导能力和无私的品质。或者是Jamie说的us是指他和Cersei