
什么是胡说? 这个贬义词与误传或宣传有何不同? 我们一直都在听到错误信息,包括脂肪对您有害,从长远来看,GPA至关重要,而健身房则制造腹肌。 这些陈述的问题在于,我们很多人实际上并不知道他们是胡扯。 查找和反驳这些语句的一种方法是使用数据。 我们可以触及到如此大量的信息,我们不妨利用它来向社会传达真相,而不是虚假的谎言。 这篇简短的博客文章将尝试在探索性数据分析中发现这种信息时,以数字方式区分此类信息。 我们正在专门考虑电影评论家知道电影的一切知识的观点,而这反过来将与电影的成功与否相关。 这是一个普遍的误解,我将不得不称之为废话。
处理
为了证明这一点,将使用来自Kaggle的数据集进行探索性数据分析,该数据集包括1000部电影,其评论家得分(Metascore),用户评分,收入和各种解释变量。 此过程的第一步是清理数据集以使其更易于使用。 首先,我删除了所有不必要的列,然后将Metascore转换为一个更易于与用户评级进行比较的值。

分析
现在到有趣的东西。 首先,我想知道评论家和用户对哪种电影评价很高,然后这些列表是否不同。
根据用户排名前十的电影:
- 黑暗骑士-评分= 9.0
- 初始—等级= 8.8
- 孟加拉-评分= 8.8
- 星际-评分= 8.6
- Kimi no na wa —评分= 8.6
- 无法触及的人-评分= 8.6
- 鞭打-评分= 8.6
- 威望-等级= 8.6
- 已故者-评分= 8.6
- Taare Zameen面值—评分= 8.6
影评人评出的十佳电影:
- 少年时代-评分= 10.0
- 月光—评级= 9.9
- 潘的迷宫-评分= 9.8
- 12年的奴隶-评分= 9.6
- 重力—评级= 9.6
- 料理鼠王》-评分= 9.6
- 海边的曼彻斯特-评分= 9.6
- Carol-评分= 9.5
- 零黑暗三十度-评分= 9.5
- 社交网络-评分= 9.5
根据我对批评家的胡说八道,这份名单正在逐渐成形,看起来像我认为的那样。 请注意,评论家前10名中的标题太模糊了,我不知道您是谁,但我在列表中唯一认出的电影是料理鼠王。 将其与用户的前十名进行比较,我们会看到即时经典之作,例如《黑暗骑士崛起》,《盗梦空间》和《星际穿越》。 下一步是了解这些电影在收益方面如何与大片相提并论。 当我计算每个组中前十部电影的平均收入时,两者之间的差异令人震惊。 评论家挑选的电影平均票房为8670万美元,而用户选择的电影票房平均票房为1.418亿美元。 增加了61%。 在财务方面,这些家伙没有得到。 我们通过对所需列中的数据集进行简单过滤来完成此任务。 接下来,我们取平均值并比较两个数字,如下所示。

结论
评论家为什么不承认这些蓝筹电影呢? 进行的数据分析旨在验证我对这些批评者的废话。 这些评论家正在审查这些电影,并试图将它们分开。 他们只关注电影指标,剧情如何在特定地点达到高潮。 他们正在寻找完美的电影。 对于这些自以为是的评估者而言,公众一波三折的重磅炸弹根本没有做到。 这些评论家试图对本来应该很有趣和引人注目的热门歌曲太苛刻。 我认为,仅从统计数字来看,这些批评家就变得毫无用处。 他们无法正确地确定一部好电影,即使电影在经济上也做得很好。 它们到底对电影世界有什么贡献? 在决定看那部新电影时,必须考虑到这一点。 请理解,这些评论家不能总是确定娱乐电影的模样。 因此,请忽略烂番茄,并询问您的朋友对此有何想法。 希望您现在掌握了一些事实和统计信息,可以自己发表一些有教养的意见。