Python:项目-电影数据集分析 (三十八)

在本项目中,你将分析一个电影数据集,然后传达你的发现。你将使用 Python 库 NumPy、Pandas 、 Matplotlib 和 Seaborn 来使你的分析工作更加轻松。

学习收获

完成此项目后,你将:

  • 了解典型数据分析过程中所涉及到的所有步骤
  • 轻松提出可用给定数据集回答的问题,并解答这些问题。
  • 了解如何调查数据集中的问题,以及将数据整理成你可以使用的格式
  • 练习传达你的分析结果
  • 能够在 NumPy 和 Pandas 中使用向量化运算,以加快数据分析代码的运行速度
  • 熟悉 Pandas 的 Series 和 DataFrame 对象,它们能使你访问数据更方便
  • 了解如何使用 Matplotlib 生成图形,展示你的发现

要求

在此项目中,你需要进行数据分析,并创建一个文档分享你的发现。你应该首先了解数据集,想想它可以用来回答哪些问题。然后使用 Pandas 和 NumPy 回答你最感兴趣的问题,并编写一份报告来分享你的结论。你不需要使用推论统计或机器学习知识来完成此项目,但是你需要在报告中声明,你的结论是暂时的,可能需要进一步改进。

思考你可以用数据集回答哪些问题,然后开始着手回答这些问题。 试着完成项目中的任务,你应该在你的调查里分析至少一个因变量和三个自变量。在恰当的地方使用 NumPy 和 Pandas。

为者常成,行者常至