一个计算机技术爱好者与学习者

0%

项目简介

在此项目中,我们会将 k-均值聚类应用于安然财务数据。当然,我们最终的目标是识别相关人员;既然我们有了已标记数据,调用 k-均值聚类这种非监督式方法就不成问题。

尽管如此,在此项目中,你仍然会获得 k-均值的一些实际操作经验并尝试特征缩放,这会让你预先了解下一课的材料。
可在此处找到安然数据集。

阅读全文 »

项目简介

此项目有两部分。在第一部分中将运行回归,然后识别并删除具有最大残差的 10% 的点。然后,根据 Sebastian 在课程视频中所建议的,从数据集中删除那些异常值并重新拟合回归。

在第二部分中,你将熟悉安然财务数据中的一些异常值,并且了解是否/如何删除它们。

阅读全文 »

项目简介

在此项目中,你将使用回归来预测安然雇员和合伙人的财务数据。一旦你知道某位雇员的财务数据,比如工资,你是否会预测他们奖金的数额?

阅读全文 »

项目简介

安然欺诈案是一个混乱而又引人入胜的大事件,从中可以发现几乎所有想像得到的企业违法行为。安然的电子邮件和财务数据集还是巨大、混乱的信息宝藏,而且,在你稍微熟悉这些宝藏后,它们会变得更加有用。我们已将这些电子邮件和财务数据合并为一个数据集,而你将在此迷你项目中研究它。

开始:
克隆这个 GitHub 库:https://github.com/udacity/ud120-projects
运行开始代码:datasets_questions/explore_enron_data.py

阅读全文 »

为何要学习新算法?

任何数据分析师具备的一项关键技能就是不断从机器学习中得到新的认识,这也是本节课的学习目标。这节课的内容是一个迷你项目。目标是用你选择的算法来做地形分类,并由你自己进行研究和部署。

阅读全文 »