一个计算机技术爱好者与学习者

0%

项目简介

安然欺诈案是一个混乱而又引人入胜的大事件,从中可以发现几乎所有想像得到的企业违法行为。安然的电子邮件和财务数据集还是巨大、混乱的信息宝藏,而且,在你稍微熟悉这些宝藏后,它们会变得更加有用。我们已将这些电子邮件和财务数据合并为一个数据集,而你将在此迷你项目中研究它。

开始:
克隆这个 GitHub 库:https://github.com/udacity/ud120-projects
运行开始代码:datasets_questions/explore_enron_data.py

阅读全文 »

为何要学习新算法?

任何数据分析师具备的一项关键技能就是不断从机器学习中得到新的认识,这也是本节课的学习目标。这节课的内容是一个迷你项目。目标是用你选择的算法来做地形分类,并由你自己进行研究和部署。

阅读全文 »

项目背景

在本项目中,我们将再次尝试确认邮件作者,但这次使用的是决策树。初始代码可以在 decision_tree/dt_author_id.py 中找到。

你仍需要在你计算机上完成迷你项目,在浏览器中输入答案。你可以在这里找到决策树迷你项目的说明。

阅读全文 »

项目背景

在此迷你项目中,我们将解决与朴素贝叶斯迷你项目相同的电子邮件作者 ID 问题,不同的是我们将运用 SVM。我们的研究结果将阐明两种算法之间的一些实际差异。此项目还向我们提供比朴素贝叶斯更多的机会来使用参数,因此我们也将这样做。

阅读全文 »

项目背景

几年前,J.K. 罗琳(凭借《哈利波特》出名)试着做了件有趣的事。她以 Robert Galbraith 的化名写了本名叫《The Cuckoo’s Calling》的书。尽管该书得到一些不错的评论,但是大家都不太重视它,直到 Twitter 上一个匿名的知情人士说那是 J.K. Rowling 写的。《伦敦周日泰晤士报》找来两名专家对《杜鹃在呼唤》和 Rowling 的《偶发空缺》以及其他几名作者的书进行了比较。分析结果强有力地指出罗琳就是作者,《泰晤士报》直接询问出版商情况是否属实,而出版商也证实了这一说法,该书在此后一夜成名。

阅读全文 »