一个计算机技术爱好者与学习者

0%

前言

本文转载自优达学城《机器学习工程师》

Kaggle 是一个极受欢迎的数据科学和机器学习挑战平台,有着极为活跃和不断壮大的社区。Kaggle 成员不仅可以争夺积分榜上的排名,公司和研究实验室在此提出的某些挑战题还设有丰厚奖金。

Kaggle 为您提供解决复杂现实问题的机会,您可通过解决这些问题磨练您的机器学习技巧,如果你的 Kaggle 个人页面中有积极参与和表现良好的记录,可以让你在申请工作时更具优势。

阅读全文 »

前言

本文转载自优达学城《机器学习工程师》

既然目前为止,你已学会了一些基本的统计学概念,现在让我们探讨一些 Python 库,它们允许您研究数据和处理大型数据集。

具体而言,在本阶段的课程中,我们将探讨 numpy,它允许您处理大量数值数据以及 panda 序列和数据框(它们允许你存储大型数据集和提取其中的信息)。我们将学习 numpy 和 panda.DataFrames,前者能够帮助你处理大量数值数据,而后者可以帮助你存储大型数据集以及从数据集中提取出来的信息。

Numpy 库文档: https://docs.scipy.org/doc/numpy-dev/user/quickstart.html

Pandas 库文档: http://pandas.pydata.org/pandas-docs/version/0.17.0/

阅读全文 »

前言

本文转载自优达学城《机器学习工程师》

欢迎来到本课程!我叫 Mat Leonard,是数据分析师纳米学位的项目主管,也是这个简短课程的讲师。我会在课程中介绍两个对于数据分析师最为重要的工具,即 Anaconda 和 Jupyter notebook。

Anaconda 是一个包含数据科学常用包的发行版本。它是基于 conda ——一个包和环境管理器——衍生而来。你将使用 conda 创建环境,以便分隔使用不同 Python 版本和/或不同包的项目。你还将使用它在环境中安装、卸载和更新包。通过使用 Anaconda,使我处理数据的过程更加愉快。

Jupyter notebook 是 Web 文档,能让你将文本、图像和代码全部组合到一个文档中。它已经成为数据分析的标准环境。notebook 源自 2011 年的 IPython 项目,之后迅速流行起来。在本课程的第二节课中,你将获得使用 notebook 进行分析工作的经验。

让我们继续课程!首先学习 Anaconda。

阅读全文 »