一个计算机技术爱好者与学习者

0%

前言

本文转载自优达学城《机器学习工程师》

既然目前为止,你已学会了一些基本的统计学概念,现在让我们探讨一些 Python 库,它们允许您研究数据和处理大型数据集。

具体而言,在本阶段的课程中,我们将探讨 numpy,它允许您处理大量数值数据以及 panda 序列和数据框(它们允许你存储大型数据集和提取其中的信息)。我们将学习 numpy 和 panda.DataFrames,前者能够帮助你处理大量数值数据,而后者可以帮助你存储大型数据集以及从数据集中提取出来的信息。

Numpy 库文档: https://docs.scipy.org/doc/numpy-dev/user/quickstart.html

Pandas 库文档: http://pandas.pydata.org/pandas-docs/version/0.17.0/

阅读全文 »

前言

本文转载自优达学城《机器学习工程师》

欢迎来到本课程!我叫 Mat Leonard,是数据分析师纳米学位的项目主管,也是这个简短课程的讲师。我会在课程中介绍两个对于数据分析师最为重要的工具,即 Anaconda 和 Jupyter notebook。

Anaconda 是一个包含数据科学常用包的发行版本。它是基于 conda ——一个包和环境管理器——衍生而来。你将使用 conda 创建环境,以便分隔使用不同 Python 版本和/或不同包的项目。你还将使用它在环境中安装、卸载和更新包。通过使用 Anaconda,使我处理数据的过程更加愉快。

Jupyter notebook 是 Web 文档,能让你将文本、图像和代码全部组合到一个文档中。它已经成为数据分析的标准环境。notebook 源自 2011 年的 IPython 项目,之后迅速流行起来。在本课程的第二节课中,你将获得使用 notebook 进行分析工作的经验。

让我们继续课程!首先学习 Anaconda。

阅读全文 »

conda简介

本文部分内容来自ChatGPT。

conda是一个开源的跨平台包管理器,用于安装并管理不同编程语言的软件包。它最初是为Python编程语言设计的,但现已扩展到其他语言,如R、Ruby和Lua等。

conda的一个主要优势是它可以同时管理多个环境,使得在不同项目之间切换和隔离依赖变得容易。此外,conda还可以解决依赖关系,以确保软件包之间的兼容性。

相关文档:

阅读全文 »

前言

实战项目:泰坦尼克号生还者分析

在这个可选项目中,你要依据乘客的一些特征,例如性别和年龄,来创造一个决策函数,预测1912年泰坦尼克号沉没事件中的生还者。从一个简单的算法开始,逐渐提高它的复杂性,直到你能准确预测给定数据中80%的乘客的生还情况。通过这个案例,我们将向你介绍机器学习纳米学位中会遇到的一些基本概念。

阅读全文 »