1. 前言
本文转载自优达学城《机器学习工程师》
既然目前为止,你已学会了一些基本的统计学概念,现在让我们探讨一些 Python 库,它们允许您研究数据和处理大型数据集。
具体而言,在本阶段的课程中,我们将探讨 numpy,它允许您处理大量数值数据以及 panda 序列和数据框(它们允许你存储大型数据集和提取其中的信息)。我们将学习 numpy 和 panda.DataFrames,前者能够帮助你处理大量数值数据,而后者可以帮助你存储大型数据集以及从数据集中提取出来的信息。
Numpy 库文档: https://docs.scipy.org/doc/numpy-dev/user/quickstart.html
Pandas 库文档: http://pandas.pydata.org/pandas-docs/version/0.17.0/
2. Numpy
1 | import numpy as np |
3. Pandas
1 | import pandas as pd |
4. Pandas 数据框
1 | import numpy as np |
1 | from pandas import DataFrame, Series |
5. 索引数据框
1 | import pandas as pd |
6. 向量化方法
1 | from pandas import DataFrame, Series |
1 | import numpy |
7. 矩阵乘法和Numpy Dot
1 | import numpy |
8. 书签
Pandas文档
http://pandas.pydata.org/pandas-docs/stable/
Pandas IPython Notebook 教程
https://bitbucket.org/hrojas/learn-pandas
numpy.dot — NumPy v1.12 Manual
https://docs.scipy.org/doc/numpy/reference/generated/numpy.dot.html