Numpy&Pandas基本操作(二)
Pandas
Pandas 简介
Pandas
是一个基于Numpy
的科学计算包,他将Numpy
封装成一个更加易于用户使用的方式.
如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas 是基于
Numpy 构建的,让 Numpy 为中心的应用变得更加简单。 – <莫凡 Python-Pandas 简介>
两种基本数据结构Series
和DataFrame
Series
1 | pd.Series([1,2,3,4]) |
可以看得出来,Series
数据结构其实是将Numpy
的ndarray
封装了一下,让使用者更加直接的去使用.
DataFrame
DataFrame
是一个表格型的数据结构,它包含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值等)。DataFrame
既有行索引也有列索引, 它可以被看做由Series
组成的大字典。
我们可以根据每一个不同的索引来挑选数据:
1 |
|
我们可以将DataFrame
简单的看做上一篇中提到过的Numpy.ndarray
. 其具体操作:
DataFrame 的基本操作
去某列数据(通过索引)
1 | df['d'] |
我们可以看出,其实DataFrame
中的单一列就是一个Series
Numpy&Pandas基本操作(二)