pandas简介
pandas是一个强大的 Python数据分析的工具包,是基于NmPy构建的。
pandas的主要功能
具备对其功能的数据结构 Dataframe, Series
集成时间序列功能
提供丰富的数学运算和操作
灵活处理缺失数据
安装方法:pip install pandas
引用方法:import pandas as pd
Series-一维数据对象
Series是一种类似于一维数组的对象,由一组数据和一组与之相关的数据标签(索引)组成。
创建方式:
In [7]: pd.Series([4,7,-4,2])
Out[7]:
0 4
1 7
2 -4
3 2
dtype: int64
In [8]: pd.Series([3,2,1,-5],index=['a','b','c','d'])
Out[8]:
a 3
b 2
c 1
d -5
dtype: int64
In [9]: pd.Series({'a':1,'b':2})
Out[9]:
a 1
b 2
dtype: int64
In [10]: pd.Series(0,index=['a','b','c','d'])
Out[10]:
a 0
b 0
c 0
d 0
dtype: int64
获取值数组和索引数组:values属性和 index属性
Series比较像列表(数组)和字典的结合体
Series-使用特性
Series 支持arry的特性(下标):
从 ndarray 创建 Series: Series(arr)
与标量运算:sr*2
两个 benes运算:sr1 + sr2
索引:sr[0],sr[[1,2,4]]
切片:sr[0:2]
通用函数:np.abs(sr)
布尔值过滤:sr[sr>0]
Series支持字典的特性(标签)
从字典创建 Series: Series(dic),
in运算:'a' in sr
键索引:sr['a'],sr[['a','b','d']]
In [1]: import pandas as pd
In [2]: import numpy as np
In [3]: pd.Series(np.arange(5))
Out[3]:
0 0
1 1
2 2
3 3
4 4
dtype: int32
In [4]: pd.Series([2,3,4,5],index=['a','b','c','d'])
Out[4]:
a 2
b 3
c 4
d 5
dtype: int64
In [5]: sr = pd.Series([2,3,4,5],index=['a','b','c','d'])
In [6]: sr[0]
Out[6]: 2
In [7]: sr + 2
Out[7]:
a 4
b 5
c 6
d 7
dtype: int64
In [8]: sr + sr
Out[8]:
a 4
b 6
c 8
d 10
dtype: int64
In [9]: sr[0:2]
Out[9]:
a 2
b 3
dtype: int64
In [10]: sr
Out[10]:
a 2
b 3
c 4
d 5
dtype: int64
In [11]: sr[sr>4]
Out[11]:
d 5
dtype: int64
In [12]: sr = pd.Series({'a':1,'b':2})
In [13]: sr
Out[13]:
a 1
b 2
dtype: int64
In [12]: sr = pd.Series({'a':1,'b':2})
In [13]: sr
Out[13]:
a 1
b 2
dtype: int64
In [14]: sr['a']
Out[14]: 1
In [15]: 'a' in sr
Out[15]: True
In [16]: 'c' in sr
Out[16]: False
In [17]: for i in sr:
...: print(i)
...:
1
2
In [18]: sr.index
Out[18]: Index(['a', 'b'], dtype='object')
In [19]: sr.index[0]
Out[19]: 'a'
In [20]: sr.values
Out[20]: array([1, 2], dtype=int64)
In [21]: sr = pd.Series([1,2,3,4],index=['a','b','c','d'])
In [22]: sr
Out[22]:
a 1
b 2
c 3
d 4
dtype: int64
In [24]: sr[['a','c']]
Out[24]:
a 1
c 3
dtype: int64
In [25]: sr['a':'c']
Out[25]:
a 1
b 2
c 3
dtype: int64