DataFrame
每一列都为Series
结构,多个Series
组成DataFrame结构
1、属性
以该DataFrame为基准
import pandas as pd
# 创建DataFrame结构
df = pd.DataFrame(
data=[
['zs', 19, 1],
['ls', 20, 1],
['ww', 19, 2]
],
index=['stu0', 'stu1', 'stu2'],
columns=['name', 'age', 'group']
)
print('df:\n', df)
print('df:\n', type(df))
结果:
df:
name age group
stu0 zs 19 1
stu1 ls 20 1
stu2 ww 19 2
df:
<class 'pandas.core.frame.DataFrame'>
ndim
维度 — DataFrame
结构为二维
shape
— 形状
size
— 数据个数
dtypes
---- 返回每一列的数据类型 ---- 不同的列数类型可以不同
index
---- 返回DataFrame
行索引
columns
---- 返回DataFrame
列索引
values
----- 返回数据 , 类型为numpy.ndarray
(数组)
print('ndim:', df.ndim)
print('ndim:', df.ndim)
print('shape:', df.shape)
print('size:', df.size)
# print('dtype:', df.dtype) # 'DataFrame' object has no attribute 'dtype' 没有该属性
print('dtypes:\n', df.dtypes)
print('index:', df.index)
print('columns:', df.columns)
print('values:\n', df.values)
print('values:\n', type(df.values))
结果:
ndim: 2
shape: (3, 3)
size: 9
dtypes:
name object
age int64
group int64
dtype: object
index: Index(['stu0', 'stu1', 'stu2'], dtype='object')
columns: Index(['name', 'age', 'group'], dtype='object')
values:
[['zs' 19 1]
['ls' 20 1]
['ww' 19 2]]
values:
<class 'numpy.ndarray'>
------------------------------------------------------------------------------------------------
Series
1、结构
一维的数据 ----- 行维度的数据
2、属性
以该数组为基准
se = df['name']
print('se:\n', se)
print('se:\n', type(se))
结果:
se:
stu0 zs
stu1 ls
stu2 ww
Name: name, dtype: object
se:
<class 'pandas.core.series.Series'>
ndim
维度 — Series
结构为一维
shape
— 形状
size
— 数据个数
dtypes
和dtype
---- 返回数据类型
index
---- 返回Series
行索引
columns
---- 返回Series
列索引
values
----- 返回数据 , 类型为numpy.ndarray
(数组)
print('ndim:', se.ndim)
print('shape:', se.shape)
print('size:', se.size)
# print('itemsize:', se.itemsize) # 当前版本可能还有,但是未来要被删除!
print('dtype:', se.dtype) #
print('dtypes:', se.dtypes) # Series只有一列且内部的数据类型都是一样的,所以具有dtype
print('index:', se.index)
print('values:', se.values)
print('values:', type(se.values))
结果:
ndim: 1
shape: (3,)
size: 3
dtype: object
dtypes: object
index: Index(['stu0', 'stu1', 'stu2'], dtype='object')
values: ['zs' 'ls' 'ww']
values: <class 'numpy.ndarray'>