0
点赞
收藏
分享

微信扫一扫

pandas 学习之常用的数据统计函数

洛茄 2022-02-04 阅读 32

数据准备

import pandas as pd
# 数据读取
df=pd.read_csv('data/pandas/beijing_tianqi/beijing_tianqi_2018.csv')
df.head()
# 数据处理
df["bWendu"]=df["bWendu"].str.replace("℃","").astype('int32')
df["yWendu"]=df["yWendu"].str.replace("℃","").astype('int32')
df.head()

常用汇总函数

# 提取所有数字列的统计结果
df.describe()
# 查看单个列
df['bWendu'].mean() #平均
df['bWendu'].max() #最大
df['bWendu'].min() #最小

重复项判断,按值计数

# 唯一去重
df['fengxiang'].unique()
# 按值统计
df['fengxiang'].value_counts()
# 判断是否有重复项
df['bWendu'].duplicated().any()
df['ymd'].duplicated().any()
# 去重
df['bWendu'].drop_duplicates()
# 显示重复项
df[df['bWendu'].duplicated() == True]

相关系数和协方差

# 协方差
df.cov()
# 相关系数
df.corr()
举报

相关推荐

0 条评论