0
点赞
收藏
分享

微信扫一扫

Pandas 数据重复处理 duplicated()和drop_duplicates()


🌠 『精品学习专栏导航帖』

  • 🐳​​最适合入门的100个深度学习实战项目​​🐳
  • 🐙​​【PyTorch深度学习项目实战100例目录】项目详解 + 数据集 + 完整源码​​🐙
  • 🐶​​【机器学习入门项目10例目录】项目详解 + 数据集 + 完整源码​​🐶
  • 🦜​​【机器学习项目实战10例目录】项目详解 + 数据集 + 完整源码​​🦜
  • 🐌​​Java经典编程100例​​🐌
  • 🦋​​Python经典编程100例​​🦋
  • 🦄​​蓝桥杯历届真题题目+解析+代码+答案​​🦄
  • 🐯​​【2023王道数据结构目录】课后算法设计题C、C++代码实现完整版大全​​🐯

文章目录

  • ​​✌ duplicated()和drop_duplicates()​​
  • ​​✌ 导库​​
  • ​​✌ 创建数据集​​
  • ​​✌ duplicated()​​
  • ​​✌ 计算重复数据数目​​
  • ​​✌ drop_duplicates()​​

✌ duplicated()和drop_duplicates()

✌ 导库

import pandas as pd
import numpy as np

✌ 创建数据集

x=np.array([[1,2,3],[3,4,5],[1,2,3],[1,2,3]])
x=pd.DataFrame(x)
x

Pandas 数据重复处理 duplicated()和drop_duplicates()_数据分析

✌ duplicated()

返回每行数据是否重复

x.duplicated()

Pandas 数据重复处理 duplicated()和drop_duplicates()_java_02

✌ 计算重复数据数目

x.duplicated().sum()

Pandas 数据重复处理 duplicated()和drop_duplicates()_数据分析_03

✌ drop_duplicates()

删除重复值

x=x.drop_duplicates()
x

Pandas 数据重复处理 duplicated()和drop_duplicates()_python_04


举报

相关推荐

0 条评论