pandas对csv文件的相关操作-CFANZ编程社区

pandas csv文件相关函数和相关操作

0 注意:inplace = True表示当前操作已经在应用到当前环境中了,比如删除一行,然后inplace = True之后,下次再使用就没有删除的这一行了
1 np.set_printoptions(threshold=np.inf) numpy时使用最大数显示
2 data = pd.read_csv(r"data.csv",nrows=5) 加载固定行数数据
3 data.head(2) 显示固定行数
4 data[“index”].values[0:10] #标签为index的列数据
5 data.columns.values 显示所有标签
6 data.drop(data.index[1],inplace=True) 删除第一行
7 data1.drop_duplicates(‘name’, inplace=True) 删除"name"中的重复数据
8 data.rename(columns={‘index-given’:‘u7777777’,‘wgsize’:‘wwww’}, inplace = True) 替换列表列标签
9 data.insert(5,‘typeSmallSmall’,insert1) #在第五个空子(0,1,2,3,4,5)插入列名字为typeSmallSmall的数据insert1

import pandas as pd
import numpy as np
np.set_printoptions(threshold=np.inf) #最大数显示

# data = pd.read_csv(r"data.csv",nrows=5) #加载固定行数
data = pd.read_csv(r"data.csv")
# data

data.head(2) #显示前五行

	index	index-given	benchmark	dataset	comp	rational	mem	localmem	coalesced	atomic	...	wgsize	transfer1	wgsize1	transfer.1	wgsize.1	oracle	runtime_cpu	runtime_gpu	src	seq
0	0	0	amd-app-sdk-3.0-BinomialOption-binomial_options	default	98	8	13	11	2	0	...	255	0.000	0.249	2048	255	GPU	3.291073	0.152038	__kernel void A(int a, const __global float4* ...	[129 129 129 ..., 0 127 0]
1	1	1	amd-app-sdk-3.0-BitonicSort-bitonicSort	default	12	2	6	0	6	0	...	256	0.288	0.250	131072	256	GPU	0.121940	0.057834	__kernel void A(__global uint* a, const uint b...	[129 129 129 ..., 0 127 0]

2 rows × 21 columns

print(data["index"].values[0:10]) #标签为index的列数据

[0 1 2 3 4 5 6 7 8 9]

print(data.columns.values) #第一行,所有标签

['index' 'index-given' 'benchmark' 'dataset' 'comp' 'rational' 'mem'
 'localmem' 'coalesced' 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1'
 'transfer.1' 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']

print(data["index-given"].index[1])
data.drop(data.index[1],inplace=True) #直接删除csv的数据中的第某一行行
print(data["index-given"].index[1])

1
2

data1 = pd.read_csv(r"data1.csv")
print(len(data1["name"]))
data1.drop_duplicates('name', inplace=True) #删除"name"中的重复数据
print(len(data1["name"]))
data1.to_csv(r"data2.csv")

25
20

print(data.columns.values)
data.drop(['benchmark'],axis=1,inplace=True) #删除列 index
print(data.columns.values)

['index-given' 'benchmark' 'dataset' 'comp' 'rational' 'mem' 'localmem'
 'coalesced' 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1'
 'transfer.1' 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
['index-given' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1' 'transfer.1'
 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']

print(data.columns.values)
data.rename(columns={'index-given':'u7777777','wgsize':'wwww'}, inplace = True) #替换列表列标签
print(data.columns.values)

['index-given' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1' 'transfer.1'
 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
['u7777777' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
 'atomic' 'transfer' 'wwww' 'transfer1' 'wgsize1' 'transfer.1' 'wgsize.1'
 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']

insert1 = data["u7777777"].values
data.insert(5,'typeSmallSmall',insert1) #在第五个空子(0,1,2,3,4,5)插入列名字为typeSmallSmall的数据insert1
print(data.columns.values)

['u7777777' 'dataset' 'comp' 'rational' 'mem' 'typeSmallSmall' 'localmem'
 'coalesced' 'atomic' 'transfer' 'wwww' 'transfer1' 'wgsize1' 'transfer.1'
 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']