pandas对csv文件的相关操作

倪雅各

关注

阅读 169

2022-11-25


pandas csv文件相关函数和相关操作

0 注意:inplace = True表示当前操作已经在应用到当前环境中了,比如删除一行,然后inplace = True之后,下次再使用就没有删除的这一行了
1 np.set_printoptions(threshold=np.inf) numpy时使用最大数显示
2 data = pd.read_csv(r"data.csv",nrows=5) 加载固定行数数据
3 data.head(2) 显示固定行数
4 data[“index”].values[0:10] #标签为index的列数据
5 data.columns.values 显示所有标签
6 data.drop(data.index[1],inplace=True) 删除第一行
7 data1.drop_duplicates(‘name’, inplace=True) 删除"name"中的重复数据
8 data.rename(columns={‘index-given’:‘u7777777’,‘wgsize’:‘wwww’}, inplace = True) 替换列表列标签
9 data.insert(5,‘typeSmallSmall’,insert1) #在第五个空子(0,1,2,3,4,5)插入列名字为typeSmallSmall的数据insert1

import pandas as pd
import numpy as np
np.set_printoptions(threshold=np.inf) #最大数显示

# data = pd.read_csv(r"data.csv",nrows=5) #加载固定行数
data = pd.read_csv(r"data.csv")
# data

data.head(2) #显示前五行


index

index-given

benchmark

dataset

comp

rational

mem

localmem

coalesced

atomic

...

wgsize

transfer1

wgsize1

transfer.1

wgsize.1

oracle

runtime_cpu

runtime_gpu

src

seq

0

0

0

amd-app-sdk-3.0-BinomialOption-binomial_options

default

98

8

13

11

2

0

...

255

0.000

0.249

2048

255

GPU

3.291073

0.152038

__kernel void A(int a, const __global float4* ...

[129 129 129 ..., 0 127 0]

1

1

1

amd-app-sdk-3.0-BitonicSort-bitonicSort

default

12

2

6

0

6

0

...

256

0.288

0.250

131072

256

GPU

0.121940

0.057834

__kernel void A(__global uint* a, const uint b...

[129 129 129 ..., 0 127 0]

2 rows × 21 columns

print(data["index"].values[0:10]) #标签为index的列数据

[0 1 2 3 4 5 6 7 8 9]

print(data.columns.values) #第一行,所有标签

['index' 'index-given' 'benchmark' 'dataset' 'comp' 'rational' 'mem'
'localmem' 'coalesced' 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1'
'transfer.1' 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']

print(data["index-given"].index[1])
data.drop(data.index[1],inplace=True) #直接删除csv的数据中的第某一行行
print(data["index-given"].index[1])

1
2

data1 = pd.read_csv(r"data1.csv")
print(len(data1["name"]))
data1.drop_duplicates('name', inplace=True) #删除"name"中的重复数据
print(len(data1["name"]))
data1.to_csv(r"data2.csv")

25
20

print(data.columns.values)
data.drop(['benchmark'],axis=1,inplace=True) #删除列 index
print(data.columns.values)

['index-given' 'benchmark' 'dataset' 'comp' 'rational' 'mem' 'localmem'
'coalesced' 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1'
'transfer.1' 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
['index-given' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1' 'transfer.1'
'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']

print(data.columns.values)
data.rename(columns={'index-given':'u7777777','wgsize':'wwww'}, inplace = True) #替换列表列标签
print(data.columns.values)

['index-given' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1' 'transfer.1'
'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
['u7777777' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
'atomic' 'transfer' 'wwww' 'transfer1' 'wgsize1' 'transfer.1' 'wgsize.1'
'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']

insert1 = data["u7777777"].values
data.insert(5,'typeSmallSmall',insert1) #在第五个空子(0,1,2,3,4,5)插入列名字为typeSmallSmall的数据insert1
print(data.columns.values)

['u7777777' 'dataset' 'comp' 'rational' 'mem' 'typeSmallSmall' 'localmem'
'coalesced' 'atomic' 'transfer' 'wwww' 'transfer1' 'wgsize1' 'transfer.1'
'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']

精彩评论(0)

0 0 举报