0
点赞
收藏
分享

微信扫一扫

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd7 in position 0: invalid continuation byte


UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd7 in position 0: invalid continuation byte

代码

# 1、读取数据并存为一个名叫 job_info 的数据框。
job_info = pd.read_csv(r'G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\job_info.csv')
print(job_info.head())

报错:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 0: invalid continuation byte

分析:

  • 报错信息翻译为:
    ​​UnicodeDecodeError:“utf-8”编解码器无法解码位置0中的字节0xd7:连续字节无效
  • 原因:在读取csv文件的时候,源文件的字符编码集可能是二进制形式,而当前编译工具在读取数据时无法进行转换的二进制数据 ,编码字符集形式不匹配造成。

解决方案:

# 1、读取数据并存为一个名叫 job_info 的数据框。
job_info = pd.read_csv(r'G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\job_info.csv',encoding='gbk')
print(job_info.head())

在读取csv文件的时候,指定字符编码集,设定encoding参数即可

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd7 in position 0: invalid continuation byte_读取数据


举报

相关推荐

0 条评论