0
点赞
收藏
分享

微信扫一扫

hdfs集群txt文件乱码问题,Hadoop文件输出查看中文乱码解决方法

大沈投资笔记 2022-04-24 阅读 46
  1. 首先,如果你是在window系统下创建的包含有中文的txt文件:
    在这里插入图片描述
  2. 而把它直接拖到Linux环境的目录下:
    在这里插入图片描述
  3. 而且使用文本编辑器打开后发现并没有乱码:
    在这里插入图片描述
  4. 但是用vim编辑器打开后发现中文乱码:
    在这里插入图片描述
  5. 然后再把它上传到hdfs集群后:不管你是在集群查看,还是在终端输入命令查看,还是把它下载下来查看都是中文乱码的
    在这里插入图片描述
  6. 细心的同学发现第一张图片的编码格式为ANSI
    在这里插入图片描述

解决方法:

此时只需将文件点击另存为,将编码格式改为UTF-8,再重复步骤即可,或者直接在Linux系统内创建文件,上传到集群也是正常的。

在这里插入图片描述
在这里插入图片描述

所以说,究其原因还是文件编码格式出现了问题,只不过不是jar包,也不是eclipse的编码格式,也不是Linux环境的编码格式导致的,出现乱码时检查了大量原因也没能发现这个问题

HDFS常用命令

举报

相关推荐

0 条评论