- 首先,如果你是在window系统下创建的包含有中文的txt文件:
- 而把它直接拖到Linux环境的目录下:
- 而且使用文本编辑器打开后发现并没有乱码:
- 但是用vim编辑器打开后发现中文乱码:
- 然后再把它上传到hdfs集群后:不管你是在集群查看,还是在终端输入命令查看,还是把它下载下来查看都是中文乱码的
- 细心的同学发现第一张图片的编码格式为ANSI
解决方法:
此时只需将文件点击另存为,将编码格式改为UTF-8,再重复步骤即可,或者直接在Linux系统内创建文件,上传到集群也是正常的。
所以说,究其原因还是文件编码格式出现了问题,只不过不是jar包,也不是eclipse的编码格式,也不是Linux环境的编码格式导致的,出现乱码时检查了大量原因也没能发现这个问题
附
HDFS常用命令