linuxcat文件亂碼_linux下 cat查看了一個文件導致界面亂碼怎麼辦

1. linux下cat命令使用參數-v中文文件就變成亂碼

這些其實一般是被處理過的UTF-8碼。是什麼碼主要看該文檔用什麼編碼存儲的文本，一般默認為UTF-8碼。

Linux對cat命令的詳細解釋為：

`-v'

`--show-nonprinting'

Display control characters except for LFD and TAB using `^'

notation and precede characters that have the high bit set with `M-'.

意思是：

用『^』輸出控制字元除了LFD和TAB

每個位元組最高位為1的字元就用『M-』替代每個位元組的最高位（隱含的意思是一個位元組的最高位為1的話就把最高位和低7位分離開來，並分別表示，最高位用『M-』表示，低7位根據ASCII碼表用對應的字元表示）

可以看出，這個-v是直接讀取文件的位元組來輸出的，除了LFD、TAB和分隔符之外全部用以上規則輸出。文件頭部分的位元組當然就忽略啦，因為文件頭部分記錄了該文本文件用什麼編碼存儲，不是文本具體內容。

控制字元用『^』的表示方法如下表（若讀取到的位元組屬於控制字元的范圍就認定為控制字元，即位元組00000000~00011111）：

例如（如果是以UTF-8碼的形式存儲）：

漢字「文」，其UTF-8碼為（十六進制）：E6 96 87，二進製表示為：11100110，10010110，10000111；每個位元組最高位都為1，所以每個字元前都帶一個『M-』；剩下的低7位為：01100110，00010110，00000111，對應的ASCII碼字元為：f ^V ^G；依次連接起來後就是：

M-fM-^VM-^G

想驗證可以這樣：倒著來轉換，先找出3個ASCII碼字元，然後進行轉換，轉成3個二進製表示的位元組，然後每個位元組最高位置為1，然後再用UTF-8與Unicode之間的轉換規則轉成Unicode碼，然後用字元映射表進行查找、驗證，看是不是正確的字元。

「UTF-8與Unicode之間的轉換規則」詳見：http://blog.csdn.net/xiongxiao/article/details/3741731

不同的編碼存儲的位元組是不一樣的，例如：『文』字，UTF-8碼為E6 96 87，Unicode碼為65 87，GBK碼為CE C4。

2. Linux系統下文件名出現中文亂碼如何重命名回來

一不小心在給文件重命名的時候輸入了中文字元，結果導致文件名亂碼，無法通過cat, less, rm 或者mv 之類的命令操作了。

如何重新命名它，使得其恢復正常呢？

據說linux下每個文件還有一個文件節點編號，對應於每個特定的文件。可以通過find 該節點編號來執行重命名操作。

ls -i res???_out.txt
144117972422752993 res???_out.txt

前面的數字串就是節點編號
find . -inum 144117972422752993 -exec mv {} res_out.txt \;

3. linux中文文件顯示亂碼怎麼解決

Linux文件名、文件內容亂碼，主要原因是windows上的中文編碼默認是GBK，而Linux默認中文編碼為UTF-8，由於編碼不專一致，所以導致亂碼屬問題。為了解決這個亂碼，需要對文件進行轉碼，具體如下： 1、前提保證已安裝了convmv； 2、具體convmv的用法： Convmv –f 源編碼 –t 新編碼 [選項] 文件名一般常用參數： -r 遞歸處理子目錄 --notest 真正進行操作，默認情況下是不對文件進行真實操作的，只是一個預覽 --list 顯示所有支持的編碼 --unescap 可以做一個轉義 3、比如我們有一個utf8的文件名，要求轉換成gbk編碼，命令如下： Convmv –f utf-8 –t gbk –notest 文件名也可以使用linux下最好用的編碼轉換工具iconv來進行轉碼操作。例子：將GBK編碼的文件轉換成UTF－8 iconv -f GBK -t UTF-8 gbkfile.txt > utf8file.txt

4. 如何解決 linux 的亂碼問題

出現這種情況的原因為兩種操作系統的中文壓縮方式不同，在windows環境中中文壓縮一般為gbk，而在linux環境中為utf8，這就導致了在windows下能正常顯示
txt文件在linux環境下打開呈現了亂碼狀態。
解決方法：在linux用iconv命令，輸入命令如下
iconv
-f
gbk
-t
utf8
file.pdf
>
file.pdf.utf8
此時會重生一file.utf8文件，打開之後就能正常顯示中文
linux系統下修改語言配置方法有：
法一：修改/etc/profile文件，增加export
LANG=zh_CN.GB18030
法二：修改/etc/sysconfig/i18n文件，將
#LANG="en_US.UTF-8"
#SUPPORTED="en_US.UTF-8:en_US:en"
#SYSFONT="latarcyrheb-sun16"
改為
LANG="zh_CN.UTF-8"
SUPPORTED="zh_CN:zh:en_US.UTF-8:en_US:en:zh_CN.GB18030"
SYSFONT="latarcyrheb-sun16"
/etc/profile：
為系統的每個用戶設置環境信息,當用戶第一次登錄時,該文件被執行.
/etc/sysconfig/i18n
這里存放的是系統的區域語言設置
LANG
表明你當前系統的語言環境變數設置
，這里是
zh_CN.GB18030
SUPPORTED
表明系統預置了那些語言支持
，不在項目中的語言不能正常顯示
SYSFONT
定義控制台終端字體，你文本登錄的時候顯示的字體是
latarcyrheb-sun16
I18N
是
internationalization
的縮寫形式，意即在
i
和
n
之間有
18
個字母，本意是指軟體的「國際化」.I18N支持多種語言，不過同一時間只能是英文和一種選定的語言，例如英文+中文、英文+德文、英文+韓文等等；
如果在SCRT上操作時中文亂碼，可依次點擊options--session
options--appearance，選擇character
encoding為UTF-8

5. linux系統中命令行敲進去cat /usr/share/terminfo/l/linux 後出現亂碼無法恢復

他是一個二進制文件，用cat 看肯定是亂碼，用ctrl+c 結束就行了。

6. linux下 cat查看了一個文件，導致界面亂碼，怎麼辦

2進制數據干擾了終端對字元的解析。。。

用命令reset重置一下。

下次記得用od命令去看2進制文件。

7. linux下的文件名怎麼是亂碼的

如果你需要在Linux中操作windows下的文件，那麼你可能會經常遇到文件編碼轉換的問題。Windows中默認的文件格式是GBK（gb2312），而Linux一般都是UTF-8。
查看編碼的方法
方法一：file
filename
方法二：在Vim中可以直接查看文件編碼
:set
fileencoding
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題，那麼你可以在
~/.vimrc
文件中添加慧宴以下內容：
set
encoding=utf-8
fileencodings=ucs-bom,utf-8,cp936
這樣，就可以讓vim自動識別文件編碼（可以自動識別UTF-8或者GBK編碼的文件），其實就是依照fileencodings提供的編碼列表嘗試，如果沒有找到合適的編碼，就用latin-1（ASCII）編碼打開
文件編碼轉換
多平台方法：
iconv
提供標準的程序和API來進行編碼轉換；
convert_encoding.py
基於Python的文本文件轉換工具；
decodeh.py
提供演算法和模塊來談測字元的編碼；
linux下文件編碼轉換：
方法一：
在Vim中直接進行轉換文件編碼，比如將一個文件轉換成utf-8格式
:set
fileencoding=utf-8
或前答銀者
11）設置文件集合，即要對哪些文件進行操作，可以使用通配符，比如我通常是對
C/C++
源程序進行編碼轉換
:args
*.h
*.cpp
2）給出要在每個文件上執行的命令，這里是轉換編碼：
:argdo
set
fenc=utf-8
|
update
方法二：
iconv
轉換
5.案例：
假如說我們將windows下的一個UTF-8的文件傳到linux環境下，linux環境下的系統編碼是GB18030，我們cat的時候就會出現亂碼，這個時候就應該想到轉碼了，下面我們來進行試驗：
我們將windows下一個名為UTF-8.sh的文件傳到linux系統中舉知，其中UTF-8.sh的內容如下：
我是中文編碼UTF-8模式~
而linux系統的系統語言設置為：
[root@sor-sys
zy]#
cat
/etc/sysconfig/i18n
LANG=zh_CN.GB18030
SYSFONT="latarcyrheb-sun16"
這個時候查看一下文件的內容及編碼：
[root@sor-sys
zy]#
file
UTF-8.sh
UTF-8.sh:
UTF-8
Unicode
text,
with
no
line
terminators
[root@sor-sys
zy]#
cat
UTF-8.sh
鍩挎垜鏄?腑鏂囩紪鐮乁TF-8妯″紡~[root@sor-sys
zy]#
[root@sor-sys
zy]#
這個時候我們就需要轉換編碼了，記得使用iconv
[root@sor-sys
zy]#
iconv
-f
UTF-8
-t
GB18030
UTF-8.sh
-o
GB18030.sh
[root@sor-sys
zy]#
cat
GB18030.sh
??我是中文編碼UTF-8模式~[root@sor-sys
zy]#
[root@sor-sys
zy]#
file
GB18030.sh
GB18030.sh:
Non-ISO
extended-ASCII
text,
with
no
line
terminators
[root@sor-sys
zy]#
convmv就是更改文件名編碼方式的一個工具。
比如
sudo
convmv
-f
gbk
-t
utf-8
-r
–notest
/home
就是將/home目錄下原來文件名是gbk編碼方式的全部改為utf-8格式的。這里
-f
後面為原來的編碼方式，-t
後面是要更改為的編碼方式，
-r
表示這個目錄下面的所有文件，
–notest
表示馬上執行，而不是僅僅測試而已。另外這命令好像要root才能執行，因此要加上
sudo。

8. linux文件中文亂碼怎麼解決方法

在linux上一般使用utf8編碼。如果打開文件是亂碼，要設置utf8編碼，看看自己用的是什麼編輯器。如果是vim則使用 set encoding=utf8即可如果是gedit，則重新另存一下，在存儲窗口設置為utf8編碼，在打開即可。

9. linux解決中文亂碼問題

有時候linux伺服器突然間查看日誌都是中文亂碼，原因很奇怪，有可能是：

不管什麼原因吧，根本原因還是修改了linux系統本身的編碼，改回來就完了。

修改全部配置文件

末尾增加兩行

讓其生效

如果你的web 伺服器輸出的日誌都是亂碼，那麼最後一步：

導航:首頁 > 文件類型 > linuxcat文件亂碼

linuxcat文件亂碼

與linuxcat文件亂碼相關的資料

友情鏈接