導航:首頁 > 文件類型 > linux修改文件編碼中文

linux修改文件編碼中文

發布時間:2024-09-30 09:53:50

linux鎬庝箞璁劇疆緙栫爜鏍煎紡linux緙栫爜鏍煎紡璁劇疆

linux鎬庝箞鐪嬫枃鏈鐨勭紪鐮佹牸寮忥紵

linux涓嬬粡甯擱亣鍒扮殑緙栫爜闂棰樺傛灉浣犻渶瑕佸湪linux涓鎿嶄綔windows涓嬬殑鏂囦歡錛岄偅涔堜綘鍙鑳戒細緇忓父閬囧埌鏂囦歡緙栫爜杞鎹㈢殑闂棰樸倃indows涓榛樿ょ殑鏂囦歡鏍煎紡鏄痝bk錛坓b2312錛夛紝鑰宭inux涓鑸閮芥槸utf-8銆

鏌ョ湅緙栫爜鐨勬柟娉

鏂規硶涓錛歠ilefilename

鏂規硶浜岋細鍦╲im涓鍙浠ョ洿鎺ユ煡鐪嬫枃浠剁紪鐮

:setfileencoding

濡傛灉浣犲彧鏄鎯蟲煡鐪嬪叾瀹冪紪鐮佹牸寮忕殑鏂囦歡鎴栬呮兂瑙e喅鐢╲im鏌ョ湅鏂囦歡涔辯爜鐨勯棶棰橈紝閭d箞浣犲彲浠ュ湪

~/.vimrc鏂囦歡涓娣誨姞浠ヤ笅鍐呭癸細

setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936

榪欐牱錛屽氨鍙浠ヨ﹙im鑷鍔ㄨ瘑鍒鏂囦歡緙栫爜錛堝彲浠ヨ嚜鍔ㄨ瘑鍒玼tf-8鎴栬単bk緙栫爜鐨勬枃浠訛級錛屽叾瀹炲氨鏄渚濈収fileencodings鎻愪緵鐨勭紪鐮佸垪琛ㄥ皾璇曪紝濡傛灉娌℃湁鎵懼埌鍚堥傜殑緙栫爜錛屽氨鐢╨atin-1錛坅scii錛夌紪鐮佹墦寮

鏂囦歡緙栫爜杞鎹

澶氬鉤鍙版柟娉曪細

iconv鎻愪緵鏍囧噯鐨勭▼搴忓拰api鏉ヨ繘琛岀紪鐮佽漿鎹錛

convert_encoding.py鍩轟簬python鐨勬枃鏈鏂囦歡杞鎹㈠伐鍏鳳紱

decodeh.py鎻愪緵綆楁硶鍜屾ā鍧楁潵璋堟祴瀛楃︾殑緙栫爜錛

linux涓嬫枃浠剁紪鐮佽漿鎹錛

鏂規硶涓錛

鍦╲im涓鐩存帴榪涜岃漿鎹㈡枃浠剁紪鐮侊紝姣斿傚皢涓涓鏂囦歡杞鎹㈡垚utf-8鏍煎紡

:setfileencoding=utf-8

鎴栬

11錛夎劇疆鏂囦歡闆嗗悎錛屽嵆瑕佸瑰摢浜涙枃浠惰繘琛屾搷浣滐紝鍙浠ヤ嬌鐢ㄩ氶厤絎︼紝姣斿傛垜閫氬父鏄瀵筩/c++婧愮▼搴忚繘琛岀紪鐮佽漿鎹

:args*.h*.cpp

2錛夌粰鍑鴻佸湪姣忎釜鏂囦歡涓婃墽琛岀殑鍛戒護錛岃繖閲屾槸杞鎹㈢紪鐮侊細

:argdosetfenc=utf-8|update

鏂規硶浜岋細

iconv杞鎹

5.妗堜緥錛

鍋囧傝存垜浠灝唚indows涓嬬殑涓涓猽tf-8鐨勬枃浠朵紶鍒發inux鐜澧冧笅錛宭inux鐜澧冧笅鐨勭郴緇熺紪鐮佹槸gb18030錛屾垜浠琧at鐨勬椂鍊欏氨浼氬嚭鐜頒貢鐮侊紝榪欎釜鏃跺欏氨搴旇ユ兂鍒拌漿鐮佷簡錛屼笅闈㈡垜浠鏉ヨ繘琛岃瘯楠岋細

鎴戜滑灝唚indows涓嬩竴涓鍚嶄負utf-8.sh鐨勬枃浠朵紶鍒發inux緋葷粺涓錛屽叾涓璾tf-8.sh鐨勫唴瀹瑰備笅錛

鎴戞槸涓鏂囩紪鐮乽tf-8妯″紡~

鑰宭inux緋葷粺鐨勭郴緇熻璦璁劇疆涓猴細

#cat/etc/sysconfig/i18n

lang=zh_cn.gb18030

sysfont="latarcyrheb-sun16"

榪欎釜鏃跺欐煡鐪嬩竴涓嬫枃浠剁殑鍐呭瑰強緙栫爜錛

#fileutf-8.sh

utf-8.sh:utf-8unicodetext,withnolineterminators

#catutf-8.sh

閿樻寧__?鑵慱__闀癬tf-8濡鈥崇漢~#

#

榪欎釜鏃跺欐垜浠灝遍渶瑕佽漿鎹㈢紪鐮佷簡錛岃板緱浣跨敤iconv

#iconv-futf-8-tgb18030utf-8.sh-ogb18030.sh

#catgb18030.sh

??鎴戞槸涓鏂囩紪鐮乽tf-8妯″紡~#

#filegb18030.sh

gb18030.sh:non-isoextended-asciitext,withnolineterminators

#

convmv灝辨槸鏇存敼鏂囦歡鍚嶇紪鐮佹柟寮忕殑涓涓宸ュ叿銆

姣斿

sudoconvmv-fgbk-tutf-8-r_notest/home

灝辨槸灝/home鐩褰曚笅鍘熸潵鏂囦歡鍚嶆槸gbk緙栫爜鏂瑰紡鐨勫叏閮ㄦ敼涓簎tf-8鏍煎紡鐨勩傝繖閲-f鍚庨潰涓哄師鏉ョ殑緙栫爜鏂瑰紡錛-t鍚庨潰鏄瑕佹洿鏀逛負鐨勭紪鐮佹柟寮忥紝-r琛ㄧず榪欎釜鐩褰曚笅闈㈢殑鎵鏈夋枃浠訛紝_notest琛ㄧず椹涓婃墽琛岋紝鑰屼笉鏄浠呬粎嫻嬭瘯鑰屽凡銆傚彟澶栬繖鍛戒護濂藉儚瑕乺oot鎵嶈兘鎵ц岋紝鍥犳よ佸姞涓妔udo銆

linux涓嬫庝箞鏀瑰彉鏂囦歡鐨勭紪鐮佹牸寮忥紵

1銆佺敤VIM鏌ョ湅鏂囦歡緙栫爜

鍦╒im涓鍙浠ョ洿鎺ユ煡鐪嬫枃浠剁紪鐮

:setfileencoding

鍗沖彲鏄劇ず鏂囦歡緙栫爜鏍煎紡銆

2銆佹敼鍐檦/.vimrc鏂囦歡

濡傛灉浣犲彧鏄鎯蟲煡鐪嬪叾瀹冪紪鐮佹牸寮忕殑鏂囦歡鎴栬呮兂瑙e喅鐢╒im鏌ョ湅鏂囦歡涔辯爜鐨勯棶棰橈紝閭d箞浣犲彲浠ュ湪

~/.vimrc鏂囦歡涓娣誨姞浠ヤ笅鍐呭癸細

setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936

榪欐牱錛屽氨鍙浠ヨ﹙im鑷鍔ㄨ瘑鍒鏂囦歡緙栫爜錛堝彲浠ヨ嚜鍔ㄨ瘑鍒玌TF-8鎴栬匞BK緙栫爜鐨勬枃浠訛級錛屽叾瀹炲氨鏄渚濈収fileencodings鎻愪緵鐨勭紪鐮佸垪琛ㄥ皾璇曪紝濡傛灉娌℃湁鎵懼埌鍚堥傜殑緙栫爜錛屽氨鐢╨atin-1(ASCII)緙栫爜鎵撳紑銆

3銆佺敤ICONV鏂囦歡緙栫爜杞鎹

鎴戜滑鍒╃敤iconv宸ュ叿瀵規枃浠剁殑緙栫爜榪涜岃漿鎹銆

iconv杞鎹錛宨conv鐨勫懡浠ゆ牸寮忓備笅錛

iconv-fencoding-tencodinginputfile

姣斿傚皢涓涓狦BK緙栫爜鐨勬枃浠惰漿鎹㈡垚UTF-8緙栫爜

iconv-fGBK-tUTF-8file1-ofile2

鍏朵腑鐨勫弬鏁扮殑鎰忎箟琛ㄧず

-fFrom鏌愪釜緙栫爜

-tTo鏌愪釜緙栫爜

-o杈撳嚭鍒版枃浠

4銆侀氳繃璁頒簨鏈鍙﹀瓨涓烘潵鏀瑰彉鏂囦歡緙栫爜錛

鏃㈢敤Windows涓嬬殑璁頒簨鏈鎵撳紑錛岄夋嫨鍙﹀瓨涓猴紝鏀瑰彉緙栫爜鍗沖彲銆

linux涓嬫庝箞鏌ョ湅鏂囦歡鐨勭紪鐮佹柟寮忥紵

涓錛屾煡鐪嬫枃浠剁紪鐮侊細鍦↙inux涓鏌ョ湅鏂囦歡緙栫爜鍙浠ラ氳繃浠ヤ笅鍑犵嶆柟寮忥細

1.鍦╒im涓鍙浠ョ洿鎺ユ煡鐪嬫枃浠剁紪鐮:setfileencoding鍗沖彲鏄劇ず鏂囦歡緙栫爜鏍煎紡銆傚傛灉浣犲彧鏄鎯蟲煡鐪嬪叾瀹冪紪鐮佹牸寮忕殑鏂囦歡鎴栬呮兂瑙e喅鐢╒im鏌ョ湅鏂囦歡涔辯爜鐨勯棶棰橈紝閭d箞浣犲彲浠ュ湪~/.vimrc鏂囦歡涓娣誨姞浠ヤ笅鍐呭癸細setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936榪欐牱錛屽氨鍙浠ヨ﹙im鑷鍔ㄨ瘑鍒鏂囦歡緙栫爜錛堝彲浠ヨ嚜鍔ㄨ瘑鍒玌TF-8鎴栬匞BK緙栫爜鐨勬枃浠訛級錛屽叾瀹炲氨鏄渚濈収fileencodings鎻愪緵鐨勭紪鐮佸垪琛ㄥ皾璇曪紝濡傛灉娌℃湁鎵懼埌鍚堥傜殑緙栫爜錛屽氨鐢╨atin-1(ASCII)緙栫爜鎵撳紑銆

2.enca(濡傛灉浣犵殑緋葷粺涓娌℃湁瀹夎呰繖涓鍛戒護錛屽彲浠ョ敤sudoyuminstall-yenca瀹夎)鏌ョ湅鏂囦歡緙栫爜$encafilenamefilename:;UTF-8CRLFlineterminators闇瑕佽存槑涓鐐圭殑鏄錛宔nca瀵規煇浜汫BK緙栫爜鐨勬枃浠惰瘑鍒鐨勪笉鏄寰堝ソ錛岃瘑鍒鏃朵細鍑虹幇錛歎nrecognizedencoding

linux緋葷粺鏂囦歡鏍煎紡鍚庣紑璇﹁В錛

bz2------bzip2鐨勫帇緙╂枃浠

.gz------gzip鐨勫帇緙╂枃浠

.tar------tar鎵撳寘鏂囦歡錛堟槸鍖呮枃浠朵笉鏄鍘嬬緝鏂囦歡錛

.tbz------tar鎵撳寘騫剁敤bzip鍘嬬緝鏂囦歡

.tgz-----tar鎵撳寘騫剁敤gzip鍘嬬緝鐨勬枃浠

.au-----audio鏂囦歡

.gif-----gif鍥捐薄鏂囦歡

.html/.htm-----HTML鏂囦歡

.jpg-----JPEG鍥捐薄鏂囦歡

.pdf------鐢靛瓙鏂囨。錛圥DF鏍煎紡鐨勶級

.png-----PNG鍥捐薄鏂囦歡

.ps------postscinpt鏂囦歡錛堟墦鍗版牸寮忔枃浠訛級

.txt------綰鏂囨湰鏂囦歡

.wav-----audio鏂囦歡

.xpm-----鍥捐薄鏂囦歡

.conf-------閰嶇疆鏂囦歡

.lock-------LOCK鏂囦歡錛堢敤鏉ュ垽鏂涓涓鏂囦歡鎴栬懼囨槸鍚﹁浣跨敤錛

.rpm------REDHATPackage.Manager鏂囦歡錛堝椾歡鍖呮垨杞浠跺寘錛

.c-------C婧愮▼搴忎唬鐮佹枃浠

.cpp------C++婧愮▼搴忎唬鐮佹枃浠

.h-------C鎴朇++紼嬪簭鐨勫ご鏂囦歡

.o------紼嬪簭鐩鏍囨枃浠

.pl------perl鑴氭湰鏂囦歡

.so-----綾誨簱鏂囦歡

.sh-----shell鑴氭湰涓巜indows涓嬬殑bat鏂囦歡鐩鎬技

.bin-----binary浜岃繘鍒跺彲鎵ц屾枃浠

⑵ linux怎麼修改默認編碼

一、locale的五臟六腑

1、 語言符號及其分類(LC_CTYPE)
2、 數字(LC_NUMERIC)
3、 比較和排序習慣(LC_COLLATE)
4、 時間顯示格式(LC_TIME)
5、 貨幣單位(LC_MONETARY)
6、 信息主要是提示信息,錯誤信息, 狀態信息, 標題, 標簽, 按鈕和菜單等(LC_MESSAGES)
7、 姓名書寫方式(LC_NAME)
8、 地址書寫方式(LC_ADDRESS)
9、 電話號碼書寫方式(LC_TELEPHONE)
10、度量衡表達方式(LC_MEASUREMENT)
11、默認紙張尺寸大小(LC_PAPER)
12、對locale自身包含信息的概述(LC_IDENTIFICATION)。

二、理解locale的設置

設定locale就是設定12大類的locale分類屬性,即 12個LC_*。除了這12個變數可以設定以外,為了簡便起見,還有兩個變數:LC_ALL和LANG。

它們之間有一個優先順序的關系:LC_ALL > LC_* > LANG

可以這么說,LC_ALL是最上級設定或者強制設定,而LANG是默認設定值。

三 具體設定locale的方法(zh_CN.UTF-8、zh_CN.GBK)

freebsd的設置:

1.GDM登錄改為終端登錄後startx啟動圖形桌面

2.在~/.cshrc中增加如下語句,(根據自己使用的shell進行相應設置)

setenv LANG zh_CN.GBK
setenv LC_ALL zh_CN.GBK
setenv LC_CTYPE zh_CN.GBK

3.修改/etc/fstab的默認值:

linux 設置:

1.修改/etc/sysconfig/i18n文件,LANG="zh_CN.UTF-8"或LANG="zh_CN.GBK"

普通用戶修改~/.profile

...
export LANG zh_CN.GBK
...

2.修改/etc/fstab的默認值

⑶ linux下怎麼改變文件的編碼格式

1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8

2. enconv 轉換文件編碼,比如要將一個GBK編碼的文件轉換成UTF-8編碼,操作如下
enconv -L zh_CN -x UTF-8 filename

3. iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
查看文件編碼file命令
file ip.txt ip.txt: UTF-8 Unicode text, with escape sequences
一、利用iconv命令進行編碼轉換文件內容編碼轉換 iconv命令用於轉換指定文件的編碼,默認輸出到標准輸出設備,亦可指定輸出文件。 用法: iconv [選項...] [文件...] 有如下選項可用: 輸入/輸出格式規范: -f, --from-code=名稱 原始文本編碼 -t, --to-code=名稱 輸出編碼 信息: -l, --list 列舉所有已知的字元集 輸出控制: -c 從輸出中忽略無效的字元 -o, --output=FILE 輸出文件 -s, --silent 關閉警告 --verbose 列印進度信息 -?, --help 給出該系統求助列表 --usage 給出簡要的用法信息 -V, --version 列印程序版本號 例子: iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt 這個命令讀取aaa.txt文件,從utf-8編碼轉換為gb2312編碼,其輸出定向到bbb.txt文件。

⑷ linux中文文件顯示亂碼怎麼解決

Linux文件名、文件內容亂碼,主要原因是windows上的中文編碼默認是GBK,而Linux默認中文編碼為UTF-8,由於編碼不專一致,所以導致亂碼屬問題。 為了解決這個亂碼,需要對文件進行轉碼,具體如下: 1、前提保證已安裝了convmv; 2、具體convmv的用法: Convmv –f 源編碼 –t 新編碼 [選項] 文件名 一般常用參數: -r 遞歸處理子目錄 --notest 真正進行操作,默認情況下是不對文件進行真實操作的,只是一個預覽 --list 顯示所有支持的編碼 --unescap 可以做一個轉義 3、比如我們有一個utf8的文件名,要求轉換成gbk編碼,命令如下: Convmv –f utf-8 –t gbk –notest 文件名 也可以使用linux下最好用的編碼轉換工具iconv來進行轉碼操作。 例子:將GBK編碼的文件轉換成UTF-8 iconv -f GBK -t UTF-8 gbkfile.txt > utf8file.txt

⑸ Linux中如何查看文件編碼及對文件進行編碼轉換

查看文件編碼
在Linux中查看文件編碼可以通過以下幾種方式:
1.在Vim中可以直接查看文件編碼
:set fileencoding
即可顯示文件編碼格式。
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題,那麼你可以在
~/.vimrc 文件中添加以下內容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

這樣,就可以讓vim自動識別文件編碼(可以自動識別UTF-8或者GBK編碼的文件),其實就是依照fileencodings提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼打開。

文件編碼轉換
1.在Vim中直接進行轉換文件編碼,比如將一個文件轉換成utf-8格式
:set fileencoding=utf-8
2. iconv 轉換,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的文件轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2

iconv -f gbk -t utf8 linux常用命令.txt > linux常用命令.txt.utf8

文件名編碼轉換:

從Linux 往 windows拷貝文件或者從windows往Linux拷貝文件,有時會出現中文文件名亂碼的情況,出現這種問題的原因是因為,windows的文件名 中文編碼默認為GBK,而Linux中默認文件名編碼為UTF8,由於編碼不一致,所以導致了文件名亂碼的問題,解決這個問題需要對文件名進行轉碼。

在Linux中專門提供了一種工具convmv進行文件名編碼的轉換,可以將文件名從GBK轉換成UTF-8編碼,或者從UTF-8轉換到GBK。

首先看一下你的系統上是否安裝了convmv,如果沒安裝的話用:
yum -y install convmv
安裝。

下面看一下convmv的具體用法:

convmv -f 源編碼 -t 新編碼 [選項] 文件名

常用參數:
-r 遞歸處理子文件夾
--notest 真正進行操作,請注意在默認情況下是不對文件進行真實操作的,而只是試驗。
--list 顯示所有支持的編碼
--unescap 可以做一下轉義,比如把%20變成空格
比如我們有一個utf8編碼的文件名,轉換成GBK編碼,命令如下:

convmv -f UTF-8 -t GBK --notest utf8編碼的文件名
這樣轉換以後"utf8編碼的文件名"會被轉換成GBK編碼(只是文件名編碼的轉換,文件內容不會發生變化)

閱讀全文

與linux修改文件編碼中文相關的資料

熱點內容
java引入百度地圖 瀏覽:197
m1m2數據哪裡查 瀏覽:646
jsp頁面載入完成事件 瀏覽:387
大哥大到iphone 瀏覽:682
蘋果有紅警嗎 瀏覽:285
什麼app連點器最好用 瀏覽:448
小學奧數哪個網站好用 瀏覽:947
linux修改文件編碼中文 瀏覽:986
東芝筆記本解密工具 瀏覽:822
linux增加文件夾寫的許可權 瀏覽:79
深度學習適合用什麼編程 瀏覽:72
無法載入工具預設 瀏覽:53
世茂城四期用的什麼app 瀏覽:385
linuxgmt時間格式 瀏覽:144
刪除復制文件痕跡 瀏覽:242
男士微信頭像卡通 瀏覽:818
數據線長度有哪些 瀏覽:901
cimatrone85教程 瀏覽:173
資料庫管理客戶端 瀏覽:998
手機word文件怎麼刪除多餘的表格 瀏覽:326

友情鏈接