导航:首页 > 文件类型 > linux修改文件编码中文

linux修改文件编码中文

发布时间:2024-09-30 09:53:50

linux鎬庝箞璁剧疆缂栫爜鏍煎紡linux缂栫爜鏍煎紡璁剧疆

linux鎬庝箞鐪嬫枃鏈鐨勭紪鐮佹牸寮忥紵

linux涓嬬粡甯搁亣鍒扮殑缂栫爜闂棰樺傛灉浣犻渶瑕佸湪linux涓鎿嶄綔windows涓嬬殑鏂囦欢锛岄偅涔堜綘鍙鑳戒細缁忓父閬囧埌鏂囦欢缂栫爜杞鎹㈢殑闂棰樸倃indows涓榛樿ょ殑鏂囦欢鏍煎紡鏄痝bk锛坓b2312锛夛紝鑰宭inux涓鑸閮芥槸utf-8銆

鏌ョ湅缂栫爜鐨勬柟娉

鏂规硶涓锛歠ilefilename

鏂规硶浜岋細鍦╲im涓鍙浠ョ洿鎺ユ煡鐪嬫枃浠剁紪鐮

:setfileencoding

濡傛灉浣犲彧鏄鎯虫煡鐪嬪叾瀹冪紪鐮佹牸寮忕殑鏂囦欢鎴栬呮兂瑙e喅鐢╲im鏌ョ湅鏂囦欢涔辩爜鐨勯棶棰橈紝閭d箞浣犲彲浠ュ湪

~/.vimrc鏂囦欢涓娣诲姞浠ヤ笅鍐呭癸細

setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936

杩欐牱锛屽氨鍙浠ヨ﹙im鑷鍔ㄨ瘑鍒鏂囦欢缂栫爜锛堝彲浠ヨ嚜鍔ㄨ瘑鍒玼tf-8鎴栬単bk缂栫爜鐨勬枃浠讹級锛屽叾瀹炲氨鏄渚濈収fileencodings鎻愪緵鐨勭紪鐮佸垪琛ㄥ皾璇曪紝濡傛灉娌℃湁鎵惧埌鍚堥傜殑缂栫爜锛屽氨鐢╨atin-1锛坅scii锛夌紪鐮佹墦寮

鏂囦欢缂栫爜杞鎹

澶氬钩鍙版柟娉曪細

iconv鎻愪緵鏍囧噯鐨勭▼搴忓拰api鏉ヨ繘琛岀紪鐮佽浆鎹锛

convert_encoding.py鍩轰簬python鐨勬枃鏈鏂囦欢杞鎹㈠伐鍏凤紱

decodeh.py鎻愪緵绠楁硶鍜屾ā鍧楁潵璋堟祴瀛楃︾殑缂栫爜锛

linux涓嬫枃浠剁紪鐮佽浆鎹锛

鏂规硶涓锛

鍦╲im涓鐩存帴杩涜岃浆鎹㈡枃浠剁紪鐮侊紝姣斿傚皢涓涓鏂囦欢杞鎹㈡垚utf-8鏍煎紡

:setfileencoding=utf-8

鎴栬

11锛夎剧疆鏂囦欢闆嗗悎锛屽嵆瑕佸瑰摢浜涙枃浠惰繘琛屾搷浣滐紝鍙浠ヤ娇鐢ㄩ氶厤绗︼紝姣斿傛垜閫氬父鏄瀵筩/c++婧愮▼搴忚繘琛岀紪鐮佽浆鎹

:args*.h*.cpp

2锛夌粰鍑鸿佸湪姣忎釜鏂囦欢涓婃墽琛岀殑鍛戒护锛岃繖閲屾槸杞鎹㈢紪鐮侊細

:argdosetfenc=utf-8|update

鏂规硶浜岋細

iconv杞鎹

5.妗堜緥锛

鍋囧傝存垜浠灏唚indows涓嬬殑涓涓猽tf-8鐨勬枃浠朵紶鍒發inux鐜澧冧笅锛宭inux鐜澧冧笅鐨勭郴缁熺紪鐮佹槸gb18030锛屾垜浠琧at鐨勬椂鍊欏氨浼氬嚭鐜颁贡鐮侊紝杩欎釜鏃跺欏氨搴旇ユ兂鍒拌浆鐮佷簡锛屼笅闈㈡垜浠鏉ヨ繘琛岃瘯楠岋細

鎴戜滑灏唚indows涓嬩竴涓鍚嶄负utf-8.sh鐨勬枃浠朵紶鍒發inux绯荤粺涓锛屽叾涓璾tf-8.sh鐨勫唴瀹瑰備笅锛

鎴戞槸涓鏂囩紪鐮乽tf-8妯″紡~

鑰宭inux绯荤粺鐨勭郴缁熻瑷璁剧疆涓猴細

#cat/etc/sysconfig/i18n

lang=zh_cn.gb18030

sysfont="latarcyrheb-sun16"

杩欎釜鏃跺欐煡鐪嬩竴涓嬫枃浠剁殑鍐呭瑰強缂栫爜锛

#fileutf-8.sh

utf-8.sh:utf-8unicodetext,withnolineterminators

#catutf-8.sh

閿樻寧__?鑵慱__闀癬tf-8濡鈥崇汉~#

#

杩欎釜鏃跺欐垜浠灏遍渶瑕佽浆鎹㈢紪鐮佷簡锛岃板緱浣跨敤iconv

#iconv-futf-8-tgb18030utf-8.sh-ogb18030.sh

#catgb18030.sh

??鎴戞槸涓鏂囩紪鐮乽tf-8妯″紡~#

#filegb18030.sh

gb18030.sh:non-isoextended-asciitext,withnolineterminators

#

convmv灏辨槸鏇存敼鏂囦欢鍚嶇紪鐮佹柟寮忕殑涓涓宸ュ叿銆

姣斿

sudoconvmv-fgbk-tutf-8-r_notest/home

灏辨槸灏/home鐩褰曚笅鍘熸潵鏂囦欢鍚嶆槸gbk缂栫爜鏂瑰紡鐨勫叏閮ㄦ敼涓簎tf-8鏍煎紡鐨勩傝繖閲-f鍚庨潰涓哄師鏉ョ殑缂栫爜鏂瑰紡锛-t鍚庨潰鏄瑕佹洿鏀逛负鐨勭紪鐮佹柟寮忥紝-r琛ㄧず杩欎釜鐩褰曚笅闈㈢殑鎵鏈夋枃浠讹紝_notest琛ㄧず椹涓婃墽琛岋紝鑰屼笉鏄浠呬粎娴嬭瘯鑰屽凡銆傚彟澶栬繖鍛戒护濂藉儚瑕乺oot鎵嶈兘鎵ц岋紝鍥犳よ佸姞涓妔udo銆

linux涓嬫庝箞鏀瑰彉鏂囦欢鐨勭紪鐮佹牸寮忥紵

1銆佺敤VIM鏌ョ湅鏂囦欢缂栫爜

鍦╒im涓鍙浠ョ洿鎺ユ煡鐪嬫枃浠剁紪鐮

:setfileencoding

鍗冲彲鏄剧ず鏂囦欢缂栫爜鏍煎紡銆

2銆佹敼鍐檦/.vimrc鏂囦欢

濡傛灉浣犲彧鏄鎯虫煡鐪嬪叾瀹冪紪鐮佹牸寮忕殑鏂囦欢鎴栬呮兂瑙e喅鐢╒im鏌ョ湅鏂囦欢涔辩爜鐨勯棶棰橈紝閭d箞浣犲彲浠ュ湪

~/.vimrc鏂囦欢涓娣诲姞浠ヤ笅鍐呭癸細

setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936

杩欐牱锛屽氨鍙浠ヨ﹙im鑷鍔ㄨ瘑鍒鏂囦欢缂栫爜锛堝彲浠ヨ嚜鍔ㄨ瘑鍒玌TF-8鎴栬匞BK缂栫爜鐨勬枃浠讹級锛屽叾瀹炲氨鏄渚濈収fileencodings鎻愪緵鐨勭紪鐮佸垪琛ㄥ皾璇曪紝濡傛灉娌℃湁鎵惧埌鍚堥傜殑缂栫爜锛屽氨鐢╨atin-1(ASCII)缂栫爜鎵撳紑銆

3銆佺敤ICONV鏂囦欢缂栫爜杞鎹

鎴戜滑鍒╃敤iconv宸ュ叿瀵规枃浠剁殑缂栫爜杩涜岃浆鎹銆

iconv杞鎹锛宨conv鐨勫懡浠ゆ牸寮忓備笅锛

iconv-fencoding-tencodinginputfile

姣斿傚皢涓涓狦BK缂栫爜鐨勬枃浠惰浆鎹㈡垚UTF-8缂栫爜

iconv-fGBK-tUTF-8file1-ofile2

鍏朵腑鐨勫弬鏁扮殑鎰忎箟琛ㄧず

-fFrom鏌愪釜缂栫爜

-tTo鏌愪釜缂栫爜

-o杈撳嚭鍒版枃浠

4銆侀氳繃璁颁簨鏈鍙﹀瓨涓烘潵鏀瑰彉鏂囦欢缂栫爜锛

鏃㈢敤Windows涓嬬殑璁颁簨鏈鎵撳紑锛岄夋嫨鍙﹀瓨涓猴紝鏀瑰彉缂栫爜鍗冲彲銆

linux涓嬫庝箞鏌ョ湅鏂囦欢鐨勭紪鐮佹柟寮忥紵

涓锛屾煡鐪嬫枃浠剁紪鐮侊細鍦↙inux涓鏌ョ湅鏂囦欢缂栫爜鍙浠ラ氳繃浠ヤ笅鍑犵嶆柟寮忥細

1.鍦╒im涓鍙浠ョ洿鎺ユ煡鐪嬫枃浠剁紪鐮:setfileencoding鍗冲彲鏄剧ず鏂囦欢缂栫爜鏍煎紡銆傚傛灉浣犲彧鏄鎯虫煡鐪嬪叾瀹冪紪鐮佹牸寮忕殑鏂囦欢鎴栬呮兂瑙e喅鐢╒im鏌ョ湅鏂囦欢涔辩爜鐨勯棶棰橈紝閭d箞浣犲彲浠ュ湪~/.vimrc鏂囦欢涓娣诲姞浠ヤ笅鍐呭癸細setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936杩欐牱锛屽氨鍙浠ヨ﹙im鑷鍔ㄨ瘑鍒鏂囦欢缂栫爜锛堝彲浠ヨ嚜鍔ㄨ瘑鍒玌TF-8鎴栬匞BK缂栫爜鐨勬枃浠讹級锛屽叾瀹炲氨鏄渚濈収fileencodings鎻愪緵鐨勭紪鐮佸垪琛ㄥ皾璇曪紝濡傛灉娌℃湁鎵惧埌鍚堥傜殑缂栫爜锛屽氨鐢╨atin-1(ASCII)缂栫爜鎵撳紑銆

2.enca(濡傛灉浣犵殑绯荤粺涓娌℃湁瀹夎呰繖涓鍛戒护锛屽彲浠ョ敤sudoyuminstall-yenca瀹夎)鏌ョ湅鏂囦欢缂栫爜$encafilenamefilename:;UTF-8CRLFlineterminators闇瑕佽存槑涓鐐圭殑鏄锛宔nca瀵规煇浜汫BK缂栫爜鐨勬枃浠惰瘑鍒鐨勪笉鏄寰堝ソ锛岃瘑鍒鏃朵細鍑虹幇锛歎nrecognizedencoding

linux绯荤粺鏂囦欢鏍煎紡鍚庣紑璇﹁В锛

bz2------bzip2鐨勫帇缂╂枃浠

.gz------gzip鐨勫帇缂╂枃浠

.tar------tar鎵撳寘鏂囦欢锛堟槸鍖呮枃浠朵笉鏄鍘嬬缉鏂囦欢锛

.tbz------tar鎵撳寘骞剁敤bzip鍘嬬缉鏂囦欢

.tgz-----tar鎵撳寘骞剁敤gzip鍘嬬缉鐨勬枃浠

.au-----audio鏂囦欢

.gif-----gif鍥捐薄鏂囦欢

.html/.htm-----HTML鏂囦欢

.jpg-----JPEG鍥捐薄鏂囦欢

.pdf------鐢靛瓙鏂囨。锛圥DF鏍煎紡鐨勶級

.png-----PNG鍥捐薄鏂囦欢

.ps------postscinpt鏂囦欢锛堟墦鍗版牸寮忔枃浠讹級

.txt------绾鏂囨湰鏂囦欢

.wav-----audio鏂囦欢

.xpm-----鍥捐薄鏂囦欢

.conf-------閰嶇疆鏂囦欢

.lock-------LOCK鏂囦欢锛堢敤鏉ュ垽鏂涓涓鏂囦欢鎴栬惧囨槸鍚﹁浣跨敤锛

.rpm------REDHATPackage.Manager鏂囦欢锛堝椾欢鍖呮垨杞浠跺寘锛

.c-------C婧愮▼搴忎唬鐮佹枃浠

.cpp------C++婧愮▼搴忎唬鐮佹枃浠

.h-------C鎴朇++绋嬪簭鐨勫ご鏂囦欢

.o------绋嬪簭鐩鏍囨枃浠

.pl------perl鑴氭湰鏂囦欢

.so-----绫诲簱鏂囦欢

.sh-----shell鑴氭湰涓巜indows涓嬬殑bat鏂囦欢鐩镐技

.bin-----binary浜岃繘鍒跺彲鎵ц屾枃浠

⑵ linux怎么修改默认编码

一、locale的五脏六腑

1、 语言符号及其分类(LC_CTYPE)
2、 数字(LC_NUMERIC)
3、 比较和排序习惯(LC_COLLATE)
4、 时间显示格式(LC_TIME)
5、 货币单位(LC_MONETARY)
6、 信息主要是提示信息,错误信息, 状态信息, 标题, 标签, 按钮和菜单等(LC_MESSAGES)
7、 姓名书写方式(LC_NAME)
8、 地址书写方式(LC_ADDRESS)
9、 电话号码书写方式(LC_TELEPHONE)
10、度量衡表达方式(LC_MEASUREMENT)
11、默认纸张尺寸大小(LC_PAPER)
12、对locale自身包含信息的概述(LC_IDENTIFICATION)。

二、理解locale的设置

设定locale就是设定12大类的locale分类属性,即 12个LC_*。除了这12个变量可以设定以外,为了简便起见,还有两个变量:LC_ALL和LANG。

它们之间有一个优先级的关系:LC_ALL > LC_* > LANG

可以这么说,LC_ALL是最上级设定或者强制设定,而LANG是默认设定值。

三 具体设定locale的方法(zh_CN.UTF-8、zh_CN.GBK)

freebsd的设置:

1.GDM登录改为终端登录后startx启动图形桌面

2.在~/.cshrc中增加如下语句,(根据自己使用的shell进行相应设置)

setenv LANG zh_CN.GBK
setenv LC_ALL zh_CN.GBK
setenv LC_CTYPE zh_CN.GBK

3.修改/etc/fstab的默认值:

linux 设置:

1.修改/etc/sysconfig/i18n文件,LANG="zh_CN.UTF-8"或LANG="zh_CN.GBK"

普通用户修改~/.profile

...
export LANG zh_CN.GBK
...

2.修改/etc/fstab的默认值

⑶ linux下怎么改变文件的编码格式

1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8

2. enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,操作如下
enconv -L zh_CN -x UTF-8 filename

3. iconv 转换,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2
查看文件编码file命令
file ip.txt ip.txt: UTF-8 Unicode text, with escape sequences
一、利用iconv命令进行编码转换文件内容编码转换 iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。 用法: iconv [选项...] [文件...] 有如下选项可用: 输入/输出格式规范: -f, --from-code=名称 原始文本编码 -t, --to-code=名称 输出编码 信息: -l, --list 列举所有已知的字符集 输出控制: -c 从输出中忽略无效的字符 -o, --output=FILE 输出文件 -s, --silent 关闭警告 --verbose 打印进度信息 -?, --help 给出该系统求助列表 --usage 给出简要的用法信息 -V, --version 打印程序版本号 例子: iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt 这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。

⑷ linux中文文件显示乱码怎么解决

Linux文件名、文件内容乱码,主要原因是windows上的中文编码默认是GBK,而Linux默认中文编码为UTF-8,由于编码不专一致,所以导致乱码属问题。 为了解决这个乱码,需要对文件进行转码,具体如下: 1、前提保证已安装了convmv; 2、具体convmv的用法: Convmv –f 源编码 –t 新编码 [选项] 文件名 一般常用参数: -r 递归处理子目录 --notest 真正进行操作,默认情况下是不对文件进行真实操作的,只是一个预览 --list 显示所有支持的编码 --unescap 可以做一个转义 3、比如我们有一个utf8的文件名,要求转换成gbk编码,命令如下: Convmv –f utf-8 –t gbk –notest 文件名 也可以使用linux下最好用的编码转换工具iconv来进行转码操作。 例子:将GBK编码的文件转换成UTF-8 iconv -f GBK -t UTF-8 gbkfile.txt > utf8file.txt

⑸ Linux中如何查看文件编码及对文件进行编码转换

查看文件编码
在Linux中查看文件编码可以通过以下几种方式:
1.在Vim中可以直接查看文件编码
:set fileencoding
即可显示文件编码格式。
如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在
~/.vimrc 文件中添加以下内容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。

文件编码转换
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8
2. iconv 转换,iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如将一个UTF-8 编码的文件转换成GBK编码
iconv -f GBK -t UTF-8 file1 -o file2

iconv -f gbk -t utf8 linux常用命令.txt > linux常用命令.txt.utf8

文件名编码转换:

从Linux 往 windows拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名 中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。

在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。

首先看一下你的系统上是否安装了convmv,如果没安装的话用:
yum -y install convmv
安装。

下面看一下convmv的具体用法:

convmv -f 源编码 -t 新编码 [选项] 文件名

常用参数:
-r 递归处理子文件夹
--notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
--list 显示所有支持的编码
--unescap 可以做一下转义,比如把%20变成空格
比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:

convmv -f UTF-8 -t GBK --notest utf8编码的文件名
这样转换以后"utf8编码的文件名"会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)

阅读全文

与linux修改文件编码中文相关的资料

热点内容
m1m2数据哪里查 浏览:646
jsp页面加载完成事件 浏览:387
大哥大到iphone 浏览:682
苹果有红警吗 浏览:285
什么app连点器最好用 浏览:448
小学奥数哪个网站好用 浏览:947
linux修改文件编码中文 浏览:986
东芝笔记本解密工具 浏览:822
linux增加文件夹写的权限 浏览:79
深度学习适合用什么编程 浏览:72
无法载入工具预设 浏览:53
世茂城四期用的什么app 浏览:385
linuxgmt时间格式 浏览:144
删除复制文件痕迹 浏览:242
男士微信头像卡通 浏览:818
数据线长度有哪些 浏览:901
cimatrone85教程 浏览:173
数据库管理客户端 浏览:998
手机word文件怎么删除多余的表格 浏览:326
虚拟机与本机共享文件 浏览:734

友情链接