⑴ java导入word execle txt pdf 全是乱码 求大神指教 如何加过滤器类等如何处理~~谢谢
1、word、execel、pdf文件都不是纯物灶销文本文件,不能用文本编辑器打开(打开肯定乱码)。
2、如果打开txt文件罩游乱码辩悉,请确保txt文件编码,和java程序编码一致。
⑵ java用apache的ZipEntry压缩文件名为中文的word文件时,文件名乱码
apache自带的zip方法有缺陷,没有做中文的判断的,这个是它的一个已知。
解决办法:用jdk的rt.jar里面的方法实现就可以了。
可以参考下以下工具类:
import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.Closeable;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.Enumeration;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
/**
*
* @author gdb
*/
public class ZipUtilAll {
public static final int DEFAULT_BUFSIZE = 1024 * 16;
/**
* 解压Zip文件
*
* @param srcZipFile
* @param destDir
* @throws IOException
*/
public static void unZip(File srcZipFile, String destDir) throws IOException
{
ZipFile zipFile = new ZipFile(srcZipFile);
unZip(zipFile, destDir);
}
/**
* 解压Zip文件
*
* @param srcZipFile
* @param destDir
* @throws IOException
*/
public static void unZip(String srcZipFile, String destDir) throws IOException
{
ZipFile zipFile = new ZipFile(srcZipFile);
unZip(zipFile, destDir);
}
/**
* 解压Zip文件
*
* @param zipFile
* @param destDir
* @throws IOException
*/
public static void unZip(ZipFile zipFile, String destDir) throws IOException
{
Enumeration<? extends ZipEntry> entryEnum = zipFile.entries();
ZipEntry entry = null;
while (entryEnum.hasMoreElements()) {
entry = entryEnum.nextElement();
File destFile = new File(destDir + entry.getName());
if (entry.isDirectory()) {
destFile.mkdirs();
}
else {
destFile.getParentFile().mkdirs();
InputStream eis = zipFile.getInputStream(entry);
System.out.println(eis.read());
write(eis, destFile);
}
}
}
/**
* 将输入流中的数据写到指定文件
*
* @param inputStream
* @param destFile
*/
public static void write(InputStream inputStream, File destFile) throws IOException
{
BufferedInputStream bufIs = null;
BufferedOutputStream bufOs = null;
try {
bufIs = new BufferedInputStream(inputStream);
bufOs = new BufferedOutputStream(new FileOutputStream(destFile));
byte[] buf = new byte[DEFAULT_BUFSIZE];
int len = 0;
while ((len = bufIs.read(buf, 0, buf.length)) > 0) {
bufOs.write(buf, 0, len);
}
} catch (IOException ex) {
throw ex;
} finally {
close(bufOs, bufIs);
}
}
/**
* 安全关闭多个流
*
* @param streams
*/
public static void close(Closeable... streams)
{
try {
for (Closeable s : streams) {
if (s != null)
s.close();
}
} catch (IOException ioe) {
ioe.printStackTrace(System.err);
}
}
/**
* @param args
* @throws java.lang.Exception
*/
public static void main(String[] args) throws Exception
{
// unZip(new File(ZipDemo.class.getResource("D:/123/HKRT-B2B.zip").toURI()), "D:/123/");
unZip("D:/123/123.zip", "D:/123/");
// new File();
}
}
⑶ 您好,请问我用JAVA word分词器对文件分词,出来的结果是乱码,应该如何解决呐
importjava.io.BufferedReader;importjava.io.IOException;importjava.io.InputStreamReader;publicclassDanci{publicstaticvoidmain(String[]args){Stringstr=newString();System.out.print("请输入一个英文句子:");try{BufferedReaderbr=newBufferedReader(newInputStreamReader(System.in));//获取键盘输入str=br.readLine();}catch(IOExceptione){e.printStackTrace();}String[]s=str.split("");//转换成数组System.out.println("你输入的句子共有单词"+s.length+"个");//s.length获取数组长度}}//此程序只能获取一句话的单词个数.
⑷ java下载doc/docx文件乱码的问题
java下载文件是在什么平台(win,linux?)运行的辩粗,又是如何打开看到乱码的(手动闹并、自动、何种液灶迹方式)?
⑸ 请问java中用jacob将html转word中文乱码怎么解决
有中文乱码一般都是字符编码的问题,那你就是设置一下字符编码看看能不能解决这个问题。
⑹ JAVA使用POI读写word 乱码
写
public static void main(String args[])
throws Exception
{
XWPFDocument doc = new XWPFDocument();
XWPFParagraph p1 = doc.createParagraph();
p1.setAlignment(ParagraphAlignment.CENTER);
p1.setBorderBottom(Borders.DOUBLE);
p1.setBorderTop(Borders.DOUBLE);
p1.setBorderRight(Borders.DOUBLE);
p1.setBorderLeft(Borders.DOUBLE);
p1.setBorderBetween(Borders.SINGLE);
p1.setVerticalAlignment(TextAlignment.TOP);
XWPFRun r1 = p1.createRun();
r1.setBold(true);
r1.setText("The quick brown fox");
r1.setBold(true);
r1.setFontFamily("Courier");
r1.setUnderline(UnderlinePatterns.DOT_DOT_DASH);
r1.setTextPosition(100);
XWPFParagraph p2 = doc.createParagraph();
p2.setAlignment(ParagraphAlignment.RIGHT);
p2.setBorderBottom(Borders.DOUBLE);
p2.setBorderTop(Borders.DOUBLE);
p2.setBorderRight(Borders.DOUBLE);
p2.setBorderLeft(Borders.DOUBLE);
p2.setBorderBetween(Borders.SINGLE);
XWPFRun r2 = p2.createRun();
r2.setText("jumped over the lazy dog");
r2.setStrike(true);
r2.setFontSize(20);
XWPFRun r3 = p2.createRun();
r3.setText("and went away");
r3.setStrike(true);
r3.setFontSize(20);
r3.setSubscript(VerticalAlign.SUPERSCRIPT);
XWPFParagraph p3 = doc.createParagraph();
p3.setWordWrap(true);
p3.setPageBreak(true);
p3.setAlignment(ParagraphAlignment.BOTH);
p3.setSpacingLineRule(LineSpacingRule.EXACT);
p3.setIndentationFirstLine(600);
XWPFRun r4 = p3.createRun();
r4.setTextPosition(20);
r4.setText("To be, or not to be: that is the question: Whether 'tis nobler in the mind to suffer The slings and arrows of outrageous fortune, Or to take arms against a sea of troubles, And by opposing end them? To die: to sleep; ");
r4.addBreak(BreakType.PAGE);
r4.setText("No more; and by a sleep to say we end The heart-ache and the thousand natural shocks That flesh is heir to, 'tis a consummation Devoutly to be wish'd. To die, to sleep; To sleep: perchance to dream: ay, there's the rub; .......");
r4.setItalic(true);
XWPFRun r5 = p3.createRun();
r5.setTextPosition(-10);
r5.setText("For in that sleep of death what dreams may come");
r5.addCarriageReturn();
r5.setText("When we have shuffled off this mortal coil,Must give us pause: there's the respectThat makes calamity of so long life;");
r5.addBreak();
r5.setText("For who would bear the whips and scorns of time,The oppressor's wrong, the proud man's contumely,");
r5.addBreak(BreakClear.ALL);
r5.setText("The pangs of despised love, the law's delay,The insolence of office and the spurns.......");
FileOutputStream out = new FileOutputStream("simple.docx");
doc.write(out);
out.close();
}
⑺ word文档打开全是乱码怎么办
word乱码文档恢复方法如下:
工具/原料:台式机AH130、Windows10、Word2018
1、首先进入word,点击左上角的“文件”。
⑻ 打开java文件都是乱码怎么解决
文件编码不一致,修改文件编码utf-8。
如果是class文件乱码,找反编译软件打开。
⑼ word打开是乱码怎么办,两种Word乱码修复方法
文档一打开,汉语部分并没有乱码,而编程代码(java代码)乱码了,这是两个使用了不同的编码方式或格式照成的原因,或者是已经损坏了的文档。如图
3
虽然,本人这次遇到的是汉语部分没有乱码,编写的代码部分,字母乱码了,但是原理和出问题的原因都是一样的,汉语没有乱码证明他的编码方式和word相一致而已,下面介绍的word乱码解决办法合适所以乱码情况!
END
方法一(删除内容格式法)
首先,乱码的原因就是因为内容的编码格式和word规定的不一样!这一点是清楚的,万变不离其宗。所以,不管字母乱码还是汉字乱码,采用“删除内容格式法”,都可以解决乱凯银悉码的现象!
第一步:打开【文件】——【选项】,如图:
在选项卡设置里边,找到【高级】——取消对“【使用智能段落范围选择】”复选框的勾选,然后单击【确定】按钮,目的是为了修复文件,下面修复文件!
第二步:全选乱码文件——复制(将所有的乱码内容复制到新的文档里边,为了粘贴的时候去除格式)
第三步:新建一个文档 【文件】——【新建】——【空白文档】,如图
第四步:粘贴复制内容到新建好的空白文档!这里必须注意:粘贴后盯乎,选择【仅保留文本】,这样所有文字的格式将会被移除,如图
6
选择“仅保留文本”后,保存文档,文档格式已经被删除了搏茄,乱码就被解决了,清除文档格式后排序会有些变化,不过也是很整洁的啦!结果如图
⑽ 乱码的文档怎么恢复
问题一:word文档打开是乱码 如何恢复 Word 文档是许多电脑用户写作时使用的文件格式,当您辛辛苦苦写完一篇Word文档后,发现它因损坏而无法打开时,一定非常着急。其实,您不必心焦,因为我们还是有一些方法可以修复损坏文档,恢复受损文档中的文字。下面是具体的步骤。1 采用专用修复功能①在“文件”菜单上,单击“打开”。②在“查找范围”列表中,单击包含要打开的文件的驱动器、文件夹或Internet 位置。③在文件夹列表中,定位并打开包含文件的文件夹。④选择要恢复的文常。⑤单击“打开”按钮旁边的箭头,然后单击“打开并修复”“打开并修复”是Word 2002/2003 才具有的功能,如果该方法仍不能打开受损文档,或者您使用的是Word 97/2000,可以试试以下方法。2 提取文字法①在“工具”菜单上,单击“选项”*“常规”选项卡。②确认选中“打开时确认转换”复选框,然后单击“确定”。③单击常用工具栏上的“打开”按钮。④在“文件类型”框中,单击“从任意文件中恢复文本”。⑤像通常一样打开文档。在使用上述方法打开受损Word 文档后,如果文档内容显示混乱,请继续以下工作。3 转换文档格式将Word文档转换为另一种格式,然后再将其转换回Word 文档格式。这是最简单和最彻底的文档恢复方法,请始终先尝试这种方法。①在Word 中打开损坏的文档。②在“文件”菜单上,单击“另存为”。③在“保存类型”列表中,单击“RTF 格式(*.rtf)”,然后单击“保存”。
问题二:Word文档文件变成乱码如何完全修复? 一般是无法解决的,因为你这是原始文件损坏你可以试试以下方法看有没有希望: 1,名称:OfficeFIX V5.27 简介:OfficeFIX是一个Microsoft Office的修复工具,它可以修复损坏的Excel,Access和Word文档。提供修复文件的向导功能。 下载地址: act.it.sohu/download/show.php?soft=11663 2,用专业的数据修复软件来修复损坏的文档结构,比如OfficeRecovery、EasyRecovery FileRepair及OfficeFix等Office文件修复工具。 3,如果你到现在还没有向你的U盘重新写入数据那你可以试试一个我用过的好工具,最强大的EasyRecovery Pro支持所有WINDOWS系统,有30多M。注意不要把恢复的数据写在要恢复的那些数据的所在盘里否则会覆盖原始数据的EasyRecovery是威力非常强大的硬盘数据恢复工具。能够帮你恢复丢失的数据以及重建文件系统。 EasyRecovery 不会向你的原始驱动器写入任何东东,它主要是在内存中重建文件分区表使数据能够安全地传输到其他驱动器中。你可以从被病毒破坏或是已经格式化的硬盘中恢复数据。该软件可以恢复大于 8.4GB 的硬盘。支持长文件名。 被破坏的硬盘中像丢失的引导记录、BIOS 参数数据块;分区表;FAT 表;引导区都可以由它来进行恢复。
问题三:我的一个word文件变成了乱码怎么恢复?急~~! 有时候打开Word文档可能会看见文档变成了一堆乱码。不用着急,可以试着通过下面的两个方法来挽救你的文件。 一、替换格式法 就是把损坏的Word文档存为另一种格式。 1、打开被损坏的文档单击“文件/另存为”菜单,在 “保存类型”列表中,选择“RTF格式”,然后单击“保存”按钮,并关闭word。 2、打开刚才保存的RTF格式文件,再次使用 “另存为”将文件重新保存为“Word文档”,现在打开这个word文件就可以发现文件已经被恢复过来了。 如果在转换成rtf格式后文件仍然不能被恢复,可以将文件再次转换为纯文本格式(*.txt),再转换回Word格式。当然在转换为txt文件的时候其图片等信息会丢失掉。 二、删除格式信息法 Word文档的最后一个段落符号记录着全篇文档的格式信息,有时删除这些格式信息就可以恢复变成乱码的文件。 1、在打开损坏的文档后,单击“工具/选项”菜单,选择“编辑”标签,取消对“使用智能段落选择范围”复选框的勾选,然后单击 按钮。这样就可以修复文件了。
问题四:求教:恢复被删除的DOC文件全是乱码,怎么办? Word文档修复十二法
发生停电、电脑死机、没有响应和异常退出等情况时,Word文档来不及保存,或感染病毒等其它原因,再启动机器后,Word文档无法打开或打开后出现乱码,经常使用Word软件的都可能遇到这样的麻烦。下面介绍Word文档修复十二法,修复损坏的文档,恢复文档中的文字。
1 AWR软件法
Advanced Word Repair(AWR)是一个功能很强的Word文件修复工具,它使用最先进的技术扫描遭破坏或损坏的Word文档,并尽最大可能恢复数据,使损失减到最小。
“AWR软件法”修复Word文档的步骤:
1)启动AWR 1.2,单击“…”按钮,选择要修复的Word文件,再单击“…”按钮,输出已修复的文件名,单击“开始修复”按钮,开始修复Word文档,
2 打开并修复法
使用Word自带的“打开并修复”功能通常可以有效修复损坏的Word文档,但只有 Office XP及以上版本才有这样功能。
“打开并修复法”修复Word文档的步骤:
启动Word,依次单击菜单栏 “文件→打开”菜单命令,在“打开”对话框中选择损坏的Word文档,单击“打开”按钮右侧的下三角,选择菜单中的 “打开并修复”命令,对损坏的文档进行修复,如图3所示。文档修复成功后自动打开。
3 转换格式法
先将损坏的Word文档转换为RTF格式,然后再转换回DOC格式,这种转换不但不会丢失Word文档原有的格式,还能成功修复损坏的Word文档。
“转换格式法”修复Word文档的步骤:
1)启动Word,打开损坏的Word文档,依次单击菜单栏 “文件→另存为”菜单命令,在“另存为”对话框中选择保存类型为“RTF格式”,单击“保存”按钮。
2)打开上步保存的RTF文档,依次单击菜单栏“文件→另存为”菜单命令,在“另存为”对话框中选择保存类型为“Word文档”,单击“保存”按钮。
4 删除格式法
Word文档最后一个段落标记关联各种格式设置信息,特别是节与样式的格式设置。当Word文档打开后有乱码时,可以把最后一个段落标记之外的所有内容复制到新的Word文档中,把可能损坏的内容留在原文档中,可以有效消除乱码。
“删除格式法”修复Word文档的步骤:
1)启动Word,打开损坏的Word文档,依次单击菜单栏 “工具→选项”菜单命令。在“选项”对话框中选择“编辑”选项卡,取消“使用智能段落选择范围”复选框,单击“确定”按钮。
2)选择除Word文档最后一个段落标记之外的所有内容,执行复制、粘贴命令复制到新的Word文档中。
5 更新源链接法
在Word中通过更新链接源打开损坏的Word文档,也可有效恢复Word文档。
“更新源链接法”修复Word文档步骤:
1)启动Word,新建文档1,任意输入一些文字,全选并执行复制命令。新建文档2,依次单击文档2菜单栏 “编辑→选择性粘贴”菜单命令,在“选择性粘贴”对话框中选择“粘贴链接”选项,并在“形式”列表中选择“带格式文本(RTF)”选项,单击“确定”按钮
2)依次单击文档2菜单栏 “编辑→链接”菜单命令,在“链接”对话框中“源文件”列表选择文档1,单击“更改源”按钮
3)在“更改源”对话框中选择损坏的Word文档,单击“打开”按钮
4)在“链接”对话框中“源文件”列表选择损坏的Word文档,单击“确定”按钮。
5)文档2中显示损坏Word文档的内容。
6)依次单击文档2菜单栏......>>
问题五:TXT文本文档出现乱码,怎样恢复原有文字格式 选择编码就行了
问题六:数据恢复软件恢复的文档乱码怎么破? 5分 Word 文档是许多电脑用户写作时使用的文件格式,当您辛辛苦苦写完一篇Word文档后,发现它因损坏而无法打开时,一定非常着急。其实,您不必心焦,因为我们还是有一些方法可以修复损坏文档,恢复受损文档中的文字。下面是具体的步骤。 1 采用专用修复功能 ①在“文件”菜单上,单击“打开”。 ②在“查找范围”列表中,单击包含要打开的文件的驱动器、文件夹或Internet 位置。 ③在文件夹列表中,定位并打开包含文件的文件夹。 ④选择要恢复的文件。 ⑤单击“打开”按钮旁边的箭头,然后单击“打开并修复”(如图)。 “打开并修复”是Word 2002/2003 才具有的功能,如果该方法仍不能打开受损文档,或者您使用的是Word 97/2000,可以试试以下方法。 2 提取文字法 ①在“工具”菜单上,单击“选项”*“常规”选项卡。 ②确认选中“打开时确认转换”复选框,然后单击“确定”。 ③单击常用工具栏上的“打开”按钮。 ④在“文件类型”框中,单击“从任意文件中恢复文本”。 ⑤像通常一样打开文档。 在使用上述方法打开受损Word 文档后,如果文档内容显示混乱,请继续以下工作。 3 转换文档格式 将Word文档转换为另一种格式,然后再将其转换回Word 文档格式。这是最简单和最彻底的文档恢复方法,请始终先尝试这种方法。 ①在Word 中打开损坏的文档。 ②在“文件”菜单上,单击“另存为”。 ③在“保存类型”列表中,单击“RTF 格式(*.rtf)”,然后单击“保存”。
问题七:word文件格式保存错误打开全是乱码怎么恢复 用恢复软件试试。点我名字,然后点“他的空间”,我的空间有各种恢复软件的详细介绍、下载地址以及使用说明。 可以去看看。如果数据重要,推荐试试superrecovery超级硬盘数龚恢复软件。这个是目前最好的恢复工具。
问题八:word2010文档乱码怎么恢复 乱码问题
1文档一打开,汉语部分并没有乱码,而编程代码(java代码)乱码了,这是两个使用了不同的编码方式或格式照成的原因,或者是已经损坏了的文档。
2虽然,本人这次遇到的是汉语部分没有乱码,编写的代码部分,字母乱码了,但是原理和出问题的原因都是一样的,汉语没有乱码证明他的编码方式和word相一致而已,下面介绍的word乱码解决办法合适所以乱码情况!
方法一(删除内容格式法)
1首先,乱码的原因就是因为内容的编码格式和word规定的不一样!这一点是清楚的,万变不离其宗。所以,不管字母乱码还是汉字乱码,采用“删除内容格式法”,都可以解决乱码的现象!
第一步:打开【文件】――【选项】,
2在选项卡设置里边,找到【高级】――取消对“【使用智能段落范围选择】”复选框的勾选,然后单击【确定】按钮,目的是为了修复文件,下面修复文件!
3第二步:全选乱码文件――复制(将所有的乱码内容复制到新的文档里边,为了粘贴的时候去除格式)
4第三步:新建一个文档 【文件】――【新建】――【空白文档】,
5第四步:粘贴复制内容到新建好的空白文档!这里必须注意:粘贴后,选择【仅保留文本】,这样所有文字的格式将会被移除,
6选择“仅保留文本”后,保存文档,文档格式已经被删除了,乱码就被解决了,清除文档格式后排序会有些变化,不过也是很整洁的啦!
方法二(转换文档格式法)
1另一种解决方法是转换文档格式法,也很快捷方便,解决中心思想:将乱码文档或者是已经损坏了的文档转换为txt格式后,再转为word的doc或docx专用格式!
:步骤:【文件】――【另存为】将乱码文件转存为txt格式。
2保存txt时的设置windows默认,按下图设置后选择保存即可!最终我们即可得到想要的文档内容了。如图
3文档的乱码已经解决了!这归根揭底也是删除格式的方法,也很快的解决!要想获得doc文件,复制到word里边,或者保存为doc格式或者docx格式即可!一步即可解决了!
问题九:WORD文件恢复出来后是乱码怎么办 下载ultraedit软件,打开您恢复好的文件,然后另存,在另存对话框中选择编码格式为utf-8格式,保存再打开,试试看行不。