⑴ java導入word execle txt pdf 全是亂碼 求大神指教 如何加過濾器類等如何處理~~謝謝
1、word、execel、pdf文件都不是純物灶銷文本文件,不能用文本編輯器打開(打開肯定亂碼)。
2、如果打開txt文件罩游亂碼辯悉,請確保txt文件編碼,和java程序編碼一致。
⑵ java用apache的ZipEntry壓縮文件名為中文的word文件時,文件名亂碼
apache自帶的zip方法有缺陷,沒有做中文的判斷的,這個是它的一個已知。
解決辦法:用jdk的rt.jar裡面的方法實現就可以了。
可以參考下以下工具類:
import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.Closeable;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.Enumeration;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
/**
*
* @author gdb
*/
public class ZipUtilAll {
public static final int DEFAULT_BUFSIZE = 1024 * 16;
/**
* 解壓Zip文件
*
* @param srcZipFile
* @param destDir
* @throws IOException
*/
public static void unZip(File srcZipFile, String destDir) throws IOException
{
ZipFile zipFile = new ZipFile(srcZipFile);
unZip(zipFile, destDir);
}
/**
* 解壓Zip文件
*
* @param srcZipFile
* @param destDir
* @throws IOException
*/
public static void unZip(String srcZipFile, String destDir) throws IOException
{
ZipFile zipFile = new ZipFile(srcZipFile);
unZip(zipFile, destDir);
}
/**
* 解壓Zip文件
*
* @param zipFile
* @param destDir
* @throws IOException
*/
public static void unZip(ZipFile zipFile, String destDir) throws IOException
{
Enumeration<? extends ZipEntry> entryEnum = zipFile.entries();
ZipEntry entry = null;
while (entryEnum.hasMoreElements()) {
entry = entryEnum.nextElement();
File destFile = new File(destDir + entry.getName());
if (entry.isDirectory()) {
destFile.mkdirs();
}
else {
destFile.getParentFile().mkdirs();
InputStream eis = zipFile.getInputStream(entry);
System.out.println(eis.read());
write(eis, destFile);
}
}
}
/**
* 將輸入流中的數據寫到指定文件
*
* @param inputStream
* @param destFile
*/
public static void write(InputStream inputStream, File destFile) throws IOException
{
BufferedInputStream bufIs = null;
BufferedOutputStream bufOs = null;
try {
bufIs = new BufferedInputStream(inputStream);
bufOs = new BufferedOutputStream(new FileOutputStream(destFile));
byte[] buf = new byte[DEFAULT_BUFSIZE];
int len = 0;
while ((len = bufIs.read(buf, 0, buf.length)) > 0) {
bufOs.write(buf, 0, len);
}
} catch (IOException ex) {
throw ex;
} finally {
close(bufOs, bufIs);
}
}
/**
* 安全關閉多個流
*
* @param streams
*/
public static void close(Closeable... streams)
{
try {
for (Closeable s : streams) {
if (s != null)
s.close();
}
} catch (IOException ioe) {
ioe.printStackTrace(System.err);
}
}
/**
* @param args
* @throws java.lang.Exception
*/
public static void main(String[] args) throws Exception
{
// unZip(new File(ZipDemo.class.getResource("D:/123/HKRT-B2B.zip").toURI()), "D:/123/");
unZip("D:/123/123.zip", "D:/123/");
// new File();
}
}
⑶ 您好,請問我用JAVA word分詞器對文件分詞,出來的結果是亂碼,應該如何解決吶
importjava.io.BufferedReader;importjava.io.IOException;importjava.io.InputStreamReader;publicclassDanci{publicstaticvoidmain(String[]args){Stringstr=newString();System.out.print("請輸入一個英文句子:");try{BufferedReaderbr=newBufferedReader(newInputStreamReader(System.in));//獲取鍵盤輸入str=br.readLine();}catch(IOExceptione){e.printStackTrace();}String[]s=str.split("");//轉換成數組System.out.println("你輸入的句子共有單詞"+s.length+"個");//s.length獲取數組長度}}//此程序只能獲取一句話的單詞個數.
⑷ java下載doc/docx文件亂碼的問題
java下載文件是在什麼平台(win,linux?)運行的辯粗,又是如何打開看到亂碼的(手動鬧並、自動、何種液灶跡方式)?
⑸ 請問java中用jacob將html轉word中文亂碼怎麼解決
有中文亂碼一般都是字元編碼的問題,那你就是設置一下字元編碼看看能不能解決這個問題。
⑹ JAVA使用POI讀寫word 亂碼
寫
public static void main(String args[])
throws Exception
{
XWPFDocument doc = new XWPFDocument();
XWPFParagraph p1 = doc.createParagraph();
p1.setAlignment(ParagraphAlignment.CENTER);
p1.setBorderBottom(Borders.DOUBLE);
p1.setBorderTop(Borders.DOUBLE);
p1.setBorderRight(Borders.DOUBLE);
p1.setBorderLeft(Borders.DOUBLE);
p1.setBorderBetween(Borders.SINGLE);
p1.setVerticalAlignment(TextAlignment.TOP);
XWPFRun r1 = p1.createRun();
r1.setBold(true);
r1.setText("The quick brown fox");
r1.setBold(true);
r1.setFontFamily("Courier");
r1.setUnderline(UnderlinePatterns.DOT_DOT_DASH);
r1.setTextPosition(100);
XWPFParagraph p2 = doc.createParagraph();
p2.setAlignment(ParagraphAlignment.RIGHT);
p2.setBorderBottom(Borders.DOUBLE);
p2.setBorderTop(Borders.DOUBLE);
p2.setBorderRight(Borders.DOUBLE);
p2.setBorderLeft(Borders.DOUBLE);
p2.setBorderBetween(Borders.SINGLE);
XWPFRun r2 = p2.createRun();
r2.setText("jumped over the lazy dog");
r2.setStrike(true);
r2.setFontSize(20);
XWPFRun r3 = p2.createRun();
r3.setText("and went away");
r3.setStrike(true);
r3.setFontSize(20);
r3.setSubscript(VerticalAlign.SUPERSCRIPT);
XWPFParagraph p3 = doc.createParagraph();
p3.setWordWrap(true);
p3.setPageBreak(true);
p3.setAlignment(ParagraphAlignment.BOTH);
p3.setSpacingLineRule(LineSpacingRule.EXACT);
p3.setIndentationFirstLine(600);
XWPFRun r4 = p3.createRun();
r4.setTextPosition(20);
r4.setText("To be, or not to be: that is the question: Whether 'tis nobler in the mind to suffer The slings and arrows of outrageous fortune, Or to take arms against a sea of troubles, And by opposing end them? To die: to sleep; ");
r4.addBreak(BreakType.PAGE);
r4.setText("No more; and by a sleep to say we end The heart-ache and the thousand natural shocks That flesh is heir to, 'tis a consummation Devoutly to be wish'd. To die, to sleep; To sleep: perchance to dream: ay, there's the rub; .......");
r4.setItalic(true);
XWPFRun r5 = p3.createRun();
r5.setTextPosition(-10);
r5.setText("For in that sleep of death what dreams may come");
r5.addCarriageReturn();
r5.setText("When we have shuffled off this mortal coil,Must give us pause: there's the respectThat makes calamity of so long life;");
r5.addBreak();
r5.setText("For who would bear the whips and scorns of time,The oppressor's wrong, the proud man's contumely,");
r5.addBreak(BreakClear.ALL);
r5.setText("The pangs of despised love, the law's delay,The insolence of office and the spurns.......");
FileOutputStream out = new FileOutputStream("simple.docx");
doc.write(out);
out.close();
}
⑺ word文檔打開全是亂碼怎麼辦
word亂碼文檔恢復方法如下:
工具/原料:台式機AH130、Windows10、Word2018
1、首先進入word,點擊左上角的「文件」。
⑻ 打開java文件都是亂碼怎麼解決
文件編碼不一致,修改文件編碼utf-8。
如果是class文件亂碼,找反編譯軟體打開。
⑼ word打開是亂碼怎麼辦,兩種Word亂碼修復方法
文檔一打開,漢語部分並沒有亂碼,而編程代碼(java代碼)亂碼了,這是兩個使用了不同的編碼方式或格式照成的原因,或者是已經損壞了的文檔。如圖
3
雖然,本人這次遇到的是漢語部分沒有亂碼,編寫的代碼部分,字母亂碼了,但是原理和出問題的原因都是一樣的,漢語沒有亂碼證明他的編碼方式和word相一致而已,下面介紹的word亂碼解決辦法合適所以亂碼情況!
END
方法一(刪除內容格式法)
首先,亂碼的原因就是因為內容的編碼格式和word規定的不一樣!這一點是清楚的,萬變不離其宗。所以,不管字母亂碼還是漢字亂碼,採用「刪除內容格式法」,都可以解決亂凱銀悉碼的現象!
第一步:打開【文件】——【選項】,如圖:
在選項卡設置里邊,找到【高級】——取消對「【使用智能段落范圍選擇】」復選框的勾選,然後單擊【確定】按鈕,目的是為了修復文件,下面修復文件!
第二步:全選亂碼文件——復制(將所有的亂碼內容復制到新的文檔里邊,為了粘貼的時候去除格式)
第三步:新建一個文檔 【文件】——【新建】——【空白文檔】,如圖
第四步:粘貼復制內容到新建好的空白文檔!這里必須注意:粘貼後盯乎,選擇【僅保留文本】,這樣所有文字的格式將會被移除,如圖
6
選擇「僅保留文本」後,保存文檔,文檔格式已經被刪除了搏茄,亂碼就被解決了,清除文檔格式後排序會有些變化,不過也是很整潔的啦!結果如圖
⑽ 亂碼的文檔怎麼恢復
問題一:word文檔打開是亂碼 如何恢復 Word 文檔是許多電腦用戶寫作時使用的文件格式,當您辛辛苦苦寫完一篇Word文檔後,發現它因損壞而無法打開時,一定非常著急。其實,您不必心焦,因為我們還是有一些方法可以修復損壞文檔,恢復受損文檔中的文字。下面是具體的步驟。1 採用專用修復功能①在「文件」菜單上,單擊「打開」。②在「查找范圍」列表中,單擊包含要打開的文件的驅動器、文件夾或Internet 位置。③在文件夾列表中,定位並打開包含文件的文件夾。④選擇要恢復的文常。⑤單擊「打開」按鈕旁邊的箭頭,然後單擊「打開並修復」「打開並修復」是Word 2002/2003 才具有的功能,如果該方法仍不能打開受損文檔,或者您使用的是Word 97/2000,可以試試以下方法。2 提取文字法①在「工具」菜單上,單擊「選項」*「常規」選項卡。②確認選中「打開時確認轉換」復選框,然後單擊「確定」。③單擊常用工具欄上的「打開」按鈕。④在「文件類型」框中,單擊「從任意文件中恢復文本」。⑤像通常一樣打開文檔。在使用上述方法打開受損Word 文檔後,如果文檔內容顯示混亂,請繼續以下工作。3 轉換文檔格式將Word文檔轉換為另一種格式,然後再將其轉換回Word 文檔格式。這是最簡單和最徹底的文檔恢復方法,請始終先嘗試這種方法。①在Word 中打開損壞的文檔。②在「文件」菜單上,單擊「另存為」。③在「保存類型」列表中,單擊「RTF 格式(*.rtf)」,然後單擊「保存」。
問題二:Word文檔文件變成亂碼如何完全修復? 一般是無法解決的,因為你這是原始文件損壞你可以試試以下方法看有沒有希望: 1,名稱:OfficeFIX V5.27 簡介:OfficeFIX是一個Microsoft Office的修復工具,它可以修復損壞的Excel,Access和Word文檔。提供修復文件的向導功能。 下載地址: act.it.sohu/download/show.php?soft=11663 2,用專業的數據修復軟體來修復損壞的文檔結構,比如OfficeRecovery、EasyRecovery FileRepair及OfficeFix等Office文件修復工具。 3,如果你到現在還沒有向你的U盤重新寫入數據那你可以試試一個我用過的好工具,最強大的EasyRecovery Pro支持所有WINDOWS系統,有30多M。注意不要把恢復的數據寫在要恢復的那些數據的所在盤里否則會覆蓋原始數據的EasyRecovery是威力非常強大的硬碟數據恢復工具。能夠幫你恢復丟失的數據以及重建文件系統。 EasyRecovery 不會向你的原始驅動器寫入任何東東,它主要是在內存中重建文件分區表使數據能夠安全地傳輸到其他驅動器中。你可以從被病毒破壞或是已經格式化的硬碟中恢復數據。該軟體可以恢復大於 8.4GB 的硬碟。支持長文件名。 被破壞的硬碟中像丟失的引導記錄、BIOS 參數數據塊;分區表;FAT 表;引導區都可以由它來進行恢復。
問題三:我的一個word文件變成了亂碼怎麼恢復?急~~! 有時候打開Word文檔可能會看見文檔變成了一堆亂碼。不用著急,可以試著通過下面的兩個方法來挽救你的文件。 一、替換格式法 就是把損壞的Word文檔存為另一種格式。 1、打開被損壞的文檔單擊「文件/另存為」菜單,在 「保存類型」列表中,選擇「RTF格式」,然後單擊「保存」按鈕,並關閉word。 2、打開剛才保存的RTF格式文件,再次使用 「另存為」將文件重新保存為「Word文檔」,現在打開這個word文件就可以發現文件已經被恢復過來了。 如果在轉換成rtf格式後文件仍然不能被恢復,可以將文件再次轉換為純文本格式(*.txt),再轉換回Word格式。當然在轉換為txt文件的時候其圖片等信息會丟失掉。 二、刪除格式信息法 Word文檔的最後一個段落符號記錄著全篇文檔的格式信息,有時刪除這些格式信息就可以恢復變成亂碼的文件。 1、在打開損壞的文檔後,單擊「工具/選項」菜單,選擇「編輯」標簽,取消對「使用智能段落選擇范圍」復選框的勾選,然後單擊 按鈕。這樣就可以修復文件了。
問題四:求教:恢復被刪除的DOC文件全是亂碼,怎麼辦? Word文檔修復十二法
發生停電、電腦死機、沒有響應和異常退出等情況時,Word文檔來不及保存,或感染病毒等其它原因,再啟動機器後,Word文檔無法打開或打開後出現亂碼,經常使用Word軟體的都可能遇到這樣的麻煩。下面介紹Word文檔修復十二法,修復損壞的文檔,恢復文檔中的文字。
1 AWR軟體法
Advanced Word Repair(AWR)是一個功能很強的Word文件修復工具,它使用最先進的技術掃描遭破壞或損壞的Word文檔,並盡最大可能恢復數據,使損失減到最小。
「AWR軟體法」修復Word文檔的步驟:
1)啟動AWR 1.2,單擊「…」按鈕,選擇要修復的Word文件,再單擊「…」按鈕,輸出已修復的文件名,單擊「開始修復」按鈕,開始修復Word文檔,
2 打開並修復法
使用Word自帶的「打開並修復」功能通常可以有效修復損壞的Word文檔,但只有 Office XP及以上版本才有這樣功能。
「打開並修復法」修復Word文檔的步驟:
啟動Word,依次單擊菜單欄 「文件→打開」菜單命令,在「打開」對話框中選擇損壞的Word文檔,單擊「打開」按鈕右側的下三角,選擇菜單中的 「打開並修復」命令,對損壞的文檔進行修復,如圖3所示。文檔修復成功後自動打開。
3 轉換格式法
先將損壞的Word文檔轉換為RTF格式,然後再轉換回DOC格式,這種轉換不但不會丟失Word文檔原有的格式,還能成功修復損壞的Word文檔。
「轉換格式法」修復Word文檔的步驟:
1)啟動Word,打開損壞的Word文檔,依次單擊菜單欄 「文件→另存為」菜單命令,在「另存為」對話框中選擇保存類型為「RTF格式」,單擊「保存」按鈕。
2)打開上步保存的RTF文檔,依次單擊菜單欄「文件→另存為」菜單命令,在「另存為」對話框中選擇保存類型為「Word文檔」,單擊「保存」按鈕。
4 刪除格式法
Word文檔最後一個段落標記關聯各種格式設置信息,特別是節與樣式的格式設置。當Word文檔打開後有亂碼時,可以把最後一個段落標記之外的所有內容復制到新的Word文檔中,把可能損壞的內容留在原文檔中,可以有效消除亂碼。
「刪除格式法」修復Word文檔的步驟:
1)啟動Word,打開損壞的Word文檔,依次單擊菜單欄 「工具→選項」菜單命令。在「選項」對話框中選擇「編輯」選項卡,取消「使用智能段落選擇范圍」復選框,單擊「確定」按鈕。
2)選擇除Word文檔最後一個段落標記之外的所有內容,執行復制、粘貼命令復制到新的Word文檔中。
5 更新源鏈接法
在Word中通過更新鏈接源打開損壞的Word文檔,也可有效恢復Word文檔。
「更新源鏈接法」修復Word文檔步驟:
1)啟動Word,新建文檔1,任意輸入一些文字,全選並執行復制命令。新建文檔2,依次單擊文檔2菜單欄 「編輯→選擇性粘貼」菜單命令,在「選擇性粘貼」對話框中選擇「粘貼鏈接」選項,並在「形式」列表中選擇「帶格式文本(RTF)」選項,單擊「確定」按鈕
2)依次單擊文檔2菜單欄 「編輯→鏈接」菜單命令,在「鏈接」對話框中「源文件」列表選擇文檔1,單擊「更改源」按鈕
3)在「更改源」對話框中選擇損壞的Word文檔,單擊「打開」按鈕
4)在「鏈接」對話框中「源文件」列表選擇損壞的Word文檔,單擊「確定」按鈕。
5)文檔2中顯示損壞Word文檔的內容。
6)依次單擊文檔2菜單欄......>>
問題五:TXT文本文檔出現亂碼,怎樣恢復原有文字格式 選擇編碼就行了
問題六:數據恢復軟體恢復的文檔亂碼怎麼破? 5分 Word 文檔是許多電腦用戶寫作時使用的文件格式,當您辛辛苦苦寫完一篇Word文檔後,發現它因損壞而無法打開時,一定非常著急。其實,您不必心焦,因為我們還是有一些方法可以修復損壞文檔,恢復受損文檔中的文字。下面是具體的步驟。 1 採用專用修復功能 ①在「文件」菜單上,單擊「打開」。 ②在「查找范圍」列表中,單擊包含要打開的文件的驅動器、文件夾或Internet 位置。 ③在文件夾列表中,定位並打開包含文件的文件夾。 ④選擇要恢復的文件。 ⑤單擊「打開」按鈕旁邊的箭頭,然後單擊「打開並修復」(如圖)。 「打開並修復」是Word 2002/2003 才具有的功能,如果該方法仍不能打開受損文檔,或者您使用的是Word 97/2000,可以試試以下方法。 2 提取文字法 ①在「工具」菜單上,單擊「選項」*「常規」選項卡。 ②確認選中「打開時確認轉換」復選框,然後單擊「確定」。 ③單擊常用工具欄上的「打開」按鈕。 ④在「文件類型」框中,單擊「從任意文件中恢復文本」。 ⑤像通常一樣打開文檔。 在使用上述方法打開受損Word 文檔後,如果文檔內容顯示混亂,請繼續以下工作。 3 轉換文檔格式 將Word文檔轉換為另一種格式,然後再將其轉換回Word 文檔格式。這是最簡單和最徹底的文檔恢復方法,請始終先嘗試這種方法。 ①在Word 中打開損壞的文檔。 ②在「文件」菜單上,單擊「另存為」。 ③在「保存類型」列表中,單擊「RTF 格式(*.rtf)」,然後單擊「保存」。
問題七:word文件格式保存錯誤打開全是亂碼怎麼恢復 用恢復軟體試試。點我名字,然後點「他的空間」,我的空間有各種恢復軟體的詳細介紹、下載地址以及使用說明。 可以去看看。如果數據重要,推薦試試superrecovery超級硬碟數龔恢復軟體。這個是目前最好的恢復工具。
問題八:word2010文檔亂碼怎麼恢復 亂碼問題
1文檔一打開,漢語部分並沒有亂碼,而編程代碼(java代碼)亂碼了,這是兩個使用了不同的編碼方式或格式照成的原因,或者是已經損壞了的文檔。
2雖然,本人這次遇到的是漢語部分沒有亂碼,編寫的代碼部分,字母亂碼了,但是原理和出問題的原因都是一樣的,漢語沒有亂碼證明他的編碼方式和word相一致而已,下面介紹的word亂碼解決辦法合適所以亂碼情況!
方法一(刪除內容格式法)
1首先,亂碼的原因就是因為內容的編碼格式和word規定的不一樣!這一點是清楚的,萬變不離其宗。所以,不管字母亂碼還是漢字亂碼,採用「刪除內容格式法」,都可以解決亂碼的現象!
第一步:打開【文件】――【選項】,
2在選項卡設置里邊,找到【高級】――取消對「【使用智能段落范圍選擇】」復選框的勾選,然後單擊【確定】按鈕,目的是為了修復文件,下面修復文件!
3第二步:全選亂碼文件――復制(將所有的亂碼內容復制到新的文檔里邊,為了粘貼的時候去除格式)
4第三步:新建一個文檔 【文件】――【新建】――【空白文檔】,
5第四步:粘貼復制內容到新建好的空白文檔!這里必須注意:粘貼後,選擇【僅保留文本】,這樣所有文字的格式將會被移除,
6選擇「僅保留文本」後,保存文檔,文檔格式已經被刪除了,亂碼就被解決了,清除文檔格式後排序會有些變化,不過也是很整潔的啦!
方法二(轉換文檔格式法)
1另一種解決方法是轉換文檔格式法,也很快捷方便,解決中心思想:將亂碼文檔或者是已經損壞了的文檔轉換為txt格式後,再轉為word的doc或docx專用格式!
:步驟:【文件】――【另存為】將亂碼文件轉存為txt格式。
2保存txt時的設置windows默認,按下圖設置後選擇保存即可!最終我們即可得到想要的文檔內容了。如圖
3文檔的亂碼已經解決了!這歸根揭底也是刪除格式的方法,也很快的解決!要想獲得doc文件,復制到word里邊,或者保存為doc格式或者docx格式即可!一步即可解決了!
問題九:WORD文件恢復出來後是亂碼怎麼辦 下載ultraedit軟體,打開您恢復好的文件,然後另存,在另存對話框中選擇編碼格式為utf-8格式,保存再打開,試試看行不。