㈠ 怎樣將圖片變成word文檔
怎樣將圖片變成WORD文檔:
打開軟體,軟體的頁面非常的簡潔,直接就進入到操作主界面。點擊「讀取」即可添加文件。
點擊上方的「識別」按鈕,對於一些軟體不是很確定的文字會標注為紅色,對比左方的原稿如果有誤就進行修改。
得到的准確無誤的識別結果就可以根據自己的需求進行保存,選擇上方的保存格式有word、圖片,選擇一個點擊之後會彈出word文檔或是圖片,然後自行進行保存。
格式:
Microsoft Word X (Mac OS X)
Microsoft Word在當前使用中是佔有巨大優勢的文字處理器,這使得Word專用的檔案格式Word文件(.doc)成為事實上最通用的標准。Word文件格式的詳細資料並不對外公開。
Word文件格式不只一種,因為隨Word軟體本身的更新,文件格式也會或多或少的改版,新版的格式不一定能被舊版的程序讀取(大致上是因為舊版並未內建支援新版格式的能力)。
微軟已經詳細公布Word 97的DOC格式,但是較新的版本資料仍未公開,只有公司內部、政府與研究機構能夠獲知。業界傳聞說某些Word文件格式的特性甚至連微軟自己都不清楚。
其他與Word競爭的辦公室作業軟體,都必須支援事實上最通用的Word專用的檔案格式。因為Word文件格式的詳細資料並不對外公開,通常這種兼容性是藉由逆向工程來達成。許多文字處理器都有匯出、匯入Word檔案專用的轉換工具,譬如AbiWord或OpenOffice。
㈡ java怎麼操作OpenOffice創建word文檔並向其設置內容
將Word轉Html的原理是這樣的:
1、客戶上傳Word文檔到伺服器
2、伺服器調用OpenOffice程序打開上傳的Word文檔
3、OpenOffice將Word文檔另存為Html格式
4、Over
至此可見,這要求伺服器端安裝OpenOffice軟體,其實也可以是MS Office,不過OpenOffice的優勢是跨平台,你懂的。恩,說明一下,本文的測試基於 MS Win7 Ultimate X64 系統。
下面就是規規矩矩的實現。
1、下載OpenOffice,
2、下載Jodconverter 這是一個開啟OpenOffice進行格式轉化的第三方jar包。
3、泡杯熱茶,等待下載。
4、安裝OpenOffice,安裝結束後,調用cmd,啟動OpenOffice的一項服務:C:\Program Files (x86)\OpenOffice.org 3\program>soffice -headless -accept="socket,port=8100;urp;"
5、打開eclipse
6、喝杯熱茶,等待eclipse打開。
7、新建eclipse項目,導入Jodconverter/lib 下得jar包。
* commons-io
* jodconverter
* juh
* jurt
* ridl
* slf4j-api
* slf4j-jdk14
* unoil
* xstream
8、Coding...
查看代碼
package com.mzule.doc2html.util;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.ConnectException;
import java.util.Date;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import com.artofsolving.jodconverter.DocumentConverter;
import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter;
/**
* 將Word文檔轉換成html字元串的工具類
*
* @author MZULE
*
*/
public class Doc2Html {
public static void main(String[] args) {
System.out
.println(toHtmlString(new File("C:/test/test.doc"), "C:/test"));
}
/**
* 將word文檔轉換成html文檔
*
* @param docFile
* 需要轉換的word文檔
* @param filepath
* 轉換之後html的存放路徑
* @return 轉換之後的html文件
*/
public static File convert(File docFile, String filepath) {
// 創建保存html的文件
File htmlFile = new File(filepath + "/" + new Date().getTime()
+ ".html");
// 創建Openoffice連接
OpenOfficeConnection con = new SocketOpenOfficeConnection(8100);
try {
// 連接
con.connect();
} catch (ConnectException e) {
System.out.println("獲取OpenOffice連接失敗...");
e.printStackTrace();
}
// 創建轉換器
DocumentConverter converter = new OpenOfficeDocumentConverter(con);
// 轉換文檔問html
converter.convert(docFile, htmlFile);
// 關閉openoffice連接
con.disconnect();
return htmlFile;
}
/**
* 將word轉換成html文件,並且獲取html文件代碼。
*
* @param docFile
* 需要轉換的文檔
* @param filepath
* 文檔中圖片的保存位置
* @return 轉換成功的html代碼
*/
public static String toHtmlString(File docFile, String filepath) {
// 轉換word文檔
File htmlFile = convert(docFile, filepath);
// 獲取html文件流
StringBuffer htmlSb = new StringBuffer();
try {
BufferedReader br = new BufferedReader(new InputStreamReader(
new FileInputStream(htmlFile)));
while (br.ready()) {
htmlSb.append(br.readLine());
}
br.close();
// 刪除臨時文件
htmlFile.delete();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
// HTML文件字元串
String htmlStr = htmlSb.toString();
// 返回經過清潔的html文本
return clearFormat(htmlStr, filepath);
}
/**
* 清除一些不需要的html標記
*
* @param htmlStr
* 帶有復雜html標記的html語句
* @return 去除了不需要html標記的語句
*/
protected static String clearFormat(String htmlStr, String docImgPath) {
// 獲取body內容的正則
String bodyReg = "<BODY .*</BODY>";
Pattern bodyPattern = Pattern.compile(bodyReg);
Matcher bodyMatcher = bodyPattern.matcher(htmlStr);
if (bodyMatcher.find()) {
// 獲取BODY內容,並轉化BODY標簽為DIV
htmlStr = bodyMatcher.group().replaceFirst("<BODY", "<DIV")
.replaceAll("</BODY>", "</DIV>");
}
// 調整圖片地址
htmlStr = htmlStr.replaceAll("<IMG SRC=\"", "<IMG SRC=\"" + docImgPath
+ "/");
// 把<P></P>轉換成</div></div>保留樣式
// content = content.replaceAll("(<P)([^>]*>.*?)(<\\/P>)",
// "<div$2</div>");
// 把<P></P>轉換成</div></div>並刪除樣式
htmlStr = htmlStr.replaceAll("(<P)([^>]*)(>.*?)(<\\/P>)", "<p$3</p>");
// 刪除不需要的標簽
htmlStr = htmlStr
.replaceAll(
"<[/]?(font|FONT|span|SPAN|xml|XML|del|DEL|ins|INS|meta|META|[ovwxpOVWXP]:\\w+)[^>]*?>",
"");
// 刪除不需要的屬性
htmlStr = htmlStr
.replaceAll(
"<([^>]*)(?:lang|LANG|class|CLASS|style|STYLE|size|SIZE|face|FACE|[ovwxpOVWXP]:\\w+)=(?:'[^']*'|\"\"[^\"\"]*\"\"|[^>]+)([^>]*)>",
"<$1$2>");
return htmlStr;
}
}
㈢ Java 生成Word文檔,是跨平台的,如何實現
跨平台文檔,不如生成HTML文件更好,word也可以打開,其他平台也能打開。
如果切實需要二進制文件,其它平台要打開的話,目前有永中office,openoffice.org,libreoffice。
永中office本身就是JAVA編寫的,在java中可以調用生成word文件。
openoffice.org,libreoffice本身也與java有密切的淵源,跨平台與生成word都沒問題。
你可以使用這些軟體實現你的需求,不用你自己編寫了。
當然,附帶的問題就是你在相關的電腦里必須安裝這些軟體。
㈣ office2010如何將PPT轉換成WORD文檔
office2010下載, word2010免費下載 http://www.ppt2008.cn/excelxiazai/133.html office下載安裝 http://www.ppt2008.cn/excelxiazai/133.html 每一代的Microsoft office都有一個以上的版本,每個版本都根據使用者的實際需要,選擇了不同的組件。 Word Microsoft Word是文字處理軟體。它被認為是Office的主要程序。它在文字處理軟體市場上擁有統治份額。它私有的DOC格式被尊 為一個行業的標准,雖然它的最新版本Word 12.0/2007也支持一個基於XML的格式。Word也適宜某些版本的Microsoft Works。它適宜Windows和Macintosh 平台。它的主要競爭者是OpenOffice.org Writer、StarOffice、Corel WordPerfect和Apple Pages。Microsoft Word可以輕松構造各種網頁,實現其他軟體難以實現的網頁效果,缺陷是它構造的WEB網頁CSS代碼繁多。 Excel word2010下載, word2010免費下載 http://www.ppt2008.cn/excelxiazai/133.html office下載安裝 http://www.ppt2008.cn/excelxiazai/133.html Microsoft Excel是電子數據表程序〔進行數字和預算運算的軟體程序〕。像Microsoft Word,它在市場擁有統治份額。它最初對占優勢的Lotus 1-2-3是個競爭者,但最後它賣得比它多、快,於是它成為了實際標准。它適宜Windows和Macintosh 平台。它的主要競爭者是OpenOffice.org Calc、StarOffice和Corel Quattro Pro。 word2010下載, word2010免費下載 http://www.ppt2008.cn/excelxiazai/133.html office下載安裝 http://www.ppt2008.cn/excelxiazai/133.html Outlook Microsoft Outlook——請不要同微軟的另外一款產品Outlook Express相混淆—— 是個人信息管理程序和電子郵件通信軟體。在Office 97版接任Microsoft Mail。它包括一個電子郵件客戶端,日歷,任務管理者,和地址本。它的電子郵件程序的主要競爭者是Mozilla Thunderbird(Mozilla)和Eudora。它的個人信息管理程序主要競爭者是Mozilla和Lotus Organizer。它僅適宜Windows平台;一個版本也被包括在大多數Pocket PC掌上電腦里。它在Macintosh里對應的程序是Microsoft Entourage。 Access Microsoft Office Access(前名 Microsoft Access)是由微軟發布的關聯式資料庫管理系統。它結合了 Microsoft Jet Database Engine 和 圖形用戶界面兩項特點,是 Microsoft Office 2007 的成員之一。 Access能夠存取 Access/Jet、Microsoft SQL Server、Oracle,或者任何 ODBC 兼容資料庫內的資料。熟練的軟體設計師和資料分析師利用它來開發應用軟體,而一些不熟練的程序員和非程序員的"進階用戶"則能使用它來開發簡單的應用軟體。雖然它支援部份面向對象(OO)技術,但是未能成為一種完整的面向對象開發工具。 其實Access 也是微軟公司另一個通訊程序的名字,想與 ProComm 以及其他類似程序來競爭。可是事後微軟證實這是個失敗計劃,並且將它 word2010下載, word2010免費下載 http://www.ppt2008.cn/excelxiazai/133.html office下載安裝 http://www.ppt2008.cn/excelxiazai/133.html 中止。數年後他們把名字重新命名於資料庫軟體。 PowerPoint Microsoft PowerPoint 使用戶可以快速創建極具感染力的動態演示文稿,同時集成工作流和方法以輕松共享信息。 Outlook Express Microsoft Outlook Express,簡稱為OE,是微軟公司出品的一款電子郵件客戶端,也是一個基於NNTP協議的Usenet客戶端。微軟將這個軟體與操作系統以及Internet Explorer網頁瀏覽器捆綁在一起。同時,對於蘋果公司「經典」版的麥金塔電腦提供該軟體的免費下載(微軟不對新版本的Mac OS X操作系統提供該軟體,在OS X上微軟對應的軟體是Microsoft Entourage,Microsoft Entourage是專有商用軟體Microsoft Office套裝的一部分)。 Project word2010下載, word2010免費下載 http://www.ppt2008.cn/excelxiazai/133.html office下載安裝 http://www.ppt2008.cn/excelxiazai/133.html Microsoft Project(或MSP) 是專案管理軟體程序由微軟開發銷售。軟體設計目的在於協助專案經理發展計劃、為任務分配資源、跟蹤進度、管理預算和分析工作量。第一版微軟Project為微軟Project for Windows 95,發布於1995年。其後版本各於1998, 2000, 2003和2006年發布。本應用程序可產生關鍵路徑日程表──雖然第三方ProChain和Spherical Angle也有提供關鍵鏈關聯軟體。日程表可以以資源標準的,而且關鍵鏈以甘特圖形象化。另外,Project可以辨認不同類別的用戶。這些不同類的用戶對專案、概觀、和其它資料有不同的訪問級別。自訂物件如行事歷、觀看方式、表格、篩選器和欄位在企業領域分享給所有用戶。 Publisher Microsoft Office Publisher是微軟公司發行的桌面出版應用軟體。它常被人們認為是一款入門級的桌面出版應用軟體,它能提供比Microsoft Word更強大的頁面元素控制功能,但比起專業的頁面布局軟體,比如說Adobe公司的InDesign以及Quark公司的QuarkXPress來還略遜一籌。 word2010下載, word2010免費下載 http://www.ppt2008.cn/excelxiazai/133.html office下載安裝 http://www.ppt2008.cn/excelxiazai/133.html 比起其它桌面出版軟體來,Publisher在歷史上一直不受高端商務列印商店歡迎。它只能用於Windows,而業界占相當份額的系統運行的是蘋果公司的Mac OS X。Publisher定位於入門級的應用軟體造成了很多的問題,比如在服務提供商的電腦上沒有相應字體和嵌入對象等等(雖然Publisher提供了可以把相關聯的文件壓縮成一個自釋放應用程序的工具)。許多高端特性,比如透明化,對象陰影,slugs,路徑文本,內嵌的PDF輸出等等,或者沒有完全實現,或者乾脆沒有。但最近的一些版本有了很大的提高,開始關注色彩分離以及正確地處理彩色輸出。Publisher 2007還包含了期待已久的特性,可以輸出商業出版品質帶內嵌字體的PDF格式,作為選件可以從微軟網站下載。 word2010下載, word2010免費下載 http://www.ppt2008.cn/excelxiazai/133.html office下載安裝 http://www.ppt2008.cn/excelxiazai/133.html Publisher被包含在高端的Microsoft Office版本中。這反映了微軟對Publisher的定位,它是一款易用的,相比於那些重量級產口而言價格適中的產品,它的目標用戶主要是那些沒有專業人員製作市場推廣材料以及其它文檔的中小型企業。 Publisher的大部份替代品, 除Adobe PageMaker外,都不提供導入Publisher的功能;但是,Publisher可以 導出成EMF (Enhance.d Metafile)格式,它可以被其它軟體支持。