❶ 怎麼用java 開發一個搜索引擎呀
一.創建索引
1.一般創建索引的核心步驟
(1).創建索引寫入對象IndexWriter:
IndexWriter indexWriter = new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),create);
參數說明:INDEX_STORE_PATH:索引文件存放路徑
new StandardAnalyzer():分詞工具
create:此參數為Boolean型,true表示重新創建整個索引,false表示增量式創建索引。
(2).創建文檔模型,並用IndexWriter對象寫入
Document doc = new Document();
Field field1 = new Field(fieldName1, fieldValue ,Field.Store.YES, Field.Index.TOKENIZED);
doc.add(field1);
Field field2 = new Field(fieldName2, fieldValue ,Field.Store.YES, Field.Index.TOKENIZED);
doc.add(field2);
……
indexWriter.addDocument(doc);
indexWriter.close();
參數說明:
Document:負責搜集數據源,它可以從不同的物理文件提取數據並放入同一個Document中或從一個物理文件中提取出不同的數據並放入同一個Document中。
如下圖所示
二.搜索索引
1.lucene搜索的核心步驟:
String[]fields={「title」,「summary」,……};//要查找的field范圍
BooleanClause.Occur[]flags={BooleanClause.Occur.SHOULD, BooleanClause.Occur.MUST ,……};
Queryquery = MultiFieldQueryParser.parse(queryStr, fields,flags,new StandardAnalyzer());
Hitshits=newIndexSearcher(INDEX_STORE_PATH).search(query);
for (int i = 0;i < hitsLength ; i++)
{
Document doc = hits.doc(i);
String title = doc.get(「title」);
String summary = doc.get(「summary」);
//搜索出來的結果高亮顯示在頁面上
if (title != null) {
TokenStream tokenStream = analyzer.tokenStream(「title」,new StringReader(title));
String highlighterValue = highlighter.getBestFragment(tokenStream, title) ;
if(highlighterValue != null){
title = highlighterValue ;
}
//log.info("SearchHelper.search.title="+title);
}
if(summary!= null){
TokenStream tokenStream = analyzer.tokenStream(「summary」,new StringReader(summary));
String highlighterValue = highlighter.getBestFragment(tokenStream, creator) ;
if(highlighterValue != null){
summary = highlighterValue ;
}
//log.info("SearchHelper.search. summary ="+ summary);
}
}
2.結合平台構造搜索模塊
PageData類用來存放檢索結果集數據。
PageInfo類用來存放頁面相關信息例如,PageData對象集合、總記錄個數、每一頁的記錄數、總頁面數量等等。
SearchHelper用來充當整個搜索模塊的對外介面。
三.為平台組件添加索引的步驟(以知識中心為例)
1.在com.cscec.oa.searchengine.extend.mole目錄下添加一個新的package
例如:com.cscec.oa.searchengine.extend.mole.resourcestore
2.在新的目錄下建立data package並建立相應的數據類,並使這個數據類繼承BeanData。
例如:
package com.cscec.oa.searchengine.extend.mole.resourcestore.data
public class ResourceStoreBeanData extends BeanData{
}
3.與data package同一級目錄建立manager package並建立相應管理類,並使這個管理類繼承BeanDataManager
例如:
com.cscec.oa.searchengine.extend.mole.resourcestore.manager
public class extends BeanDataManager{
}
4.以管理員的身份登陸OA後,在菜單中找到「索引模塊管理」鏈接,將相應信息添加完成後,便可以在List頁面點擊「創建索引」對該模塊的數據進行索引的建立,建立完成後便可以進行查詢。
❷ java編程可以實現程序自動搜索百度某關鍵字然後獲取結果嗎
當然是可以的啊,用httpclient去模擬網頁提交,會返回給你一個網頁結果,也就是一個長的字元串,存放到java變數中,然後再在這個網頁中將你需要的內容拿出來就可以了。