導航:首頁 > 編程語言 > java文本分析

java文本分析

發布時間:2023-03-15 16:12:22

『壹』 java中的文本分析

BufferedReader br = new BufferedReader(new FileReader(要找的文件路徑));
StringBuffer sb = br.readLine();
Pattern pattern = pattern.compile("(//d{3})(//d{3})(//d{1})(//d{10})");
Matcher m = pattern.matcher(sb);
while(m.find()) {
System.out.println(m.group());
}

可能不是您要的解決方法。不過大多數查找數據都是這個思路。

『貳』 有人用java寫過文本分類系統

文本分類的重點不在分類,而在怎麼樣描述文本模型和提取文檔中的terms並把它數字化,轉化為分類器可以使用的輸入類型。這前面的處理直接關繫到後面分分類效果。就文本模型而言,現在普遍使用的還是Salton 和 McGill的Vector Space Model, 通過TF-IDF統計,如果是英文的話,要進行語義層次的抽象, 這方面可以使用wordNet,網上可以找到JAVA wordnet 的API,,個人認為比較好的是JWNL 如果是中文的話,涉及到分詞, 中科院計算所分詞系統ICTCLAS, 可到其網站上下載免費版。
至於JAVA寫的分類器很多,常用的比如說Weka, RapidMiner(這個相當不錯,有專門的Web data Mining的擴展包,是我的最愛),這些都可以自己調用其介面實現新的演算法。個人強烈推薦使用RapidMiner,功能相當強大,幾乎實現了當前的所有機器學習的演算法,並且操縱簡便。
學習提示:不要剛開始就希望效果很好,急躁是做學問的大敵,肯定會出現一些意想不到的問題,最主要是勤於思考,善於查找問題,慢慢改進,一個問題,如果比較難,回到它最原始最簡單的問題上去。祝你學業進步。

『叄』 關於java正則表達式解析文本

交易數據的正則是
^\\s+\\d+\\s+\\d+$
說下思路,逐行處理
如果讀到了買入,那直到讀到賣出為止,所有匹配上面正則的行都按買入的方式處理
如果讀到賣出,那直到讀到買入為止,所有匹配上面正則的行都按賣出的方式處理

『肆』 java源代碼分析 實在是不太會,求高手教教我。

packagetest2;

importjava.io.BufferedReader;
importjava.io.File;
importjava.io.FileInputStream;
importjava.io.FileOutputStream;
importjava.io.IOException;
importjava.io.InputStream;
importjava.io.InputStreamReader;
importjava.util.HashMap;
importjava.util.Map;
importjava.util.Set;

publicclassJavaCodeAnalyzer{
publicstaticvoidanalyze(Filefile)throwsIOException{
//FileOutputStreamfos=newFileOutputStream("F;"+File.separator+"result.txt");
if(!(file.getName().endsWith(".txt")||.getName().endsWith(".java"))){
System.out.println("輸入的分析文件格式不對!");
}
InputStreamis=newFileInputStream(file);
BufferedReaderbr=newBufferedReader(newInputStreamReader(is));
Stringtemp;
intcount=0;
intcountSpace=0;
intcountCode=0;
intcountDesc=0;
Map<String,Integer>map=getKeyWords();
while((temp=br.readLine())!=null){
countKeys(temp,map);
count++;
if(temp.trim().equals("")){
countSpace++;
}elseif(temp.trim().startsWith("/*")||temp.trim().startsWith("//")){
countDesc++;
}else{
countCode++;
}
}
System.out.printf("代碼行數:"+countCode+"占總行數的%4.2f ",(double)countCode/count);
System.out.printf("空行數:"+countSpace+"占總行數的%4.2f ",(double)countSpace/count);
System.out.printf("注釋行數:"+countDesc+"占總行數的%4.2f ",(double)countDesc/count);
System.out.println("總行數:"+count);
System.out.println("出現最多的5個關鍵字是:");
System.out.println("");
System.out.println("");
System.out.println("");
System.out.println("");
System.out.println("");
}
publicstaticvoidmain(String[]args){
getKeyWords();
Filefile=newFile("F://Test.java");
try{
analyze(file);
}catch(IOExceptione){
//TODO自動生成catch塊
e.printStackTrace();
}
}
publicstaticMap<String,Integer>getKeyWords(){
Map<String,Integer>map=newHashMap<String,Integer>();
String[]keywords={"abstract","assert","boolean","break","byte","case","catch","char","class","continue","default","do","double","else","enum","extends","final","finally","float","for","if","implements","import","instanceof","int","interface","long","native","new","package","private","protected","public","return","strictfp","short","static","super","switch","synchronized","this","throw","throws","transient","try","void","volatile","while","goto","const"};
for(Strings:keywords){
map.put(s,0);
}
returnmap;
}
publicstaticvoidcountKeys(Strings,Map<String,Integer>map){
Set<String>keys=map.keySet();
for(Stringss:keys){
if(s.indexOf(ss)!=-1){
map.put(ss,map.get(ss)+1);
}
}
}
}

上班沒啥時間了,還有點沒寫完,你在想想。

『伍』 java 文本解析成List<map>集合

List<Map<String,String>>dataList=newArrayList<Map<String,String>>();
Map<String,String>dataMap=newHashMap<String,String>();
dataMap.put("interfacetime","2006-12-1100:37:38");
dataMap.put("ip","172.30.27.33");
dataMap.put("type","windows");
dataMap.put("patrolagenttime","2006-12-1100:37:38");
dataMap.put("NT_HEALTH/NT_HEALTH/ProcessorUtilization","-999.999");

//這里只是添加了一個map,你可以定回義多個map,按照上面的格式答,放入這個list就OK
dataList.add(dataMap);

『陸』 Java 文本處理問題

參考代碼,細節可以適當修改

importjava.io.*;
importjava.util.*;

publicclassMyDemo{

publicstaticvoidmain(String[]args){
ArrayList<Integer>list=newArrayList<Integer>();
readNumInFile(list,"d:\File1.txt");//讀取File1存入集合
readNumInFile(list,"d:\File2.txt");//讀取File2存入集合
Collections.sort(list);//集合從大到小排序
writeNumToFile(list,"d:\File3.txt");//把集合寫入到File3
}
publicstaticvoidreadNumInFile(ArrayList<Integer>list,StringfilePath){
BufferedReaderbuf=null;
try{
buf=newBufferedReader(newFileReader(filePath));
Stringstr;
String[]ss;
while((str=buf.readLine())!=null){
System.out.println(str);
ss=str.trim().split("");
for(Strings:ss){
list.add(Integer.parseInt(s));//向集合里添加元素
}
}
buf.close();
}catch(Exceptione){
e.printStackTrace();
}
}
(ArrayList<Integer>list,StringfilePath){
try{
//把集合的數據轉成字元串
Stringstr="";
for(Integerx:list){
str=str+x+"";
}
System.out.println(str);
FileWriterfw=newFileWriter(filePath);
fw.write(str);//文本里寫入字元串數據
fw.close();
}catch(IOExceptione){
e.printStackTrace();
}
}
}

測試

186572
8802-5
-50122567888

『柒』 Java輸入一個文本文件,裡面是英文,然後進行詞頻分析,要將虛詞剔除來,這個怎麼實現啊

final String[] functionWords ={"on"掘基,"for"..,}
英文虛詞也就那個幾個,先寫個數組把虛詞都放進去
String[] array=String.split("告虧\n");
把文本按空格分開放到數組array里
用Map<String,int>來做詞頻分析,key是array的里的詞,value是出現次數
拿array的每一個和map的key做比較,如果map中有,則value+1,如果沒有襪散神則put(array[i],1);
關於剔除虛詞,拿map的key和functionWords對比如果不相同則輸出相應的key和value

『捌』 java解析txt里的數據

這個是文本流,先把文本讀到內存中,再根據固定的格式去解析。按照換行解析
List<Student> list=new ArrayList<Student>();
String encoding = "GBK";

File file = new File("c:/test.txt");

if (file.isFile() && file.exists()) {
InputStreamReader read = new InputStreamReader( new FileInputStream(file), encoding);
BufferedReader bufferedReader = new BufferedReader(read);
String lineTXT = null;
while ((lineTXT = bufferedReader.readLine()) != null) {
String [] stuAttr=lineTXT.toString().split(",");
Student student=new Student();
//解析stuAttr數組封裝Student對象
list.add(student);
}
read.close();
}else{
System.out.println("找不到指定的文件!");
}

『玖』 Java解析復雜文本

可以試試正則表達式,字元串split打散。

閱讀全文

與java文本分析相關的資料

熱點內容
我的世界什麼版本好玩 瀏覽:341
控制專碩如何報考編程 瀏覽:534
元祖在編程里是什麼意思 瀏覽:491
小碼王為什麼比核桃編程貴 瀏覽:627
qq下載app有哪些 瀏覽:380
旅遊app的社區模塊有什麼 瀏覽:847
盜版win7怎樣升級win10 瀏覽:524
怎麼壓縮文件夾不超過10mb 瀏覽:770
網路攝像頭如何外網訪問 瀏覽:178
刷入的cp文件是什麼 瀏覽:513
dcp文件是什麼 瀏覽:427
win10驅動刪不了怎麼辦啊 瀏覽:459
win7如何做共享文件夾圖標 瀏覽:178
魔獸120怎麼升級124 瀏覽:395
智能健康手錶下載什麼app 瀏覽:664
想在協和醫院掛號怎麼下載app 瀏覽:86
關於科技產品需要哪些數據 瀏覽:623
linux命令行修改文件內容 瀏覽:526
java通信框架有哪些 瀏覽:331
哪裡看美國報紙app 瀏覽:753

友情鏈接