用Java讀取word中的數據

用Java簡單的讀取word文檔中的數據:
第一步:下載tm-extractors-0.4.jar
第二步:簡單的程序.(WordReader .java)
前提是你的E盤下有個Strust.doc文件。
import java.io.File;
import java.io.FileInputStream;
import org.textmining.text.extraction.WordExtractor;
public class WordReader {

 public static String readDoc(String doc) throws Exception {
  // 創建輸入流讀取doc文件
  FileInputStream in = new FileInputStream(new File(doc));
  WordExtractor extractor = null;
  String text = null;
  // 創建WordExtractor
  extractor = new WordExtractor();
  // 對doc文件進行提取
  text = extractor.extractText(in);
  return text;
 }
 /**
  * @param args
  */
 public static void main(String[] args) {
  // TODO Auto-generated method stub
        try{
         String text = WordReader.readDoc("E:/Strust.doc");
         System.out.println(text);
        }catch(Exception ex){
         ex.printStackTrace();
        }
 }
}
   
   這樣就簡單的完成了從word中讀取數據了。你可以把它生成一個txt的文件。
 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章