用paraserhtml如何解析本地html

public static  void htmlpaser(String path) throws ParserException, IOException{
             HashMap<String, String> cssmap=cssgetread.cssgetread(path);
             Node node;
       StringBuffer abstr = new StringBuffer(); 
       BufferedReader reader= new BufferedReader(new FileReader(new File(path))); 
       String temp=""; 
       while((temp=reader.readLine())!=null){ 
        abstr.append(temp); 
        } 
       String result =abstr.toString();   
          Lexer lexer=null;
         lexer = new Lexer( new Page(result, "GB2312"));
  
       
         lexer.setNodeFactory( new PrototypicalNodeFactory());
         List<Node> list=new ArrayList<Node>();
         while(null!=(node=lexer.nextNode())){
          list.add(node);
         
         }

//循環讀取list中node文本值

}

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章