在Eclipse中配置Heritrix-1.14.4版本


1.下載heritrix-1.14.4.zip和heritrix-1.14.4.src 並解壓,解壓heritrix-1.14.4.jar.

2.在eclipse下創建java project,命名爲比如heritrix,進入其工程的目錄,我的是F:\workspace\myeclipse\heritrix,刪除src文件夾。

3.copy解壓後的heritrix-1.14.4.zip文件夾下的lib,webapps,heritrix-1.14.4到F:\workspace\myeclipse\heritrix目錄下,並刪除F:\workspace\myeclipse\heritrix\heritrix-1.14.4目錄下的org和st兩個文件夾。

copy解壓後的heritrix-1.14.4.src 文件夾下的heritrix-1.14.4\src\java下的org和st兩個文件夾到F:\workspace\myeclipse\heritrix\heritrix-1.14.4\目錄下

4.修改heritrix-1.14.4文件夾名稱爲src

5.修改src\heritrix.properties文件中的heritrix.cmdline.admin = 爲 heritrix.cmdline.admin = admin:sun,這個就是要設置你的用戶名和密碼,可以隨便,中間是冒號。

6.將heritrix-1.14.4\src\resources\org\archive\util 下的tlds-alpha-by-domain.txt 文件,拷貝到eclipse下的Heritrix\src\org\archive\util目錄下(如果不添加這個會報異常)

6.刷新工程,把lib下的jar包全部添加到工程中,即點擊heritrix工程,右鍵屬性---java build path---libraries--- add jars選擇heritrix工程下lib所有jar。

7.運行org.archive.crawler.Heritrix類,在地址欄輸入http://localhost:8080/














發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章