使用aardio抓取網頁數據

項目說明:【抓取網頁數據】

項目介紹:
採集指定網頁內容,通過模式匹配匹配到要採集的數據格式返回到數組中

項目步驟:
1.創建匹配模式表
2.請求網頁連接
3.過濾文本,並對數據去重處理
4.顯示結果

效果展示:   

使用aardio抓取網頁數據

完整代碼:

    import console; 
/*
項目說明:【抓取網頁數據】
項目介紹:
    採集指定網頁內容,通過模式匹配匹配到要採集的數據格式返回到數組中
項目步驟:
    1.創建匹配模式表
    2.請求網頁連接
    3.過濾文本,並對數據去重處理
    4.顯示結果
*/
//參考來源:http://bbs.aardio.com/forum.php?mod=viewthread&tid=11218&extra=page%3D1

import web.rest.jsonClient;

var httpUrl="http://www.meijumi.vip/usa/katong/5754.html";

//1.獲取用於查找的模式匹配數組
var parttern = {};
table.push(parttern, `ed2k\://[^\s"']+`);

//2.請求網頁鏈接
var http = web.rest.jsonClient();
var magnet = http.api(httpUrl,,parttern);
var urls = magnet.get();

//console.log("採集到的數據列表:");
//for(k,v in urls){ 
//  console.log(k, v);
//}

//3.過濾文本,並對數據去重處理
var resultStr="";
if(urls){
    var f = `S01E`;//過濾文本
    if(#f){
        //篩選結果
        urls = table.filter(urls, function(v){
            return string.find(v,f); 
        })  

        urls = table.unique(urls);//數組去重
    } 
    //提取結果
    resultStr = string.join(urls,'\r\n');//將字符串數組使用指定的分隔符合併爲一個字符串   
}

//4.顯示結果
console.log("採集結果:", resultStr)

console.pause(true);
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章