node爬蟲簡單demo

1.安裝node

2.新建一個文件夾,文件夾裏新建一個game.js

3.安裝模塊

在命令行輸入安裝模塊命令:npm install cheerio sync-request --save

4.這裏以taptap網站排行榜爲例:https://www.taptap.com/top/do...

5.想爬這個排行榜的榜單名字,檢查元素髮現dom結構如下

clipboard.png

4.js文件代碼如下

var request = require('sync-request');//獲取網頁內容

var cheerio = require('cheerio');//篩選網頁內容

url = 'https://www.taptap.com/top/do...';//爬蟲網站

var html = '';

html = request('GET', url).getBody().toString();

var $ = cheerio.load(html);

var gameName = $('.top-cardg-middle>a>h4').text();//獲取遊戲名稱

console.log(gameName);

5.然後在文件夾路徑下運行node game.js,結果如下

clipboard.png

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章