1.安裝node
2.新建一個文件夾,文件夾裏新建一個game.js
3.安裝模塊
在命令行輸入安裝模塊命令:npm install cheerio sync-request --save
4.這裏以taptap網站排行榜爲例:https://www.taptap.com/top/do...
5.想爬這個排行榜的榜單名字,檢查元素髮現dom結構如下
4.js文件代碼如下
var request = require('sync-request');//獲取網頁內容var cheerio = require('cheerio');//篩選網頁內容
url = 'https://www.taptap.com/top/do...';//爬蟲網站
var html = '';
html = request('GET', url).getBody().toString();
var $ = cheerio.load(html);
var gameName = $('.top-cardg-middle>a>h4').text();//獲取遊戲名稱
console.log(gameName);
5.然後在文件夾路徑下運行node game.js,結果如下