使用CURL進行模擬登錄

在信息採集的時候,要採集的站點可能需要登錄,這樣使用簡單的採集方式(例如file_get_contents)就無法做到了,我們可以利用PHP的CURL擴展庫來進行模擬登錄,下面給出代碼示例:

 $cookie_path = './'; //設置cookie保存路徑
 
        //-----登錄要提交的表單數據---------------
        $vars['username'] = '張三';
         $vars['pwd'] = '123';
         //-------------------------------------
        $method_post = true;
        //登錄提交的url地址(表單中的action的絕對地址)
         $url = 'http://****.com/login';
        //----------------------------
 
         $ch = curl_init();
        $params[CURLOPT_URL] = $url;    //請求url地址
        $params[CURLOPT_HEADER] = true; //是否返回響應頭信息
        $params[CURLOPT_RETURNTRANSFER] = true; //是否將結果返回
        $params[CURLOPT_FOLLOWLOCATION] = true; //是否重定向
        $params[CURLOPT_USERAGENT] = 'Mozilla/5.0 (Windows NT 5.1; rv:9.0.1) Gecko/20100101 Firefox/9.0.1';
 
        $postfields = '';
        foreach ($vars as $key => $value){
            $postfields .= urlencode($key) . '=' . urlencode($value) . '&';  
        }
 
        $params[CURLOPT_POST] = true;
        $params[CURLOPT_POSTFIELDS] = $postfields;
 
        //判斷是否有cookie,有的話直接使用
        if (isset($_COOKIE['cookie_jar']) && ($_COOKIE['cookie_jar'] || is_file($_COOKIE['cookie_jar'])))
        {
            $params[CURLOPT_COOKIEFILE] = $_COOKIE['cookie_jar']; //這裏判斷cookie
        }
        else
        {
            $cookie_jar = tempnam($cookie_path, 'cookie'); //產生一個cookie文件
            $params[CURLOPT_COOKIEJAR] = $cookie_jar; //寫入cookie信息
            setcookie('cookie_jar', $cookie_jar); //保存cookie路徑
        }
        curl_setopt_array($ch, $params); //傳入curl參數
        $content = curl_exec($ch); //執行
 
        echo '
';
        echo $content; //輸出登錄結果
        /*
        //---------登錄成功後再次請求其他地址,如果有多個可以循環執行---------
        echo '
';
        $nexturl = 'http://****.com/test';
        $params[CURLOPT_URL] = $nexturl;
        $params[CURLOPT_POSTFIELDS] = '';
        curl_setopt_array($ch, $params); //傳入curl參數
        $content = curl_exec($ch); //執行
        echo $content; //輸出請求結果
        //-------------------------------------------------
        */
        curl_close($ch); //關閉連接

注:如果遇到無法請求https站點的情況,可能是因爲無法驗證證書或者域名,只要在curl_setopt_array前增加以下兩項就可以了:

$params[CURLOPT_SSL_VERIFYPEER] = false;
$params[CURLOPT_SSL_VERIFYHOST] = false;


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章