Lazarus網抓。

原創

2020-06-20 09:27

獲取網頁數據可以使用fpHttpClient。處理html字符串可以使用正則或sax_html。

下面簡單寫下抓頁面的代碼：

program webscarpping;
uses fpHttpClient,classes,sax_html,dom_html,dom;
var HTMLString,url:string;
  doc:THTMLDocument;
  els: TDomNodeList;
  i: smallint;
begin
  url:='http://www.securitychina.com.cn/2018blh/Exhibitors_Detail.asp?NF=2018&UserID=3074';
  HTMLString:= TFPCustomHTTPClient.SimpleGet(url);
  readhtmlfile(doc,TStringStream.create(HTMLString));
  els := doc.GetElementsByTagName('td');
  for i:=0 to els.Count-1 do
      writeln(TDomElement(els[i]).textcontent);
  readln;
end.

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

lazarus：多行文本保存爲UTF8格式

找了好久，發現Lazarus中已經有這個函數。 uses LazUTF8Classes; ...... SaveStringsToFileUTF8(stringList.Lines, 'aaa.csv');

2020-07-02 01:42:46

lazarus中，用正則表達式對文本進行查找替換

需要對以下文本中的註釋進行替換： ''' import pandas as pd import numpy as np ''' import tushare as ts 使用RegExpr單元，代碼如下： reg1 := TR

2020-06-20 12:34:29

lazarus：使用DCPrc4進行字符串加密

lazarus默認沒有安裝DCPcrypt控件，需要從Package-online Package manager進行安裝，安裝速度很快。字符串加密： procedure TForm1.ButtonEnCryptClick(Sende

2020-06-20 11:23:41

Lazarus漢字與16進制互轉

我沒有修改代碼編輯器爲本地的編碼。默認使用utf-8.所以轉換總是要涉及解碼。 program Project1; uses SysUtils; var i: string; j:integer; k:shorts

2020-06-20 09:27:29

處理API中文亂碼的問題

在Lazarus使用API函數MessageBox中，直接使用中文標題和提示會出現亂碼。利用PChar+Utf8ToAnsi來轉下可以消除亂碼。 program Project1; uses Windows; begin M

2020-06-20 09:27:29

lazarus中的try except

讀取下txt文件試了下用try except來容錯file not found錯誤。發現運行的時候總是報錯。 program Project1; uses sysutils; const file_name='C:\Users\Fa

2020-06-20 09:27:29

LAZARUS遍歷文件夾/文件

1.遍歷所有文件夾。 program getfiles; uses Classes,sysutils; var sPath:string; L:TStringList; procedure getdir(path:string; v

2020-06-20 09:27:29

lazarus使用com組件

寫下lazarus裏調用com組件。這個大致和vb6裏面的寫法差不多。上手挺快。也是隻適用於win平臺。下面我就寫下讀取excel相關數據來舉個例子。 program excel; uses comobj,sysutils,Varia

2020-06-20 09:27:29

Lazarus改成一體式窗口,並把工程查看器移動到面板上

一、Lazarus改成一體式窗口，安裝以下3個包 AnchorDocking AnchorDockingDsgn spara_DockedFormEditor 二、把工程查看器集成到面板上拖動中間的大粗線，移動到面板上即可。

2020-06-14 15:21:39

python程序可視化探索：讓pyecharts更易用

''' Created by freepy. 2020/5/29 19:43:48 ''' import os from pyecharts import options as opts from pyecharts.charts

2020-06-14 01:32:41

catpy：創建label控件的參數

''' Created by catpy. 2020/6/9 14:05:37 ''' lbl = '###[name:label1,type:label,size:19,color:$008CFF,left:20,top:2

2020-06-14 01:32:41

catpy：pyechart遷徙圖的快速定製

運行界面：應該加上label。用到的文本： ("廣州", 55), ("北京", 66), ("杭州", 77), ("重慶", 88), ("哈爾濱",39), ("烏魯木齊",20) ("廣州", "上海"), ("

2020-06-14 01:32:41

lazarus：對treeview控件內容進行自然排序

有以下文件夾：用lazarus中的treeview控件顯示，默認是這樣的：現在我們需要按從小到大順序排列。先建一個 natural 模塊： unit natural; {$MODE OBJFPC}{$H+} // Natu

2020-06-14 01:32:41

生成了一個python計算器界面

2020-06-04 01:04:47

lazarus：對字符串列表進行自然排序

2020-06-04 01:04:36

24小時熱門文章

python gdal 安裝使用（Windows， python 3.6.8）

最新文章

最新評論文章