利用Win32的網絡函數創建一個網絡瀏覽器 摘要 這篇技術性文章討論瞭如何利用Microsoft Win32網絡函數創建一個網絡瀏覽器。這篇文章的宗旨是讓讀者瞭解一些Win32網絡函數的作用、能力和使用範圍,而不是爲這些功能給出一個詳細的文檔。這篇文章所配合的SurfBear樣本應用程序使用Win32網絡函數從網絡服務器上讀取HTML文件,並把它們顯示成原始的、沒有經過格式化的文本。 介紹 不通過網絡,你就無法瞭解我的一個朋友。計算機雜誌已經在internet上設置了電子期刊,而本地的報紙也已經把整個段落都放到了網絡上。事實上,許多報紙都在聯機。每個人都有一個主頁,甚至一些無家可歸的人都有一個主頁。雖然有許多關於網絡的消息難免言過其實,但網絡正在變成計算機整體的一部分已經是無庸置疑的了。 Microsoft 已經介紹了Microsoft Win32網絡函數來協助開發者把網絡變成他們的應用程序的整體部分。這些新的功能簡化了使用FTP(文件傳輸協議)、和HTTP(超文本傳輸協議)訪問網絡。使用Win32網絡函數的開發者不需要對TCP/IP或Windows 配件。對於一些最普通的操作,開發者不需要知道他們正在使用的某個協議的細節。 最終,Win32網絡函數將成爲Win32應用程序接口的一部分並且與基於Windows的不同的平臺一起發佈。最初,Win32網絡函數將安裝在一個叫做WININET.DLL的再分佈式動態鏈接庫裏。(來自Microsoft網絡軟件開發工具包,其網址是:http://www.microsoft.com/inter/sdle/)。這屬於網絡開發工具包的一部分。 這篇文章說明了如何使用Win32網絡函數去創建一個簡單的網絡瀏覽器。它沒有具體詳細的討論這些功能的細節,但對他們的用法和操作給出了一個演示。請參考網址是http://www.microsoft.com/intdev/sdk/docs/wininet的Microsoft Win32網絡函數的主題,可以瞭解到全部的細節。 這篇文章是配合SurfBear樣本應用程序而創作的。SurfBear是一個HTML文件。覆蓋了這個過程種特定的網絡部分,但它沒有涉及與這個過程有關的用戶接口問題或HTML文件的顯示或操作問題。 注意:這篇文章是基於WININET.DLL一個相當早的版本。很可能其中的參數名、標識名和函數名發生了改變。但是函數的範圍和意圖應該還是和這篇文章中描述的是一致的。 網絡函數 最好的探討Win32網絡函數的方法是直接進入代碼。下面的代碼是樣本的代碼,爲了方便閱讀,錯誤處理部分已經被刪除掉了。 HINTERNET hNet = ::InternetOpen("MSDN SurfBear", PRE_CONFIG_INTERNET_ACCESS, NULL, INTERNET_INVALID_PORT_NUMBER, 0) ; HINTERNET hUrlFile = ::InternetOpenUrl(hNet, "http://www.microsoft.com", NULL, 0, INTERNET_FLAG_RELOAD, 0) ; char buffer[10*1024] ; DWORD dwBytesRead = 0; BOOL bRead = ::InternetReadFile(hUrlFile, buffer, sizeof(buffer), &dwBytesRead); ::InternetCloseHandle(hUrlFile) ; ::InternetCloseHandle(hNet) ; 上面列舉的代碼包括四個網絡函數:InternetOpen、InternetOpenOrl、InternetReadFile和InternetCloseHandle。下面我們依次對這些函數進行分析。 InternetOpen InternetOpen初始化WININET.DLL。它在其他的Win32網絡函數之前被調用。 HINTERNET hNet = ::InternetOpen( "MSDN SurfBear", // 1 LPCTSTR lpszCallerName PRE_CONFIG_INTERNET_ACCESS, // 2 DWORD dwAccessType "", // 3 LPCTSTR lpszProxyName INTERNET_INVALID_PORT_NUMBER, // 4 INTERNET_PORT nProxyPort 0 // 5 DWORD dwFlags ) ; InternetOpen返回一個類型爲HINTERNET的句柄。其他的Win32網絡函數把這個句柄當作一個參數。現在你不能把一個HINTERNET句柄用在類似於ReadFile之類的其他Win32函數中。但是隨着Microsoft Windows和Microsoft Windows NT網絡支持的成熟,這一點在將來不是不可能實現的。 當你已經結束使用Wein32網絡函數時,你應該調用InternetCloseHandle釋放InternetOpen分配的資源。使用Microsoft基礎類(MFC)的應用程序將從文件的構造程序裏象徵性地調用InternetOpen。絕大多數應用程序都將在每一進程裏調用InternetOpen。 InternetOpen 的第一個參數lpszCallerName指定正在使用網絡函數的應用程序。當HTTP協議使用時,這個名字將變成用戶代理。 第二個參數dwAccessType指定訪問類型。在上面的例子裏,PRE_CONFIG_INTERNET_ACCESS訪問類型指示Win32網絡函數使用登記信息去發現一個服務器。使用PRE_CONFIG_INTERNET_ACCESS需要正確設定登記信息。這裏我耍了一個小花招並讓網絡開發者替我登記註冊。如果你不想欺騙,你需要按圖1所示設定登記信息。 在登記註冊中,把AccessType設置爲1,則意味着“直接入網”,把AccessType 設置爲2,意味着“使用網關”。把DisableServiceLocation設置爲1,將讓它使用一個已經命名的服務器;否則將找到一個使用註冊信息和名字決議(RNR)應用程序接口的服務器,它是Windows接口的一部分。 其他的訪問類型包括以下幾種: LOCAL_INTERNET_ACCESS只連接到當地Internet網站。例如,如果我使用SurfBear標誌,我就只能訪問Microsoft整體的Internet網站。 CERN_PROXY_INTERNET_ACCESS使用一個CERN代理去訪問web。CERN代理是一個充當網關的web服務器並且能向要使用代理的服務器發送HTTP請求。 GATEWAY_INTERNET_ACCESS允許連接到World Wide Web。我可以用這個訪問類型去訪問web上的任何站點。 GATEWAY_PROXY_INTERNET_ACCESS和CERN_PROXY_ACCESS訪問類型要求第三個參數給InternetOpen:服務器名(lpszProxyName)。PRE_CONFIG_INTERNET_ACCESS不要求服務器名,因爲他可以爲服務器搜索寄存信息。 NProxyPort參數用在CERN_PROXY_INTERNET_ACCESS中用來指定使用的端口數。使用INTERNET_INVALID_PORT_NUMBER相當於提供卻省的端口數。 最後一個參數棗dwFlags,設置額外的選擇。你可以使用 INTERNET_FLAG_ASYNC標誌去指示使用返回句句柄的將來的Internet函數將爲回調函數發送狀態信息,使用InternetSetStatusCallback進行此項設置。 InternetOpenUrl 一旦你把Win32網絡函數初始化了,你就可以使用其他網絡函數。下一個要調用的Internet 函數是InternetOpenUrl。這個函數連接到一個網絡服務器上並且最被從服務器上讀取數據。InternetOpenUrl能對FTP,Gopher或HTTP協議起作用。在這篇文章中,我們只涉及HTTP協議。 HINTERNET hUrlFile = ::InternetOpenUrl( hNet, // 1 HINTERNET hInternetSession "http://www.microsoft.com", // 2 LPCTSTR lpszUrl NULL, // 3 LPCTSTR lpszHeaders 0, // 4 DWORD dwHeadersLength INTERNET_FLAG_RELOAD, // 5 DWORD dwFlags 0 // 6 DWORD dwContext ) ; InternetOpenUrl也返回一個HINTERNET,它被傳遞給在這個URL(統一資源定位)上操作的函數。你應該使用InternetClose來關閉這個句柄的處理。 InternetOpenUrl的第一個參數hInternetSession是從InternetOpen返回的句柄。第二個參數lpszUrl是我們需要的資源的URL(統一資源定位)。在上面的例子中,我們想得到一個Microsoft的web主頁。下面兩個參數lpszHeaders和HeaderLength用來向服務器傳送額外的信息。使用這些參數要求具有正在使用的特定協議的知識。 DwFlag是一個可以用幾種方式修改InternetOpenUrl行爲的標誌,InternetOpenUrl的行爲包括關閉、隱藏,使原始數據可用和用存在的連接取代開闢一個新的連接。 最後一個參數dwContext是一個 DWORD上下文值。如果有一個值已經被指定,它將被送到狀態回調函數。如果這個值是0,信息將不會被送到狀態回調函數。 InternetReadFile 你打開一個文件後,就要讀它,所以下一個函數是InternetReadFile是符合邏輯的: char buffer[10*1024] ; DWORD dwBytesRead = 0; BOOL bRead = ::InternetReadFile( hUrlFile, // 1 HINTERNET hFile buffer, // 2 LPVOID lpBuffer sizeof(buffer), // 3 DWORD dwNumberOfBytesToRead &dwBytesRead // 4 LPDWORD lpdwNumberOfBytesRead ); buffer[dwBytesRead] = 0 ; pEditCtrl->SetWindowText(buffer) ; InternetReadFile接收InternetOpenUrl返回的句柄。它也對其他Win32網絡函數,例如FtpOpenFile,FopherOpenFile和HttpOpenRequest返回的句柄有影響。 剩下的InternetReadFile的三個參數也非常的明白直接。Inbuffer是指向保留數據的緩衝區的一個無返回值指針,dwNumberOfByteToRead以字節爲單位指定緩衝區的尺寸。最後一個參數,lpdwNumberOfBytesRead是一個指向包含讀入緩衝區字節數的變量的指針。如果返回值是TRUE,而且lpdwNumberOfBytesRead指向0,則文件已經讀到了文件的末尾。這個行爲與Win32 Re3adFile的函數的行爲是一致的。一個真正的web瀏覽器將在InternetReadFile上循環 ,不停地從Internet上讀入數據塊。 爲了顯示緩衝區,向緩衝區添加一個0並把它送到編輯器控制。 這樣,InternetOpen、InternetOpenUrl和InternetReadFile一起創建了Internet瀏覽器的基礎。他們使從Internet上讀取文件就象從你的本地硬盤驅動器上讀取文件一樣容易。 HTTP函數 在一些例子中,InternetOpenUrl太普通了,所以你可能需要其他的Win32網絡函數。InternetOpenUrl相當與不同的FTP,GOPHER和HTTP函數的封皮。當使用HTTP時,InternetOpenUrl調用InternetConnect,HttpOpenRequest以及HttpSendRequest,比如說我們想要在下載一個HTML頁之前得到它的尺寸以便於我們在緩衝區中爲其分配適當的尺寸,HttpQueryInfo將得到web頁的大小。 警告:不是所有web 頁都支持得到頁尺寸。(例如:www.toystory.com和www.movielink.com不支持這個功能)另外,TCP/IP能傳遞的數據也比要求的要少。所以,你的應用程序應該處理着兩種情況並且圍繞InternetReadFile循環直到結果爲TRUE同時*lpdwNumberOfBytesRead爲0。 使用HttpOpenRequest,HttpSendRequest和HttpQueryInfo去打開文件http://www.microsoft.com/msdn/msdninfo的代碼顯示如下,錯誤檢測已經被刪除。 // Open Internet session. HINTERNET hSession = ::InternetOpen("MSDN SurfBear", PRE_CONFIG_INTERNET_ACCESS, NULL, INTERNET_INVALID_PORT_NUMBER, 0) ; // Connect to www.microsoft.com. HINTERNET hConnect = ::InternetConnect(hSession, "www.microsoft.com", INTERNET_INVALID_PORT_NUMBER, "", "", INTERNET_SERVICE_HTTP, 0, 0) ; // Request the file /MSDN/MSDNINFO/ from the server. HINTERNET hHttpFile = ::HttpOpenRequest(hConnect, "GET", "/MSDN/MSDNINFO/", HTTP_VERSION, NULL, 0, INTERNET_FLAG_DONT_CACHE, 0) ; // Send the request. BOOL bSendRequest = ::HttpSendRequest(hHttpFile, NULL, 0, 0, 0); // Get the length of the file. char bufQuery[32] ; DWORD dwLengthBufQuery = sizeof(bufQuery); BOOL bQuery = ::HttpQueryInfo(hHttpFile, HTTP_QUERY_CONTENT_LENGTH, bufQuery, &dwLengthBufQuery) ; // Convert length from ASCII string to a DWORD. DWORD dwFileSize = (DWORD)atol(bufQuery) ; // Allocate a buffer for the file. char* buffer = new char[dwFileSize+1] ; // Read the file into the buffer. DWORD dwBytesRead ; BOOL bRead = ::InternetReadFile(hHttpFile, buffer, dwFileSize+1, &dwBytesRead); // Put a zero on the end of the buffer. buffer[dwBytesRead] = 0 ; // Close all of the Internet handles. ::InternetCloseHandle(hHttpFile); ::InternetCloseHandle(hConnect) ; ::InternetCloseHandle(hSession) ; // Display the file in an edit control. pEditCtrl->SetWindowText(buffer) ; InternetConnect InternetConnet函數連接到一個HTTP,FTP或Gopher服務器: HINTERNET hConnect = ::InternetConnect( hSession, //1 HINTERNET hInternetSession "www.microsoft.com", //2 LPCTSTR lpszServerName INTERNET_INVALID_PORT_NUMBER, //3 INTERNET_PORT nServerPort "", //4 LPCTSTR lpszUsername "", //5 LPCTSTR lpszPassword INTERNET_SERVICE_HTTP, //6 DWORD dwService 0, //7 DWORD dwFlags O //8 DWORD dwContext ) ; 第六個參數dwService決定服務類型(HTTP,FTP或Gopher)。在上面的例子中,InternetConnect連接到一個HTTP服務器上,因爲dwService被設置成INTERNET_SERVICE_HTTP。第二個參數(設置成www.microsoft.com)提供了服務器的地址。注意,HTTP地址必須爲服務器名作語法分析,InternetOpenUrl爲我們作語法分析。第一個參數hInternetSession是從InternetOpen返回的句柄。第四個、第五個參數提供一個用戶姓名和密碼 。這七個參數沒有控制任何標誌影響HTTP操作。最後一個參數爲狀態回調函數提供前後關係的信息。 HttpOpenRequest 一旦和服務器的連接已經建立,我們打開了想要的文件。HttpOpenRequest和HttpSenRequest一起工作打開文件。HttpOpenRequest去創建一個請求句柄並且把參數存儲在句柄中。HttpOpenRequest把請求參數送到HTTP服務器。 HINTERNET hHttpFile = ::HttpOpenRequest( hConnect, // 1 HINTERNET hHttpSession "GET", // 2 LPCTSTR lpszVerb "/MSDN/MSDNINFO/", // 3 LPCTSTR lpszObjectName HTTP_VERSION, // 4 LPCTSTR lpszVersion NULL, // 5 LPCTSTR lpszReferer 0, // 6 LPCTSTR FAR * lplpszAcceptTypes INTERNET_FLAG_DONT_CACHE, // 7 DWORD dwFlags 0 // 8 DWORD dwContext ) ; 到現在爲止,網絡函數的許多參數看起來都類似。HttpOpenResult的第一個參數是由InternetConnet返回的 HINTERNET。HttpOpenRequest的第七和第八個參數執行與InternetConnect中有相同名字的參數一樣的功能。 第二個參數(“GET”)指定我們想要得到由第三個參數(“/MSDN/MSDNINFO/”)命名的對象。HTTP版已經傳遞第四個參數;現在,它肯定是HTTP棗VERSION。因爲“GET”是最流行的動詞類型,HttpOpenRequest將爲這個參數接收一個空指針。 第五個參數lpszReferer是一個網點的地址。在這個網點上我們發現了我們現在想要看見的URL(統一資源定位)。換而言之,如果你在www.home.com上而且單擊了跳到www.microsoft.com的一個連接,第五個參數就是www.home.com。因爲它使你指向了目標URL(統一資源定位)。這個值可以爲空。第六個參數執行一個我們的程序接收的文件類型列表。把空值傳遞給HttpOpenRequest即通知了服務器只有文本文件可以被接收。 HttpSendRequest 除了傳送請求外,HttpSendRequest允許你傳送額外的HTTP標題給服務器。關於HTTP標題的信息可以在http://www.w3.org/ 上的最新的說明上找到。在這個例子中,HttpSendRequest的所有參數都被傳遞爲缺省值。 BOOL bSendRequest = ::HttpSendRequest( hHttpFile, // 1 HINTERNET hHttpRequest NULL, // 2 LPCTSTR lpszHeaders 0, // 3 DWORD dwHeadersLength 0, // 4 LPVOID lpOptional 0 // 5 DWORD dwOptionalLength ); HttpQueryInfo 爲了得到關於文件的信息,在調用HttpSendRequest後使用HttpQueryInfo函數: BOOL bQuery = ::HttpQueryInfo( hHttpFile, // 1 HINTERNET hHttpRequest HTTP_QUERY_CONTENT_LENGTH, // 2 DWORD dwInfoLevel bufQuery, // 3 LPVOID lpvBuffer &dwLengthBufQuery // 4 LPDWORD lpdwBufferLength ) ; 查詢的結構是字符串或lpvBuffer中的字符串列表。HTTP_QUERY_CONTENT_LENGTH查詢得到文件的長度。你可以使用HttpQueryInfo查詢大範圍的信息。要獲知詳細情形可查閱網點http://www.microsoft.com/intdev/sdk/docs/wininet上的Microsoft Win32網絡函數專題。 SurfBear樣本應用程序 SurBear樣本應用程序使用Win32網絡函數從Internet上得到文件並且在編輯器上顯示原始的HTML格式。SurfBear使用HttpOpenRequest和HttpSendRequest取代InternetOpenUrl,純粹是爲了演示的需要。 圖2 SurfBear 屏幕 SurfBear是一個MFC4.0版本的對話應用程序。它所有與Internet有關的功能都在InternetThread.h和InternetThread.cpp文件中。 從internet上讀取文件要花費相當數量的時間,所以從一個工作線程調用網絡函數是一個明智的主意。通過這種方式,當系統在等待得到數據時,應用程序的窗口能被改變尺寸和移動。 圖3顯示了SurfBear的控制流。 當用戶按下GOTO按鈕時,CsurfBearDlg::OnBtnGoto調用CinternetThread:GetWebPoge,傳遞想要的web頁的HTTP地址。GetWebPage把HTTP地址語法分析成服務器和對象名,存儲在CinternetThread的成員變量中。GetWebPage然後調用AfxBeginThread,它產生一個運行靜態成員函數的線程GetWebPage WorkerThread。如果網絡函數沒有被初始化,GetWebPageWorkerThread調用InternetOpen,然後它嘗試讀取想要的web頁。當GetWebPageWorkerThread結束時,它發送一個用戶定義的WM_READFILECOMPLETED消息給SurfBear對話框。OnReadFileCompleted處理這個消息並且把一個web頁複製到編輯器控制裏。 總結 Win32網絡函數使從FTP,Gopher和HTTP服務器上讀取信息就想從你的硬盤驅動器上讀取信息一樣容易。僅僅使用4個函數棗InternetOpen,InternetOpenUrl,InternetReadFile和InternetCloseHandle和很少的HTTP知識,你就可以寫一個簡單的網絡瀏覽器。 把這個簡單的瀏覽器變成一個工業性質的瀏覽器將要花費很多工作,包括 一些對HTTP的瞭解,對如何顯示HTML文件的瞭解和以及使用多線程方式的能力。Win32網絡函數將開發者從與TCP/IP,Windows Sockets和HTTP編程有關的大多數煩悶工作中解脫出來。
利用Win32的網絡函數創建一個網絡瀏覽器
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.