Node.js是什麼?

(非原創,轉多方文章整合)

簡介

如果您聽說過 Node,或者閱讀過一些文章,宣稱 Node 是多麼多麼的棒,那麼您可能會想:“Node 究竟是什麼東西?”儘管不是針對所有人的,但 Node 可能是某些人的正確選擇。

爲試圖解釋什麼是 Node.js,本文探究了它能解決的問題,它如何工作,如何運行一個簡單應用程序,最後,Node 何時是和何時不是一個好的解決方案。本文不涉及如何編寫一個複雜的 Node 應用程序,也不是一份全面的 Node 教程。閱讀本文應該有助於您決定是否應該學習 Node,以便將其用於您的業務。

Node 旨在解決什麼問題?

Node 公開宣稱的目標是 “旨在提供一種簡單的構建可伸縮網絡程序的方法”。當前的服務器程序有什麼問題?我們來做個數學題。在 Java™ 和 PHP 這類語言中,每個連接都會生成一個新線程,每個新線程可能需要 2 MB 配套內存。在一個擁有 8 GB RAM 的系統上,理論上最大的併發連接數量是 4,000 個用戶。隨着您的客戶端基礎的增長,您希望您的 web 應用程序支持更多用戶,這樣,您必須添加更多服務器。當然,這會增加業務成本,尤其是服務器成本、運輸成本和人工成本。除這些成本上升外,還有一個技術問題:用戶可能針對每個請求使用不同的服務器,因此,任何共享資源都必須在所有服務器之間共享。例如,在 Java 中,靜態變量和緩存需要在每個服務器上的 JVMs 之間共享。這就是整個 web 應用程序架構中的瓶頸:一個服務器能夠處理的併發連接的最大數量。

Node 解決這個問題的方法是:更改連接連接到服務器的方式。每個連接都創建一個進程,該進程不需要配套內存塊,而不是爲每個連接生成一個新的 OS 線程(並向其分配一些配套內存)。Node 聲稱它絕不會死鎖,因爲它根本不允許使用鎖,它不會直接阻塞 I/O 調用。Node 還宣稱,運行它的服務器能支持數萬個併發連接。事實上,Node 通過將整個系統中的瓶頸從最大連接數量更改到單個系統的流量來改變服務器面貌。

現在您有了一個能處理數萬條併發連接的程序,那麼您能通過 Node 實際構建什麼呢?如果您有一個 web 應用程序需要處理這麼多連接,那將是一件很 “恐怖” 的事!那是一種 “如果您有這個問題,那麼它根本不是問題” 的問題。在回答上面的問題之前,我們先看看 Node 如何工作以及它被設計的如何運行。

Node 肯定不是什麼

沒錯,Node 是一個服務器程序。但是,它肯定不 像 Apache 或 Tomcat。那些服務器是獨立服務器產品,可以立即安裝並部署應用程序。通過這些產品,您可以在一分鐘內啓動並運行一個服務器。Node 肯定不是這種產品。Apache 能添加一個 PHP 模塊來允許開發人員創建動態 web 頁,使用 Tomcat 的程序員能部署 JSPs 來創建動態 web 頁。Node 肯定不是這種類型。

在 Node 的早期階段(當前是 version 0.4.6),它還不是一個 “運行就緒” 的服務器程序,您還不能安裝它,向其中放置文件,擁有一個功能齊全的 web 服務器。即使是要實現 web 服務器在安裝完成後啓動並運行這個基本功能,也還需要做大量工作。

Node 如何工作

Node 本身運行 V8 JavaScript。等等,服務器上的 JavaScript?沒錯,您沒有看錯。服務器端 JavaScript 是一個相對較新的概念,這個概念是大約兩年前在 developerWorks 上討論 Aptana Jaxer 產品時提到的(參見 參考資料)。儘管 Jaxer 一直沒有真正流行,但這個理念本身並不是遙不可及的 — 爲何不能在服務器上使用客戶機上使用的編程語言?

什麼使 V8?V8 JavaScript 引擎是 Google 用於他們的 Chrome 瀏覽器的底層 JavaScript 引擎。很少有人考慮 JavaScript 在客戶機上實際做了些什麼?實際上,JavaScript 引擎負責解釋並執行代碼。使用 V8,Google 創建了一個以 C++ 編寫的超快解釋器,該解釋器擁有另一個獨特特徵;您可以下載該引擎並將其嵌入任何 應用程序。它不僅限於在一個瀏覽器中運行。因此,Node 實際上使用 Google 編寫的 V8 JavaScript 引擎並將其重建爲在服務器上使用。太完美了!既然已經有一個不錯的解決方案可用,爲何還要創建一種新語言呢?

事件驅動編程

許多程序員接受的教育使他們認爲,面向對象編程是完美的編程設計,而對其他編程方法不屑一顧。Node 使用一個所謂的事件驅動編程模型。

清單 1. 客戶端上使用 jQuery 的事件驅動編程

// jQuery code on the client-side showing how Event-Driven programming works
 
// When a button is pressed, an Event occurs - deal with it
// directly right here in an anonymous function, where all the
// necessary variables are present and can be referenced directly
$("#myButton").click(function(){
     if ($("#myTextField").val() != $(this).val())
         alert("Field must match button text");
});

 

<span class="Apple-style-span" style="font-family: Georgia, 'Times New Roman', 'Bitstream Charter', Times, serif; font-size: 13px; line-height: 19px; white-space: normal;">實際上,服務器端和客戶端沒有任何區別。沒錯,這沒有按鈕點擊操作,也沒有向文本字段鍵入的操作,但在一個更高的層面上,事件正在 發生。一個連接被建立 — 事件!數據通過連接接收 — 事件!數據通過連接停止 — 事件!</span>

爲什麼這種設置類型對 Node 很理想?JavaScript 是一種很棒的事件驅動編程語言,因爲它允許匿名函數和閉包,更重要的是,任何寫過代碼的人都熟悉它的語法。事件發生時調用的回調函數可以在捕獲事件處編寫。這樣,代碼容易編寫和維護,沒有複雜的面向對象框架,沒有接口,沒有在上面架構任何內容的潛能。只需監聽事件,編寫一個回調函數,然後,事件驅動編程將照管好一切!

示例 Node 應用程序

最後,我們來看一些代碼!讓我們將討論過的所有內容綜合起來,創建我們的第一個 Node 應用程序。由於我們已經知道,Node 對於處理高流量應用程序很理想,我們就來創建一個非常簡單的 web 應用程序 — 一個爲實現最大速度而構建的應用程序。下面是 “老闆” 交代的關於我們的樣例應用程序的具體要求:創建一個隨機數字生成器 RESTful API。這個應用程序應該接受一個輸入:一個名爲 “number” 的參數。然後,應用程序返回一個介於 0 和該參數之間的隨機數字,並將生成的數字返回調用者。由於 “老闆” 希望它成爲一個廣泛流行的應用程序,因此它應該能處理 50,000 個併發用戶。我們來看看代碼:

清單 2. Node 隨機數字生成器

// these modules need to be imported in order to use them.
// Node has several modules.  They are like any #include
// or import statement in other languages
var http = require("http");
var url = require("url");
 
// The most important line in any Node file.  This function
// does the actual process of creating the server.  Technically,
// Node tells the underlying operating system that whenever a
// connection is made, this particular callback function should be
// executed.  Since we're creating a web service with REST API,
// we want an HTTP server, which requires the http variable
// we created in the lines above.
// Finally, you can see that the callback method receives a 'request'
// and 'response' object automatically.  This should be familiar
// to any PHP or Java programmer.
http.createServer(function(request, response) {
 
     // The response needs to handle all the headers, and the return codes
     // These types of things are handled automatically in server programs
     // like Apache and Tomcat, but Node requires everything to be done yourself
     response.writeHead(200, {"Content-Type": "text/plain"});
 
     // Here is some unique-looking code.  This is how Node retrives
     // parameters passed in from client requests.  The url module
     // handles all these functions.  The parse function
     // deconstructs the URL, and places the query key-values in the
     // query object.  We can find the value for the "number" key
     // by referencing it directly - the beauty of JavaScript.
     var params = url.parse(request.url, true).query;
     var input = params.number;
 
     // These are the generic JavaScript methods that will create
     // our random number that gets passed back to the caller
     var numInput = new Number(input);
     var numOutput = new Number(Math.random() * numInput).toFixed(0);
 
     // Write the random number to response
     response.write(numOutput);
 
     // Node requires us to explicitly end this connection.  This is because
     // Node allows you to keep a connection open and pass data back and forth,
     // though that advanced topic isn't discussed in this article.
     response.end();
 
   // When we create the server, we have to explicitly connect the HTTP server to
   // a port.  Standard HTTP port is 80, so we'll connect it to that one.
}).listen(80);
 
// Output a String to the console once the server starts up, letting us know everything
// starts up correctly
console.log("Random Number Generator Running...");

 

將上面的代碼放到一個名爲 “random.js” 的文件中。現在,要啓動這個應用程序並運行它(進而創建 HTTP 服務器並監聽端口 80 上的連接),只需在您的命令提示中輸入以下命令:% node random.js。下面是服務器已經啓動並運行時它看起來的樣子:

root@ubuntu:/home/moila/ws/mike# node random.js
Random Number Generator Running...

 

訪問應用程序

應用程序已經啓動並運行。Node 正在監聽任何連接,我們來測試一下。由於我們創建了一個簡單的 RESTful API,我們可以使用我們的 web 瀏覽器來訪問這個應用程序。鍵入以下地址(確保您完成了上面的步驟):http://localhost/?number=27。

您的瀏覽器窗口將更改到一個介於 0 到 27 之間的隨機數字。單擊瀏覽器上的 “重新載入” 按鈕,將得到另一個隨機數字。就是這樣,這就是您的第一個 Node 應用程序!

Node 對什麼有好處?

到此爲止,應該能夠回答 “Node 是什麼” 這個問題了,但您可能還不清楚什麼時候應該使用它。這是一個需要提出的重要問題,因爲 Node 對有一些東西有好處,但相反,對另一些東西而言,目前 Node 可能不是一個好的解決方案。您需要小心決定何時使用 Node,因爲在錯誤的情況下使用它可能會導致一個多餘編碼的 LOT。

它對什麼有好處?

正如您此前所看到的,Node 非常適合以下情況:您預計可能有很高的流量,而在響應客戶端之前服務器端邏輯和處理所需不一定是巨大的。Node 表現出衆的典型示例包括:

RESTful API

提供 RESTful API 的 web 服務接收幾個參數,解析它們,組合一個響應,並返回一個響應(通常是較少的文本)給用戶。這是適合 Node 的理想情況,因爲您可以構建它來處理數萬條連接。它還不需要大量邏輯;它只是從一個數據庫查找一些值並組合一個響應。由於響應是少量文本,入站請求時少量文本,因此流量不高,一臺機器甚至也可以處理最繁忙的公司的 API 需求。

Twitter 隊列

想像一下像 Twitter 這樣的公司,它必須接收 tweets 並將其寫入一個數據庫。實際上,每秒幾乎有數千條 tweets 達到,數據庫不可能及時處理高峯時段需要的寫入數量。Node 成爲這個問題的解決方案的重要一環。如您所見,Node 能處理數萬條入站 tweets。它能迅速輕鬆地將它們寫入一個內存排隊機制(例如 memcached),另一個單獨進程可以從那裏將它們寫入數據庫。Node 在這裏的角色是迅速收集 tweet 並將這個信息傳遞給另一個負責寫入的進程。想象一下另一種設計 — 一個常規 PHP 服務器自己試圖處理對數據庫的寫入 — 每個 tweet 將在寫入數據庫時導致一個短暫的延遲,這是因爲數據庫調用正在阻塞通道。由於數據庫延遲,一臺這樣設計的機器每秒可能只能處理 2000 條入站 tweets。每秒 100 萬條 tweets 需要 500 個服務器。相反,Node 能處理每個連接而不會阻塞通道,從而能捕獲儘可能多的 tweets。一個能處理 50,000 條 tweets 的 Node 機器只需要 20 個服務器。

映像文件服務器

一個擁有大型分佈式網站的公司(比如 Facebook 或 Flickr)可能會決定將所有機器只用於服務映像。Node 將是這個問題的一個不錯的解決方案,因爲該公司能使用它編寫一個簡單的文件檢索器,然後處理數萬條連接。Node 將查找映像文件,返回文件或一個 404 錯誤,然後什麼也不用做。這種設置將允許這類分佈式網站減少它們服務映像、.js 和 .css 文件等靜態文件所需的服務器數量。

它對什麼有壞處?

當然,在某些情況下,Node 並非理想選擇。下面是 Node 不擅長的領域:

動態創建的頁

目前,Node 沒有提供一種默認方法來創建動態頁。例如,使用 JavaServer Pages (JSP) 技術時,可以創建一個在這樣的 JSP 代碼段中包含循環的 index.jsp 頁。Node 不支持這類動態的、HTML 驅動的頁面。同樣,Node 不太適合作爲 Apache 和 Tomcat 這樣的網頁服務器。因此,如果您想在 Node 中提供這樣一個服務器端解決方案,必須自己編寫整個解決方案。PHP 程序員不想在每次部署 web 應用程序時都編寫一個針對 Apache 的 PHP 轉換器,當目前爲止,這正是 Node 要求您做的。

關係數據庫重型應用程序

Node 的目的是快速、異步和非阻塞。數據庫並不一定分享這些目標。它們是同步和阻塞的,因爲讀寫時對數據庫的調用在結果生成之前將一直阻塞通道。因此,一個每個請求都需要大量數據庫調用、大量讀取、大量寫入的 web 應用程序非常不適合 Node,這是因爲關係數據庫本身就能抵銷 Node 的衆多優勢。(新的 NoSQL 數據庫更適合 Node,不過那完全是另一個主題了。)

結束語

問題是 “什麼是 Node.js?” 應該已經得到解答。閱讀本文之後,您應該能通過幾個清晰簡潔的句子回答這個問題。如果這樣,那麼您已經走到了許多編碼員和程序員的前面。我和許多人都談論過 Node,但它們對 Node 究竟是什麼一直很迷惑。可以理解,他們具有的是 Apache 的思維方式 — 服務器是一個應用程序,將 HTML 文件放入其中,一切就會正常運轉。而 Node 是目的驅動的。它是一個軟件程序,使用 JavaScript 來允許程序員輕鬆快速地創建快速、可伸縮的 web 服務器。Apache 是運行就緒的,而 Node 是編碼就緒的。

Node 完成了它提供高度可伸縮服務器的目標。它並不分配一個 “每個連接一個線程” 模型,而是使用一個 “每個連接一個流程” 模型,只創建每個連接需要的內存。它使用 Google 的一個非常快速的 JavaScript 引擎:V8 引擎。它使用一個事件驅動設計來保持代碼最小且易於閱讀。所有這些因素促成了 Node 的理想目標 — 編寫一個高度可伸縮的解決方案變得比較容易。

與理解 Node 是 什麼同樣重要的是,理解它不是 什麼。Node 並不是 Apache 的一個替代品,後者旨在使 PHP web 應用程序更容易伸縮。事實確實如此。在 Node 的這個初始階段,大量程序員使用它的可能性不大,但在它能發揮作用的場景中,它的表現非常好。

 

Node.js is the New Black

    如果你去年注意過技術方面的新聞,我敢說你至少看到node.js不下一兩次。那麼問題來了“node.js是什麼?”。有些人沒準會告訴你“這是一種通過JavaScript語言開發web服務端的東西”。如果這種晦澀解釋還沒把你搞暈,你沒準會接着問:“爲什麼我們要用node.js?”,別人一般會告訴你:node.js有非阻塞,事件驅動I/O等特性,從而讓高併發(high concurrency)在的輪詢(Polling)和comet構建的應用中成爲可能。

    當你看完這些解釋覺得跟看天書一樣的時候,你估計也懶得繼續問了。不過沒事。我這篇文章就是在避開高端術語的同時,幫助你你理解node.js的。

    瀏覽器給網站發請求的過程一直沒怎麼變過。當瀏覽器給網站發了請求。服務器收到了請求,然後開始搜尋被請求的資源。如果有需要,服務器還會查詢一下數據庫,最後把響應結果傳回瀏覽器。不過,在傳統的web服務器中(比如Apache),每一個請求都會讓服務器創建一個新的進程來處理這個請求。

    後來有了Ajax。有了Ajax,我們就不用每次都請求一個完整的新頁面了,取而代之的是,每次只請求需要的部分頁面信息就可以了。這顯然是一個進步。但是比如你要建一個FriendFeed這樣的社交網站(類似人人網那樣的刷朋友新鮮事的網站),你的好友會隨時的推送新的狀態,然後你的新鮮事會實時自動刷新。要達成這個需求,我們需要讓用戶一直與服務器保持一個有效連接。目前最簡單的實現方法,就是讓用戶和服務器之間保持長輪詢(long polling)。

    HTTP請求不是持續的連接,你請求一次,服務器響應一次,然後就完了。長輪訓是一種利用HTTP模擬持續連接的技巧。具體來說,只要頁面載入了,不管你需不需要服務器給你響應信息,你都會給服務器發一個Ajax請求。這個請求不同於一般的Ajax請求,服務器不會直接給你返回信息,而是它要等着,直到服務器覺得該給你發信息了,它纔會響應。比如,你的好友發了一條新鮮事,服務器就會把這個新鮮事當做響應發給你的瀏覽器,然後你的瀏覽器就刷新頁面了。瀏覽器收到響應刷新完之後,再發送一條新的請求給服務器,這個請求依然不會立即被響應。於是就開始重複以上步驟。利用這個方法,可以讓瀏覽器始終保持等待響應的狀態。雖然以上過程依然只有非持續的Http參與,但是我們模擬出了一個看似持續的連接狀態

    我們再看傳統的服務器(比如Apache)。每次一個新用戶連到你的網站上,你的服務器就得開一個連接。每個連接都需要佔一個進程,這些進程大部分時間都是閒着的(比如等着你好友發新鮮事,等好友發完纔給用戶響應信息。或者等着數據庫返回查詢結果什麼的)。雖然這些進程閒着,但是照樣佔用內存。這意味着,如果用戶連接數的增長到一定規模,你服務器沒準就要耗光內存直接癱了。

    這種情況怎麼解決?解決方法就是剛纔上邊說的:非阻塞事件驅動。這些概念在我們談的這個情景裏面其實沒那麼難理解。你把非阻塞的服務器想象成一個loop循環,這個loop會一直跑下去。一個新請求來了,這個loop就接了這個請求,把這個請求傳給其他的進程(比如傳給一個搞數據庫查詢的進程),然後響應一個回調(callback)。完事了這loop就接着跑,接其他的請求。這樣下來。服務器就不會像之前那樣傻等着數據庫返回結果了。

    如果數據庫把結果返回來了,loop就把結果傳回用戶的瀏覽器,接着繼續跑。在這種方式下,你的服務器的進程就不會閒着等着。從而在理論上說,同一時刻的數據庫查詢數量,以及用戶的請求數量就沒有限制了。服務器只在用戶那邊有事件發生的時候才響應,這就是事件驅動。

    FriendFeed是用基於Python的非阻塞框架Tornado (知乎也用了這個框架) 來實現上面說的新鮮事功能的。不過,Node.js就比前者更妙了。Node.js的應用是通過javascript開發的,然後直接在Google的變態V8引擎上跑。用了Node.js,你就不用擔心用戶端的請求會在服務器裏跑了一段能夠造成阻塞的代碼了。因爲javascript本身就是事件驅動的腳本語言。你回想一下,在給前端寫javascript的時候,更多時候你都是在搞事件處理和回調函數。javascript本身就是給事件處理量身定製的語言。

    Node.js還是處於初期階段。如果你想開發一個基於Node.js的應用,你應該會需要寫一些很底層代碼。但是下一代瀏覽器很快就要採用WebSocket技術了,從而長輪詢也會消失。在Web開發裏,Node.js這種類型的技術只會變得越來越重要。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章