【架構性能分析(2)】Tomcat 配置優化

前言

作爲一個系統管理員(運維/架構師),我們時刻關注服務的變化情況,今天分享一篇關於Tomcat 配置優化相關性的文章。

Tomcat主配文件Service.xml解說

Server:元素是整個配置文件的根元素。表示整個Catalina容器。

  • className:實現了org.apache.catalina.Server接口的類名,標準實現類是org.apache.catalina.core.StandardServer類。
  • Port:Tomcat服務器監聽用於關閉Tomcat服務器的命令(必須)
  • Shutdown:發送到端口上用於關閉Tomcat服務器的命令。

例:

<Serverport="8005" shutdown="SHUTDOWN">

Connector:元素連接器,負責接收客戶的請求,以及向客戶端回送響應的消息。

HTTP連接器-屬性
  • allowTrace:是否允許HTTP的TRACE方法,默認爲false
  • emptySessionPath:如果設置爲true,用戶的所有路徑都將設置爲/,默認爲false。
  • enableLookups:調用request、getRemoteHost()執行DNS查詢,以返回遠程主機的主機名,如果設置爲false,則直接返回IP地址。
  • maxPostSize:指定POST方式請求的最大量,沒有指定默認爲2097152。
  • protocol:值必須爲HTTP1.1,如果使用AJP處理器,該值必須爲AJP/1.3
  • proxyName:如這個連接器正在一個代理配置中被使用,指定這個屬性,在request.getServerName()時返回
  • redirectPort:如連接器不支持SSL請求,如收到SSL請求,Catalina容器將會自動重定向指定的端口號,讓其進行處理。
  • scheme:設置協議的名字,在request.getScheme()時返回,SSL連接器設爲”https”,默認爲”http”
  • secure:在SSL連接器可將其設置爲true,默認爲false
  • URIEncoding:用於解碼URL的字符編碼,沒有指定默認值爲ISO-8859-1
  • useBodyEncodingForURI:主要用於Tomcat4.1.x中,指示是否使用在contentType中指定的編碼來取代URIEncoding,用於解碼URI查詢參數,默認爲false
  • xpoweredBy:爲true時,Tomcat使用規範建議的報頭表明支持Servlet的規範版本,默認爲false
  • acceptCount:當所有的可能處理的線程都正在使用時,在隊列中排隊請求的最大數目。當隊列已滿,任何接收到的請求都會被拒絕,默認值爲10
  • bufferSize:設由連接器創建輸入流緩衝區的大小,以字節爲單位。默認情況下,緩存區大的大小爲2048字節
  • compressableMimeType:MIME的列表,默認以逗號分隔。默認值是text/html,text/xml,text/plain
  • compression:指定是否對響應的數據進行壓縮。off:表示禁止壓縮、on:表示允許壓縮(文本將被壓縮)、force:表示所有情況下都進行壓縮,默認值爲off
  • connectionTimeout:設置連接的超時值,以毫秒爲單位。默認值爲60000=60秒
  • disableUploadTimeOut:允許Servlet容器,正在執行使用一個較長的連接超時值,以使Servlet有較長的時間來完成它的執行,默認值爲false
  • maxHttpHeaderSize:HTTP請求和響應頭的最大量,以字節爲單位,默認值爲4096字節
  • maxKeepAliveRequest:服務器關閉之前,客戶端發送的流水線最大數目。默認值爲100
  • maxSpareThreads:允許存在空閒線程的最大數目,默認值爲50
  • minSpareThreads:設當連接器第一次啓協創建線程的數目,確保至少有這麼多的空閒線程可用。默認值爲4
  • port:服務端套接字監聽的TCP端口號,默認值爲8080(必須)
  • socketBuffer:設Socket輸出緩衝區的大小(以字節爲單位),-1表示禁止緩衝,默認值爲9000字節
  • toNoDelay:爲true時,可以提高性能。默認值爲true
  • threadPriority:設JVM中請求處理線程優先級。默認值爲NORMAL-PRIORITY
    例:
<Connector
port="8080" maxHttpHeaderSize="8192" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" enableLookups="false"
redirectPort="8443" acceptCount="100" connectionTimeout="20000" disableUploadTimeout="true" />
AJP連接器-屬性:用於將Apache與Tomcat集成在一起,當Apache接收到動態內容請求時,通過在配置中指定的端口號將請求發送給在此端口號上監聽的AJP連接器組件。
  • backlog:當所有可能的請求處理線程都在使用時,隊列中排隊的請求最大數目。默認爲10,當隊列已滿,任何請求都將被拒絕
  • maxSpareThread:允許存在空閒線程的最大數目,默認值爲50
  • maxThread:最大線程數,默認值爲200
  • minSpareThreads:設當連接器第一次啓動時創建線程的數目,確保至少有這麼多的空閒線程可用,默認值爲4
  • port:服務端套接字的TCP端口號,默認值爲8089(必須)
  • topNoDelay:爲true時,可以提高性能,默認值爲true
  • soTimeout:超時值

例:

<!—Define an AJP1.3 Connector on port 8089-->
<Connector port="8089" enableLookups="false" redirectPort="8443" protocol="AJP/1.3" />

Engine-元素

爲特定的Service處理所有的請示。每個Service只能包含一個Engine元素,它負責接收和處理此Service所有的連接器收到的請求,向連接發回響應,並最終顯示在客戶端。至少有一個元素,必須至少有一個屬性的名字與defaultHost指定的名字相匹配。

  • className:實現org.apache.catalina.Engine接口,默認實現類爲org.apache.catalina.core.StandardEngine類
  • defaultHost:默認主機名,值必須與的name值相匹配
  • name:指定Engine的邏輯名字(必須)
  • jvmRoute:在負載勻衡中使用的標識符,必須唯一

例:

<Engine name="Cataline" defaultHost="localhst">

Host元素

表示一個虛擬主機,爲特定的虛擬主機處理所有請求

  • appBase:設定應用程序的基目錄,絕對路徑或相對於%CATALINA_HOME%的路徑名
  • autoDeploy:指示Tomcat運行時,如有新的WEB程序加開appBase指定的目錄下,是否爲自動佈署,默認值爲true
  • className:實現了org.apache.catalina.Host接口的類,標準實現類爲org.apache.catalina.core.StandardHost類
  • deployOnStartup:Tomcat啓動時,是否自動部署appBase屬性指定目錄下所有的WEB應用程序,默認值爲true
  • name:虛擬主機的網絡名(必須)

標準Host實現類org.apahce.catalina.core.StandardHost支持的附加屬性:
deployXML:爲false將不會解析WEB應用程序內部的context.xml,默認值爲true
unPackWARs:虛擬主機指定臨時讀寫使用的目錄的路徑名,不設,Tomcat會在%CATALINA_HOME%/work目錄下提供一個合適的目錄。

例:

<Host name="localhst" appBase="webapps" unpackWARs="true" autoDeploy="true" xmlValidation="false" xmlNamespaceAware="false">

配置虛擬主機:

<Hostname="xxx" appBase="c:/test">
    <Contentpath="" docBase="e:/abe"/>
</Hostname>

context元素

一個WEB應用程序,處理當前WEB應用程序的所有請求,每一個必須使用唯一的上下文路徑。

  • className:實現了org.apache.catalina.Context接口的類,標準實現類org.apache.catalina.core.StandardContext類
  • cookies:是否將Cookie應用於Session,默認值爲true
  • crossContext:是否允許跨域訪問,爲true時,在程序內調用ServletContext.getContext()方法將返回一個虛擬主機上其它web程序的請求調度器。默認值爲false,調 徑用getContext()返回爲null
  • docBase:絕對路徑或相對於Host的appBase 屬性的相對路徑
  • privileged:爲true,允許Web應用程序使用容器的Servlet
  • path:指定上下文路徑。一個虛擬主機中,上下文路徑必須唯一
  • reloadable:爲true,Tomcat運行時,如果WEB-INF/classes和WEB-INF/lib目錄中有改變,Tomcat會自動重新加載該WEB應用程序。雖方便,但開銷也大,默認值爲false,我們在調用可以打開,發佈後再關閉。
  • cacheMaxSize:靜態資源緩存最大值,以KB爲單位,默認值爲10240KB
  • cachingAllowed:是否允許靜態資源緩存,默認爲true
  • caseSensitive:默認爲true,資源文件名大小寫敏感,如果爲false大小寫不敏感
  • unpackWAR:默認爲true
  • workDir:爲WEB應用程序內部的Servlet指定臨時讀寫的目錄路徑名。如沒有設置,則Tomcat會在%CATALINA_HOME%/work目錄下提供一個合適的目錄

例:

<Content path="/abc" docBase="d:/xyz" reloadable="true" />

Tomcat線程性能解說

在使用tomcat時,經常會遇到連接數、線程數之類的配置問題,要真正理解這些概念,必須先了解Tomcat的連接器(Connector)。

在前面詳解Tomcat配置文件server.xml ,Connector是Tomcat的主要功能,是接收連接請求,創建Request和Response對象用於和請求端交換數據;然後分配線程讓Engine(也就是Servlet容器)來處理這個請求,並把產生的Request和Response對象傳給Engine。當Engine處理完請求後,也會通過Connector將響應返回給客戶端。

可以說,Servlet容器處理請求,是需要Connector進行調度和控制的,Connector是Tomcat處理請求的主幹,因此Connector的配置和使用對Tomcat的性能有着重要的影響。這篇文章將從Connector入手,討論一些與Connector有關的重要問題,包括NIO/BIO模式、線程池、連接數等。

根據協議的不同,Connector可以分爲HTTP Connector、AJP Connector等,本文只討論HTTP Connector。

一、Nio、Bio、APR

1、Connector的protocol

Connector在處理HTTP請求時,會使用不同的protocol。不同的Tomcat版本支持的protocol不同,其中最典型的protocol包括BIO、NIO和APR(Tomcat7中支持這3種,Tomcat8增加了對NIO2的支持,而到了Tomcat8.5和Tomcat9.0,則去掉了對BIO的支持)。

BIO是Blocking IO,顧名思義是阻塞的IO;NIO是Non-blocking IO,則是非阻塞的IO。而APR是Apache Portable Runtime,是Apache可移植運行庫,利用本地庫可以實現高可擴展性、高性能;Apr是在Tomcat上運行高併發應用的首選模式,但是需要安裝apr、apr-utils、tomcat-native等包。

2、如何指定protocol

Connector使用哪種protocol,可以通過元素中的protocol屬性進行指定,也可以使用默認值。

指定的protocol取值及對應的協議如下:

HTTP/1.1:默認值,使用的協議與Tomcat版本有關
org.apache.coyote.http11.Http11Protocol:BIO
org.apache.coyote.http11.Http11NioProtocol:NIO
org.apache.coyote.http11.Http11Nio2Protocol:NIO2
org.apache.coyote.http11.Http11AprProtocol:APR

如果沒有指定protocol,則使用默認值HTTP/1.1,其含義如下:在Tomcat7中,自動選取使用BIO或APR(如果找到APR需要的本地庫,則使用APR,否則使用BIO);在Tomcat8中,自動選取使用NIO或APR(如果找到APR需要的本地庫,則使用APR,否則使用NIO)。

3、BIO/NIO有何不同

無論是BIO,還是NIO,Connector處理請求的大致流程是一樣的:

在accept隊列中接收連接(當客戶端向服務器發送請求時,如果客戶端與OS完成三次握手建立了連接,則OS將該連接放入accept隊列);在連接中獲取請求的數據,生成request;調用servlet容器處理請求;返回response。爲了便於後面的說明,首先明確一下連接與請求的關係:連接是TCP層面的(傳輸層),對應socket;請求是HTTP層面的(應用層),必須依賴於TCP的連接實現;一個TCP連接中可能傳輸多個HTTP請求。

在BIO實現的Connector中,處理請求的主要實體是JIoEndpoint對象。JIoEndpoint維護了Acceptor和Worker:Acceptor接收socket,然後從Worker線程池中找出空閒的線程處理socket,如果worker線程池沒有空閒線程,則Acceptor將阻塞。其中Worker是Tomcat自帶的線程池,如果通過配置了其他線程池,原理與Worker類似。

在NIO實現的Connector中,處理請求的主要實體是NIoEndpoint對象。NIoEndpoint中除了包含Acceptor和Worker外,還是用了Poller,處理流程如下圖所示。

這裏寫圖片描述

Acceptor接收socket後,不是直接使用Worker中的線程處理請求,而是先將請求發送給了Poller,而Poller是實現NIO的關鍵。Acceptor向Poller發送請求通過隊列實現,使用了典型的生產者-消費者模式。在Poller中,維護了一個Selector對象;當Poller從隊列中取出socket後,註冊到該Selector中;然後通過遍歷Selector,找出其中可讀的socket,並使用Worker中的線程處理相應請求。與BIO類似,Worker也可以被自定義的線程池代替。

通過上述過程可以看出,在NIoEndpoint處理請求的過程中,無論是Acceptor接收socket,還是線程處理請求,使用的仍然是阻塞方式;但在“讀取socket並交給Worker中的線程”的這個過程中,使用非阻塞的NIO實現,這是NIO模式與BIO模式的最主要區別(其他區別對性能影響較小,暫時略去不提)。而這個區別,在併發量較大的情形下可以帶來Tomcat效率的顯著提升:

目前大多數HTTP請求使用的是長連接(HTTP/1.1默認keep-alive爲true),而長連接意味着,一個TCP的socket在當前請求結束後,如果沒有新的請求到來,socket不會立馬釋放,而是等timeout後再釋放。如果使用BIO,“讀取socket並交給Worker中的線程”這個過程是阻塞的,也就意味着在socket等待下一個請求或等待釋放的過程中,處理這個socket的工作線程會一直被佔用,無法釋放;因此Tomcat可以同時處理的socket數目不能超過最大線程數,性能受到了極大限制。而使用NIO,“讀取socket並交給Worker中的線程”這個過程是非阻塞的,當socket在等待下一個請求或等待釋放時,並不會佔用工作線程,因此Tomcat可以同時處理的socket數目遠大於最大線程數,併發性能大大提高。

二、3個參數:acceptCount、maxConnections、maxThreads

再回顧一下Tomcat處理請求的過程:在accept隊列中接收連接(當客戶端向服務器發送請求時,如果客戶端與OS完成三次握手建立了連接,則OS將該連接放入accept隊列);在連接中獲取請求的數據,生成request;調用servlet容器處理請求;返回response。

相對應的,Connector中的幾個參數功能如下:

1、acceptCount

accept隊列的長度;當accept隊列中連接的個數達到acceptCount時,隊列滿,進來的請求一律被拒絕。默認值是100。

2、maxConnections

Tomcat在任意時刻接收和處理的最大連接數。當Tomcat接收的連接數達到maxConnections時,Acceptor線程不會讀取accept隊列中的連接;這時accept隊列中的線程會一直阻塞着,直到Tomcat接收的連接數小於maxConnections。如果設置爲-1,則連接數不受限制。

默認值與連接器使用的協議有關:NIO的默認值是10000,APR/native的默認值是8192,而BIO的默認值爲maxThreads(如果配置了Executor,則默認值是Executor的maxThreads)。

在windows下,APR/native的maxConnections值會自動調整爲設置值以下最大的1024的整數倍;如設置爲2000,則最大值實際是1024。

3、maxThreads

請求處理線程的最大數量。默認值是200(Tomcat7和8都是的)。如果該Connector綁定了Executor,這個值會被忽略,因爲該Connector將使用綁定的Executor,而不是內置的線程池來執行任務。

maxThreads規定的是最大的線程數目,並不是實際running的CPU數量;實際上,maxThreads的大小比CPU核心數量要大得多。這是因爲,處理請求的線程真正用於計算的時間可能很少,大多數時間可能在阻塞,如等待數據庫返回數據、等待硬盤讀寫數據等。因此,在某一時刻,只有少數的線程真正的在使用物理CPU,大多數線程都在等待;因此線程數遠大於物理核心數纔是合理的。

換句話說,Tomcat通過使用比CPU核心數量多得多的線程數,可以使CPU忙碌起來,大大提高CPU的利用率。

4、參數設置

(1)maxThreads的設置既與應用的特點有關,也與服務器的CPU核心數量有關。通過前面介紹可以知道,maxThreads數量應該遠大於CPU核心數量;而且CPU核心數越大,maxThreads應該越大;應用中CPU越不密集(IO越密集),maxThreads應該越大,以便能夠充分利用CPU。當然,maxThreads的值並不是越大越好,如果maxThreads過大,那麼CPU會花費大量的時間用於線程的切換,整體效率會降低。

(2)maxConnections的設置與Tomcat的運行模式有關。如果tomcat使用的是BIO,那麼maxConnections的值應該與maxThreads一致;如果tomcat使用的是NIO,那麼類似於Tomcat的默認值,maxConnections值應該遠大於maxThreads。

(3)通過前面的介紹可以知道,雖然tomcat同時可以處理的連接數目是maxConnections,但服務器中可以同時接收的連接數爲maxConnections+acceptCount 。acceptCount的設置,與應用在連接過高情況下希望做出什麼反應有關係。如果設置過大,後面進入的請求等待時間會很長;如果設置過小,後面進入的請求立馬返回connection refused。

三、線程池Executor

Executor元素代表Tomcat中的線程池,可以由其他組件共享使用;要使用該線程池,組件需要通過executor屬性指定該線程池。

Executor是Service元素的內嵌元素。一般來說,使用線程池的是Connector組件;爲了使Connector能使用線程池,Executor元素應該放在Connector前面。Executor與Connector的配置舉例如下:

<Executor name="tomcatThreadPool" namePrefix ="catalina-exec-" maxThreads="150" minSpareThreads="4" />
<Connector executor="tomcatThreadPool" port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" acceptCount="1000" />

Executor的主要屬性包括:

  • name:該線程池的標記
  • maxThreads:線程池中最大活躍線程數,默認值200(Tomcat7和8都是)
  • minSpareThreads:線程池中保持的最小線程數,最小值是25
  • maxIdleTime:線程空閒的最大時間,當空閒超過該值時關閉線程(除非線程數小於minSpareThreads),單位是ms,默認值60000(1分鐘)
  • daemon:是否後臺線程,默認值true
  • threadPriority:線程優先級,默認值5
  • namePrefix:線程名字的前綴,線程池中線程名字爲:namePrefix+線程編號

四、查看當前狀態

上面介紹了Tomcat連接數、線程數的概念以及如何設置,下面說明如何查看服務器中的連接數和線程數。

查看服務器的狀態,大致分爲兩種方案:(1)使用現成的工具,(2)直接使用Linux的命令查看。

現成的工具,如JDK自帶的jconsole工具可以方便的查看線程信息(此外還可以查看CPU、內存、類、JVM基本信息等),Tomcat自帶的manager,收費工具New Relic等。下圖是jconsole查看線程信息的界面:

這裏寫圖片描述

下面說一下如何通過Linux命令行,查看服務器中的連接數和線程數。

1、連接數

假設Tomcat接收http請求的端口是8083,則可以使用如下語句查看連接情況:

netstat –nat | grep 8081

結果如下所示:

[root@test_houtai ~]# netstat -nat |grep 8081
tcp        0  0 0.0.0.0:8081          0.0.0.0:*      LISTEN      
tcp        1  0 47.93.112.243:55978   47.93.112.243:8081 CLOSE_WAIT  
tcp        1  0 47.93.112.243:60260   47.93.112.243:8081 CLOSE_WAIT 

可以看出,有一個連接處於listen狀態,監聽請求;除此之外,還有4個已經建立的連接(ESTABLISHED)和2個等待關閉的連接(CLOSE_WAIT)。

2、線程

ps命令可以查看進程狀態,如執行如下命令:

ps –e | grep java

結果如下圖:

[root@houtai_tools ~]# ps -ef|grep java
root     28915 28707  0 11:54 pts/0    00:00:00 grep java

可以看到,只打印了一個進程的信息;28915是線程id,java是指執行的java命令。這是因爲啓動一個tomcat,內部所有的工作都在這一個進程裏完成,包括主線程、垃圾回收線程、Acceptor線程、請求處理線程等等。

通過如下命令,可以看到該進程內有多少個線程;其中,nlwp含義是number of light-weight process。

ps –o nlwp 27989

[root@houtai_tools ~]# ps -o nlwp 16014
NLWP
  62

可以看到,該進程內部有62個線程;但是並沒有排除處於idle狀態的線程。要想獲得真正在running的線程數量,可以通過以下語句完成:

ps -eLo pid ,stat | grep 27989 | grep running | wc -l

其中ps -eLo pid ,stat可以找出所有線程,並打印其所在的進程號和線程當前的狀態;兩個grep命令分別篩選進程號和線程狀態;wc統計個數。其中,ps -eLo pid ,stat | grep 27989輸出的結果如下:

[root@test_houtai ~]# ps -eLo pid,stat |grep 31761
31761 Sl
31761 Sl
31761 Sl
31761 Sl
31761 Sl
31761 Sl
31761 Sl
31761 Sl
31761 Sl

圖中只截圖了部分結果;Sl表示大多數線程都處於空閒狀態。

Tomcat性能優化方案

待續。。。。。。

發佈了57 篇原創文章 · 獲贊 7 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章