triton inference server翻譯之Metrics

link

Metrics

Triton Inference服務器提供Prometheus度量標準,指示GPU和請求統計信息。 默認情況下,這些指標可從http://localhost:8002/metrics獲得。 度量標準僅可通過訪問端點來使用,而不會推送或發佈到任何遠程服務器。

推理服務器的--allow-metrics=false選項可用於禁用度量標準報告,而--metrics-port選項可用於選擇其他端口。

下表描述了可用指標。

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章