智能客服系統在機票售後的應用實踐

引言

客戶（用戶）的需求不能得到切實有效的滿足往往是導致企業客戶（用戶）流失的最關鍵因素，所以很多企業都會成立客服團隊來解答客戶（用戶）的各類問題以提升滿意度。傳統的客服服務無論是對用戶、客服還是企業來說都有很多弊端（見圖 1 ）。因此智能客服系統也就應運而生，它成爲人工智能（AI）重要落地應用之一。

（圖1.客服行業面臨的痛點）

智能客服系統是建立在大規模知識處理、自然語言理解、知識管理、自動問答、推理等技術之上，通過大幅度降低人力成本以及提供人性化服務來優化用戶體驗。智能客服不僅爲企業提供了細粒度知識管理技術，還爲企業與海量用戶之間的溝通建立了一種基於自然語言的快捷有效的技術手段，同時還能夠爲企業提供精細化管理所需的統計分析信息。

去哪兒機票事業部有一個龐大且專業的客服團隊，業務涉及售前、售後。服務形式有文字客服（Chat）和電話客服。因爲機票的業務場景非常複雜，雖然我們的客服工作已經很高效，但也存在着一些問題，例如：航變時業務量暴增導致用戶等待時間過長等問題。

我們本着“提升服務質量，節約服務成本”的目的，推進“智能客服”這一項目，使用AI賦能客服在機票售後業務中做了一些創新和嘗試。

（圖2.智能客服的關鍵點是成本和質量）

機票客服需要“智能”

日誌中問題分佈分析

我們通過一組數據說話，根據機票積累下來的客服聊天日誌，我們發現用戶的基本問題和業務問題的佔比大約爲 3:7，工單的平均對話輪數約爲 13 輪，不同業務長短分佈有所不同，簡單諮詢類業務較短，類似行程單等複雜業務會超過 20 輪，在極端情況下部分業務處理比較棘手，長度甚至超過 100 輪。

那麼客服在解決業務問題的對話中都在做什麼呢：20% 是業務相關的核心問題，剩餘 80% 都是閒聊，此“閒聊”不是彼“閒聊”，除了日常寒暄之外還包含對業務涉及信息的問詢以及對用戶情緒的安撫與調整。可以說客服都是熟讀各類百科全書的聊天超人，見圖 3。

（圖3.日誌中問題分佈情況）

客服日常工作模式

人工智能最主要的是讓“人工”變得“智能”，所以瞭解業務人員平時的工作模式是很關鍵的。根據調研，客服平時的工作模式是根據問題類型的不同而採取不同的解決方案，見圖 4。

（圖4.客服平時針對不同問題類型使用不同的解決方案）

機票業務極其複雜，用戶需求涉及出、退、改等十餘個業務場景，每個場景下又能衍生出幾十甚至上百個業務意圖。以出票場景（見圖 5）爲例，用戶訴求既會涉及到購票類型、支付手段、出票進度等諮詢類問題，也會有諸如修改信息、申請購票等操作類型問題。得到這些訴求的解決方案需要根據訂單狀態、航司政策、用戶主觀原因等多種因素做出判斷，這要求客服有極強的業務素養與信息獲取能力。

（圖5.出票場景下的業務意圖舉例）

業務問題之外，客服同樣會面對一些瑣碎的日常問題。例如託運規則、天氣諮詢、乘機注意事項等。對於高頻的日常問題，每個客服都會手動積累和維護一個文檔，日積月累再加上互相交流，漸漸的就成了一個小型文本知識庫，這在一定程度上提升了客服的工作效率。

“智能客服”的應用場景

我們在人工客服場景與機器自助場景都進行了智能化的嘗試。在人工客服中通過“客服助手”輔助客服與用戶溝通。客服助手中的推薦可以分爲兩類，一類是業務問題，遇到退票、出票、改簽等的業務問題，比如圖 6 中的申請退票。我們會通過意圖識別確認用戶訴求，然後基於業務知識庫梳理業務邏輯，根據用戶當時的訂單狀態生成相對應的退票規則，生成合理的業務答案，推送給客服。另一類是非業務問題，我們會通過搜索匹配的方式在基本問答知識庫中進行檢索，搜尋合適的答案反饋給客服。如果客服覺得可以採納，輕輕一點，話術就推送給用戶了。項目推進到現在我們的客服助手在每天發生的會話中有 90% 以上的會話會出現答案推送，消息維度的推薦覆蓋率爲 60% 以上。意圖識別準確率 90% 以上，答案準確率也達到了 70%。

（圖6.客服助手的產品形式舉例）

在線客服小駝機器人中，我們也做了很多交互體驗上的優化。原始的小駝機器人解決用戶問題的流程是用戶描述自己的問題後，小駝會給用戶推薦相關的業務標籤，用戶通過點選的形式來進行確認，進入相應的業務流程。現在通過意圖識別接口和點擊反饋模型優化現有的標籤推薦功能後，線上標籤推薦指標絕對提高了 28%。同時我們提供“精準答案”的產品方式，不需要用戶點選操作，提升用戶使用體驗。

除此之外我們也在協助客服分單，電話客服等多個場景進行了其他嘗試，在此不再逐一介紹。

“智能客服”的技術實現

智能客服中包含一套完整的對話邏輯控制系統。圖 7 中是智能客服控制邏輯的核心結構，首先通過 query 理解模塊對用戶輸入進行預處理和意圖識別，預處理包含 query 清洗、命名實體識別、query 改寫、向量化等操作。當確定用戶 query 爲閒聊（基本問答）時，通過 QA 知識庫檢索的形式搜索合適的答案。當確定用戶 query 包含業務意圖時，則進入對話管理模塊。模塊中通過對話上文信息與當前槽位填充情況確定新的對話狀態，最後通過業務知識庫生成合適的備選答案。

（圖7.智能客服控制邏輯流程）

下面分別介紹解決基本問答與業務問答的思路與方案。

基本問答

智能客服能夠回答用戶基本問題的前提是它具備相關的知識，這些知識是客服在經驗和交流中積累起來的，我們就通過歷史日誌來挖掘這些知識。知識挖掘涉及的技術較多，我們通過訓練語言模型進行問題質量判別、使用 textRank 提取語料中的領域詞，通過句向量相似性，答案相似性以及檢索策略擴大有效問答對的召回。考慮到篇幅長度，具體細節考慮在之後的挖掘專題文章中再詳談。使用挖掘得到的基本問答 QA 對進行檢索推薦服務，見圖 8。

（圖8.問答檢索框架）

爲了提升推薦服務效果，我們在 Query 理解模塊做了很多前期工作，通過收集與挖掘我們積累了多個基礎詞庫，同義詞庫協助 query 改寫，領域詞與英文專屬詞詞庫能夠提升切詞的準確率，通過海量日誌數據學習詞權重，引入了正排索引的同時，使用 word2vec 的向量相似度進一步修正計算結果。現在我們嘗試新的預訓練模型計算 query 相似度，通過 ES+bert 的形式升級現有的問答檢索框架。

意圖識別

在項目初期，考慮到模型迭代效率與樣本規模，智能客服一直採用 fasttext 作爲主要的意圖識別模型。但隨着項目進展，類別種類膨脹，樣本語料數量低且質量差的問題逐漸凸顯出來。Google 推出的 bert 預訓練模型很好的幫忙解決了我們的痛點。它支持在少樣本情況下微調模型，使模型能夠支持識別 200+ 的意圖，在語料質量有保證的情況下，準確率會非常理想。

Bert 也有一些明顯的缺點，模型龐大，微調需要設備資源，我們通過一些簡單的策略在一定程度上降低了模型迭代的成本。在 Bert 模型輸出預測結果的同時我們使用模型的副產物(詞向量)作爲 SVM 模型的輸入，來給當前輸出意圖做進一步細分。這樣就可以在僅調整 SVM 的情況下根據實際 badcase 快速的迭代模型。

（圖9. 意圖識別模型框架）

模型迭代至今，線上推薦服務在支持近 200 個意圖的情況下的準確率穩定在 91%。

（圖10. 意圖識別評測結果）

技術實現方案

在技術實現上智能客服問答推薦系統劃分成 4 個模塊：

基礎服務模塊負責 query 分析、實體識別、意圖識別以及 NLP 相關基礎服務的實現。
對話控制模塊主要負責對話狀態管理以及槽位填充，對其他模塊的服務進行封裝，對接業務線不同的服務和需求。
對話生成模塊基於現有的業務知識庫，通過現有的訂單狀態與用戶意圖生成合理的業務答案。
數據管理模塊由於客服助手需要根據用戶訴求與客服的輸入同時更新對話狀態，所以實時更新答案推薦的採納情況，輔助更新對話策略。

（圖11. 智能客服系統架構）

未來規劃

現在智能客服在多個業務場景得到應用，從人人對話到人機對話，從售前到售後。接下來我們會對系統做進一步的完善：

繼續優化現有的意圖識別體系，打造機票業務知識圖譜。同時繼續嘗試新的深度學習技術，進一步提高現有意圖的準召。
提升實體識別、時間提取等技術的準確率，完善多輪對話中的槽位填充邏輯。
不僅在 NLU 方向提供支持，嘗試使用歷史日誌語料結合場景下訂單狀態，使用模型在 NLG 方面提供支持。
進一步與相關業務解藕，模塊化各個功能，提升整個體系的獨立性，形成一個專注於 NLP 的技術服務平臺。

參考文獻

Devlin, J., Chang, M., Lee, K., Toutanova, K.: BERT: pre-training of deep bidirectional transformers for language understanding. CoRR abs/1810.04805 (2018). http://arxiv.org/abs/1810.04805
McCandless M, Hatcher E, Gospodnetić O. , Lucene in Action , 2010 USA Manning Publications
Tomas Mikolov, Kai Chen, Greg Corrado, and Jef-frey Dean. 2013a. Efficient Estimation of WordRepresentations in Vector Space. InICLR Work-shop Papers.
Jay Alammar. , 2018 blog, The Illustrated BERT, ELMo, and co. (How NLP Cracked Transfer Learning). https://jalammar.github.io/illustrated-bert/
Armand Joulin, Edouard Grave, Piotr Bojanowski, andTomas Mikolov. 2016. Bag of tricks for efficient text classification. arXiv preprint arXiv:1607.01759.

作者介紹：

賈自豔，2018 年加入去哪兒網機票大數據團隊，主要負責價格預測、搜索優化、智能營銷、智能客服、風控等方向。2004 年中科院計算所博士畢業後先後任職於微軟亞洲研究院、騰訊等互聯網公司，一直從事搜索排序、數據挖掘、智能對話和自然語言處理等相關領域研究工作。

本文轉載自公衆號Qunar技術沙龍（ID：QunarTL）。

智能客服系統在機票售後的應用實踐

引言

機票客服需要“智能”

日誌中問題分佈分析

客服日常工作模式

“智能客服”的應用場景

“智能客服”的技術實現

基本問答

意圖識別

技術實現方案

未來規劃

參考文獻

實操|基於OceanBase打造更穩定的Zabbix監控系統

Milvus 老友匯｜RAG 場景、電商平臺、AI 平臺……如何用向量數據庫構建業務方案？

提高 RAG 應用準確度，時下流行的 Reranker 瞭解一下？

實錄｜三大AI開發神器亮相！李彥宏：人人都是開發者

智能客服系統在機票售後的應用實踐

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結