知識圖譜與推薦系統(DKN)

原創

2020-06-27 04:34

DKN: Deep Knowledge-Aware Network for News Recommendation

論文下載鏈接：https://arxiv.org/abs/1801.08284v1

本文模型：將知識圖表示與新聞推薦相結合的深度知識感知網絡（DKN）

1. 新聞推薦的挑戰：

對時間高度敏感，其相關性在短時間內迅速失效。
人們在新聞閱讀中對話題敏感，因爲他們通常對多個特定的新聞類別感興趣。
新聞語言通常是高度濃縮的，由大量的知識實體和常識組成。

2. DKN框架：

（插入：基礎知識，知識圖嵌入和用於句子表示學習的卷積神經網絡）

1) 知識圖嵌入

TransR:

TransD:

2）用於句子表示學習的卷積神經網絡

1. DKN整體框架：
1）輸入：一條候選新聞（Candidate news）、一個用戶的點擊歷史（User’s clicked news）
2） KCNN將新聞的詞級和知識級表示進行融合，得到每一條新聞的知識感知表示向量。
3）注意力模塊，自動將候選新聞與單擊的每一天新聞進行匹配，用不同的權重聚合用戶的歷史記錄。
4）深度神經網絡（DNN）對用戶嵌入和候選新聞嵌入進行處理，進行CTR預測。

1）輸入：

對於在線新聞平臺的用戶，其點擊歷史記錄爲：

每一項 t 表示爲第i個用戶點擊的第j條新聞的標題。每個新聞標題 t 由一系列單詞組成，t = [w1, w2, …]
知識圖G：由三元組（h, r, t）組成，h, r, t 分別表示三元組的頭實體，關係，尾實體，G中的實體 e 爲特定的單詞或短語。t 中的 w 與知識圖中的實體e相關聯。
目標：預測用戶i是否會點擊候選新聞tj

2）KCNN：

實體嵌入：
實體關聯，利用實體鏈接技術將t 中單詞與知識圖中預先定義的實體關聯，消除歧義；
構造子圖，構造一個子圖，從原始知識圖中提取它們之間的所有關係鏈接；
知識子圖擴展，將知識子圖擴展到一跳內的所有實體；
表示學習，利用TransE，TransR，TransH等多種知識圖嵌入（KGE）方法進行實體表示學習。
上下文嵌入：
新聞特徵提取：
（1）將知識提取中得到的word embedding，entity embedding，context embedding作爲三個信道輸入（多通道和單詞-實體對齊方式），分別表示爲：

其中函數g可以是線性變換也可以是非線性變換。
新聞的輸入可以表示爲：

（2）使用不同尺寸的filter進行卷積：

（3）最大池化：

將結果整合爲輸出新聞的特徵表示向量：

3）注意力機制：

2. 實驗

1）數據集

從a圖中可以看出新聞具有時效性，大部分新聞在3天之後就沒有了閱讀量；b圖可以看出新聞數據的稀疏性；c和d表示新聞標題的單詞數平均在7.9，涉及的實體數平均在3.7；e和f 表示新聞數據集中實體的出現時間的分佈以及提取的知識圖中的上下文實體的數量分佈（遵循長尾分佈）。

2）評價指標
F1-score 和 AUC值

3）實驗結果

4）討論

3. 結論

代碼地址：https://github.com/hwwang55/DKN

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

音頻鏈接抓取技術在Lua中的實現

前言隨着數字音樂的普及，越來越多的用戶選擇在線音樂平臺來享受音樂。網易雲音樂作爲國內領先的音樂服務平臺，不僅提供了豐富的音樂資源，還擁有獨特的社交屬性，吸引了大量的用戶。在衆多的音樂服務中，音頻鏈接的抓取技術成爲了一個重要的需求。無論

2024-05-28 00:07:25

文心大模型免費辣，動手搓點啥慶祝一下吧

5月21日下午，百度智能雲宣佈文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費，即刻生效。這兩款大模型都是今年3月剛剛發佈的，均支持8K和128k上下文長度。可以說，這是百度最新的模型

2024-05-24 12:13:22

京東廣告研發 —— 京東推薦廣告排序機制演化

1、序言：廣告排序機制的前世今生 1.1、簡介：廣告排序機制在線廣告是國內外各大互聯網公司的重要收入來源之一，而在線廣告與傳統廣告最大的區別就在於其超大規模的實時競價環境：數以萬計的廣告主在一天內可以參與億級別的流量競拍。在這複雜的實

2024-04-24 23:17:14

Pinecone: 大模型時代的智能索引與搜索解決方案

隨着人工智能技術的飛速發展，大模型（Large Models）已成爲衆多領域的重要工具。無論是自然語言處理、圖像識別還是其他複雜任務，大模型都展現出了強大的性能。然而，隨着模型規模的不斷擴大，數據量的激增，如何有效地管理、索引和搜索這些模型

2024-04-19 11:29:43

深度解析大模型推理框架：原理、應用與實踐

在當今數據驅動的時代，大模型推理框架已經成爲人工智能領域的重要支柱。本文將通過簡明扼要、清晰易懂的方式，帶領讀者深入瞭解大模型推理框架的原理、應用領域和實踐經驗，幫助讀者更好地掌握這一技術，並在實際工作中發揮其價值。一、大模型推理框架簡介

2024-04-11 23:28:49

華爲雲GeminiDB，廣告RTA的“登雲梯”

本文分享自華爲雲社區《華爲雲GeminiDB，廣告RTA的“登雲梯”》，作者： GeminiDB-Redis博客。行話說，廣告RTA要想效果好，數據庫挑戰少不了。那麼，廣告RTA對數據庫究竟有哪些挑戰？在上篇文章《究竟什麼樣的數據庫，才能

2024-04-09 10:32:19

大模型推理框架：從理論到實踐的全面解析

在數據驅動的時代，深度學習技術已經滲透到各個行業，從圖像識別到自然語言處理，從推薦系統到智能客服，其應用無處不在。然而，深度學習模型的訓練和推理過程往往涉及大量數據和複雜計算，傳統的計算框架難以滿足需求。因此，大模型推理框架應運而生，成爲解

2024-03-23 00:31:01

正式支持騰訊雲！Zilliz Cloud 多雲版圖再度擴張

3 月 22 日，Zilliz 對外透露，Zilliz Cloud 的用戶可以利用騰訊雲在北京和上海區的雲服務搭建雲應用，這將進一步爲海內外用戶提供更爲豐富的多雲支持的向量數據庫雲服務！這是繼阿里雲後，Zilliz Cloud 在國內新

2024-03-22 14:51:11

解鎖深度表格學習（Deep Tabular Learning）的關鍵：算術特徵交互

近日，阿里雲人工智能平臺PAI與浙江大學吳健、應豪超老師團隊合作論文《Arithmetic Feature Interaction is Necessary for Deep Tabular Learning》正式在國際人工智能頂會AAAI

2024-03-21 01:31:46

京東廣告算法架構體系建設--高性能計算方案最佳實踐

1、前言推薦領域算法模型的在線推理是一個對高併發、高實時有較強要求的場景。算法最初是基於Wide & Deep相對簡單的網絡結構進行建模，容易滿足高實時、高併發的推理性能要求。但隨着廣告模型效果優化進入深水區，基於Transformer

2024-03-15 13:45:05

多模態+大模型會帶來哪些“化學反應”？

導語：沒人懷疑，2024 年，AI 依然將是科技界的主角。上個月，OpenAI 推出了可以生成 60 秒高清視頻的視頻生成模型 Sora，掀起了對多模態模型的進一輪討論。多模態大模型技術的最新進展如何？這一波新技術，對於行業和消費者的體驗會

2024-03-15 13:45:01

大模型技術調研與端應用形態探索

在人工智能領域，大模型（Large Model）技術的崛起標誌着深度學習進入了一個全新的階段。這些模型通常包含數十億甚至千億級別的參數，通過大規模的數據訓練，能夠在語音識別、自然語言處理、圖像識別等多個領域取得令人矚目的成就。那麼，大模型究

2024-03-08 12:36:05

Z Potentials | 星爵，他的征途不止向量數據庫

縱觀過去幾十年的科技發展史，每一代新的技術架構的出現往往都伴隨着新的數據範式的出現，也催生了多家百億到千億美金數據平臺的誕生。如果說 2023 年科技領域的關鍵詞是 LLM，那麼數據庫領域的關鍵詞一定非向量數據庫莫屬。向量數據庫是一種專門用

2024-03-07 21:26:17

揭祕 LLMs 時代向量數據庫的 3 大實用場景

過去一年，ChatGPT 和其他大語言模型（LLMs）的爆火也帶動了向量數據庫的發展。許多用戶在搭建檢索增強生成（RAG）系統過程中選擇了使用向量數據庫 Zilliz Cloud ，但 Zilliz Cloud 的功能不止於此

2024-02-23 14:52:22

覆盤了今年春節，主打一個AI應用讓我「機智過人」

鞭炮聲聲辭舊歲，春光融融迎新年。春節，這一喜慶團圓的節日意味着萬象更始，一幅嶄新的畫卷已經徐徐展開——在數字化、智能化的時代背景下，科技爲這一歷史悠久的節日注入了新的活力與魅力。春節與科技的強強聯合，不僅展現了中華民族的智慧與創新精神，也讓

2024-02-23 12:37:09

24小時熱門文章

最新文章

最新評論文章