Academic social networks: Modeling, analysis, mining and applications

期刊:Journal of Network and Computer Applications
作者:Xiangjie Kong, Yajie Shi, Shuo Yu, Jiaying Liu, Feng Xia ∗
單位:Key Laboratory for Ubiquitous Network and Service Software of Liaoning Province, School of Software, Dalian University of Technology, Dalian, 116620,China


Abstract

在學術大數據快速發展的背景下,社交網絡技術最近引起了學術界和行業的廣泛關注。 學術社交網絡的概念正是在學術大數據的背景下創建的,學術大數據是指由學術實體及其關係形成的複雜學術網絡。 有很多學術上的大數據處理方法可以分析有關學術社交網絡的豐富結構類型和相關信息。 如今,可以輕鬆獲取各種學術數據,這使我們更易於分析和研究學術社交網絡。 本研究調查了學術社交網絡的背景,現狀和趨勢。 我們首先詳細闡述學術社交網絡的概念和相關研究背景。 其次,我們根據節點的類型和及時性來分析模型。 第三,我們回顧分析方法,包括相關指標,網絡屬性和可用的學術分析工具。 此外,我們還爲學術社交網絡挑選了一些關鍵的挖掘技術。 最後,我們從三個層面系統地回顧了該領域的代表性研究任務:參與者,關係和網絡。 此外,還介紹了一些學術社交​​網站。 這份調查總結了當前的挑戰和未解決的問題。

1. Introuction

如何從數百萬的學術大數據中挖掘有價值的信息是一個緊迫的問題。
對SBD的深入分析不僅可以使研究人員更有效地利用可用資源,而且可以爲學術界和工業的發展做出貢獻。 但是,對此問題的系統研究不足。

2. Academic social networks

實際學術網絡大多是異構網絡,也是動態網絡。
學術研究的主要方向:作者排名,作者興趣發現,後起之秀發現,學術推薦和社區發現。

3. Academic social networks modeling

同質網絡:合作網絡,引用網絡,共詞網絡。
在這裏插入圖片描述
異質網絡:文章-作者網絡,引用耦合網絡,混合網絡(引文—主題等)
在這裏插入圖片描述
我的想法:
選擇同構還是異構網絡,主要還是和我們的研究主題相關。
但是在現實研究中,我們所定義的同構網絡可能隱藏異構信息,節點可能含有其他屬性,邊權也可能包含其他信息,這些屬性在網絡中會產生隱性或者顯性的影響。所以,應該沒有完全單純的同質網絡。

4. Academic social network analysis

Social network metrics

gobal metrics

  • diameter(直徑):兩點之間的最大路徑
  • density(密度):網絡的連接/網絡最大連接
    在這裏插入圖片描述
  • average shortest path length(平均最短路徑):任意兩點的最短路徑平均長度——聯通
    在這裏插入圖片描述
  • harmonic average shortest path length(非聯通):
    在這裏插入圖片描述
  • average degree(平均度):
    在這裏插入圖片描述

community metrics:可以識別整個網絡中緊密互連的組

  • core(核):k-core——組中每個節點至少連接組內其他k個點。
  • clique(集團):最大的點集合,其中點與點之間直接相連。

node degree:某一個點的鄰居節點
在這裏插入圖片描述
clustering coefficient

  • local clustering coefficient(局部聚類係數):一個點的鄰居點/鄰居點之間的可能連接數
    在這裏插入圖片描述
  • global clustering coefficient(全局聚類係數):
    在這裏插入圖片描述

centrality

  • degree centrality:度/最大度
    在這裏插入圖片描述
  • closeness centrality:點與其他所有點的最短路徑的平均——倒數(0-1)
    在這裏插入圖片描述
  • betweenness centrality:
    中間性中心度用於描述到達其他節點必須經過的節點範圍。
    在這裏插入圖片描述
    分子:從s到t經過i的最短路徑數
    分母:從s到t的最短路徑數
  • eigenvector centrality(特徵向量中心性):
    在這裏插入圖片描述
  • pagerank:質量和數量
    在這裏插入圖片描述

Properties

常見網絡的屬性:
power-law degree distribution:冪律分佈
大多數節點的度數都較低,很少有節點的度數較高
small-world property:小世界的屬性在現實世界中比較普遍
mixing patterns:許多網絡中的節點類型不同
community structure:社區結構

Academic social network analysis tools

在這裏插入圖片描述

5. Key mining technologies

挖掘學術網絡中的相互關係:

  • Similarity measure
  • Statistical relational learning
  • Graph mining
  • Machine learning
    在這裏插入圖片描述

6. Applications

面向參與者,面向關係和麪向網絡
在這裏插入圖片描述

Actor_oriental applications

author-level tasks

  • author Name Disambiguation
    通過相關因素消除同名歧義,比如隸屬關係,合作者關係等
  • author ranking
    迭代和非迭代:
    迭代:PageRank
    非迭代:h,g等
  • expert finding:尋找專業人員
    基於內容:測度相關文檔和查詢直接的相關性評估學者的專業知識
    基於學者的學術社交活動——合作,引用
  • rising star finding:強調潛在價值
    研究興趣、度量指標等的動態變化

paper-level tasks

  • paper impact evaluation
    文章總引用,作者的h,期刊的IF
  • paper impact prediction
    社交媒體、引文分佈,在傳統的基礎上加入新的維度

journal-level tasks

  • journal impact evaluation
    IF,高被引文章,集成指標等

Relationship-oriented application

  • author relationship prediction
  • academic recommendation
  • community/group detection

Network-oriented applications

  • collaboration pattern
  • interdisclplinary research
  • research trend prediction

7. Looking ahead

可以從以下方面開始對此主題的未來研究:
(1)建立異構的學術網絡;
(2)建立統一的學術影響評估方式;
(3)整合多學科的學術數據資源;
(4)挖掘隱含指標以探索學術社交網絡。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章