期刊:Journal of Network and Computer Applications
作者:Xiangjie Kong, Yajie Shi, Shuo Yu, Jiaying Liu, Feng Xia ∗
單位:Key Laboratory for Ubiquitous Network and Service Software of Liaoning Province, School of Software, Dalian University of Technology, Dalian, 116620,China
Abstract
在學術大數據快速發展的背景下,社交網絡技術最近引起了學術界和行業的廣泛關注。 學術社交網絡的概念正是在學術大數據的背景下創建的,學術大數據是指由學術實體及其關係形成的複雜學術網絡。 有很多學術上的大數據處理方法可以分析有關學術社交網絡的豐富結構類型和相關信息。 如今,可以輕鬆獲取各種學術數據,這使我們更易於分析和研究學術社交網絡。 本研究調查了學術社交網絡的背景,現狀和趨勢。 我們首先詳細闡述學術社交網絡的概念和相關研究背景。 其次,我們根據節點的類型和及時性來分析模型。 第三,我們回顧分析方法,包括相關指標,網絡屬性和可用的學術分析工具。 此外,我們還爲學術社交網絡挑選了一些關鍵的挖掘技術。 最後,我們從三個層面系統地回顧了該領域的代表性研究任務:參與者,關係和網絡。 此外,還介紹了一些學術社交網站。 這份調查總結了當前的挑戰和未解決的問題。
1. Introuction
如何從數百萬的學術大數據中挖掘有價值的信息是一個緊迫的問題。
對SBD的深入分析不僅可以使研究人員更有效地利用可用資源,而且可以爲學術界和工業的發展做出貢獻。 但是,對此問題的系統研究不足。
2. Academic social networks
實際學術網絡大多是異構網絡,也是動態網絡。
學術研究的主要方向:作者排名,作者興趣發現,後起之秀發現,學術推薦和社區發現。
3. Academic social networks modeling
同質網絡:合作網絡,引用網絡,共詞網絡。
異質網絡:文章-作者網絡,引用耦合網絡,混合網絡(引文—主題等)
我的想法:
選擇同構還是異構網絡,主要還是和我們的研究主題相關。
但是在現實研究中,我們所定義的同構網絡可能隱藏異構信息,節點可能含有其他屬性,邊權也可能包含其他信息,這些屬性在網絡中會產生隱性或者顯性的影響。所以,應該沒有完全單純的同質網絡。
4. Academic social network analysis
Social network metrics
gobal metrics
- diameter(直徑):兩點之間的最大路徑
- density(密度):網絡的連接/網絡最大連接
- average shortest path length(平均最短路徑):任意兩點的最短路徑平均長度——聯通
- harmonic average shortest path length(非聯通):
- average degree(平均度):
community metrics:可以識別整個網絡中緊密互連的組
- core(核):k-core——組中每個節點至少連接組內其他k個點。
- clique(集團):最大的點集合,其中點與點之間直接相連。
node degree:某一個點的鄰居節點
clustering coefficient
- local clustering coefficient(局部聚類係數):一個點的鄰居點/鄰居點之間的可能連接數
- global clustering coefficient(全局聚類係數):
centrality
- degree centrality:度/最大度
- closeness centrality:點與其他所有點的最短路徑的平均——倒數(0-1)
- betweenness centrality:
中間性中心度用於描述到達其他節點必須經過的節點範圍。
分子:從s到t經過i的最短路徑數
分母:從s到t的最短路徑數 - eigenvector centrality(特徵向量中心性):
- pagerank:質量和數量
Properties
常見網絡的屬性:
power-law degree distribution:冪律分佈
大多數節點的度數都較低,很少有節點的度數較高
small-world property:小世界的屬性在現實世界中比較普遍
mixing patterns:許多網絡中的節點類型不同
community structure:社區結構
Academic social network analysis tools
5. Key mining technologies
挖掘學術網絡中的相互關係:
- Similarity measure
- Statistical relational learning
- Graph mining
- Machine learning
6. Applications
面向參與者,面向關係和麪向網絡
Actor_oriental applications
author-level tasks
- author Name Disambiguation
通過相關因素消除同名歧義,比如隸屬關係,合作者關係等 - author ranking
迭代和非迭代:
迭代:PageRank
非迭代:h,g等 - expert finding:尋找專業人員
基於內容:測度相關文檔和查詢直接的相關性評估學者的專業知識
基於學者的學術社交活動——合作,引用 - rising star finding:強調潛在價值
研究興趣、度量指標等的動態變化
paper-level tasks
- paper impact evaluation
文章總引用,作者的h,期刊的IF - paper impact prediction
社交媒體、引文分佈,在傳統的基礎上加入新的維度
journal-level tasks
- journal impact evaluation
IF,高被引文章,集成指標等
Relationship-oriented application
- author relationship prediction
- academic recommendation
- community/group detection
Network-oriented applications
- collaboration pattern
- interdisclplinary research
- research trend prediction
7. Looking ahead
可以從以下方面開始對此主題的未來研究:
(1)建立異構的學術網絡;
(2)建立統一的學術影響評估方式;
(3)整合多學科的學術數據資源;
(4)挖掘隱含指標以探索學術社交網絡。