城市功能區與人羣流動研究論文閱讀——《Simultaneous Urban Region Function Discovery...》

Simultaneous Urban Region Function Discovery and Popularity Estimation via an Infinite Urbanization Process Model

  • 關鍵詞:Urban computing, urban function discovery, Bayesian
    nonparametric, and topic modeling.

1.背景、意義和目標

(1)背景:
城市化是趨勢,城市系統是最複雜的城市經濟系統之一,通過觀察發現城市系統中存在兩個主要的特點:顯著的多樣化和不平等(不同的城市區域呈現不同的城市化模式,提供不同的城市功能)、空間的相關性。以往的研究都是聚焦於單個區域的城市功能區域研究,很少有聚集於集成化數據的跨區域城市研究,很少考慮隱藏在不同城市區域的跨領域城市發展模式,很少有研究關注於整合來自不同領域的城市數據,發現不同領域之間的相關性,並從跨領域的城市數據中獲得見解。
在這裏插入圖片描述
(2)意義:
滿足各類城市化不同需求:公共基礎設施、交通出行、能源、居住、教育、健康和通信。

(3)目標:
發展數據分析能力,發現潛在的跨區域城市化模式,根據功能相似性對城市區域進行聚類,預測特定領域的區域受歡迎程度。
提出一個IUP(infinite urbanization process 無限制城市化進程)模型,是一個在城市區域劃分空間上由一個依賴於貝葉斯非參數先驗的新層次空間距離控制的生成監督主題模型。***結合了監督潛在主題建模方法和距離相關貝葉斯非參數方法的優點。主要目的是利用城市功能表示來預測城市區域在特定領域的受歡迎程度。***(城市功能發現和區域流行度預測)
在這裏插入圖片描述

2.研究內容·

定義和發現隱藏在跨區域城市數據下的潛在城市發展模式;·基於城市化模式進行城市區域聚類;·根據發現的跨域關聯和模式對目標域進行預測;

3.算法?理論?

(1)監督主題模型潛在的狄利克雷分佈(LDA)
對於大量的文本分析任務具有優勢,雖然作爲無監督的主題學習模型可以幫助降低文本的維度,但是卻很難被用來預測文本的回覆(如文檔的相關性排名),只能描述一般的主題而不能利用監督信息。
因此以監督性潛在的狄利克雷分佈(sLDA)來解決監督學習問題,通過共同的主題學習和文檔回覆的迴歸係數來克服以上問題,sLDA的生成過程如下:
在這裏插入圖片描述
注:變量d和n分別表示文檔和詞的索引,變量N表示詞的數量,變量T表示主題的數量,變量θ和ϕ分別表示以ζ 和β作爲超參數的文檔的主題分佈和詞彙表上的主題分佈。

(2)距離依賴性(劃分的貝葉斯無參數先驗)
中國餐館進程(CRP)是一個概率度量上的分佈,是三大流行的重點分析聚類特性的DP(Dirichlet process)之一,廣泛用貝葉斯無參化先驗來作爲聚類方法和混合模型,避免了大多數參數化模型的選擇問題。以CRP爲先驗的模型可以在不事先知道簇數的情況下,自動從數據中獲取簇數。簡單的舉例說明CRP的生成過程:客戶多的桌子比客戶少的桌子更容易吸引新的客戶前來就坐。其聚類結果不受客戶順序影響(互換性假設),但是不適用於城市區域的聚類,區域相近的其人口構成和城市功能需求更加相似。
ddCRP(distance dependent CRP)修改了CRP,使新來的客戶就坐於離其最近的朋友桌子。以ci表示客戶的分佈,簡介決定了桌子的分佈ti,其中i表示客戶的索引,客戶的分佈由下決定:(距離相近功能相似情況)
在這裏插入圖片描述
(距離遠功能相似情況)在ddCRP之上引入了另一個層次結構層(標準CRP),其將由ddCRP生成的連接的SUSAs進一步分組爲集羣。
總結:這種依賴於空間距離的層次貝葉斯非參數先驗既可以通過空間ddCRP獲取空間相干性,又可以通過標準CRP層獲取城市功能相似性。以上兩部分與城市功能區域挖掘和區域聚集的對應關係:
在這裏插入圖片描述
(3)IUP模型
核心思想:

IUP模型擁有一個監督化的主題模型來發掘潛在的城市功能和預測城市區域受歡迎度,通過一個在城市區域劃分上的空間距離相關的層次貝葉斯非參數先驗來對管理城市區域聚類和城市功能產生。IUP模型生成過程如下:
在這裏插入圖片描述

4.研究方法

推理的關鍵部分:推斷聚類索引和SUSAs的城市功能分佈
(1)以IUP模型的SUSA分配爲例:
以Z、W、Y爲數據向量,得到了SUSA賦值ci在其他參數、超參數和觀測值上的條件分佈。
在這裏插入圖片描述
前半部分根據公式一確定,後面的似然項可以進一步分解如下:
在這裏插入圖片描述
其中Π(·)表示從客戶分佈到桌子分佈的轉換。對於一個特定的集羣,其聯合分佈可以表示爲:
在這裏插入圖片描述
計算似然項:詳細見論文!
在這裏插入圖片描述

5.結論與展望

提出了一種基於跨域城市數據挖掘城市功能,同時預測城市在特定領域的受歡迎程度的無限城市化進程(IUP)模型。提出的IUP模型在城市區域劃分空間上具有依賴於空間距離的層次貝葉斯非參數先驗。它可以看作是中餐館特許經營(CRF)的延伸,其中顧客(最小的城市統計面積)的分配是由一個空間的ddCRP而不是CRP來管理的,而菜的分配(跨餐館的桌子分組)仍然是由一個標準的CRP來管理的。利用這種層次貝葉斯非參數先驗,可以將具有相似城市功能的城市區域聚在一起,而且不需要預先設置城市區域集羣的數量,這樣會造成差異,影響性能。相反,該模型可以從提供的數據中自動學習集羣的數量。實證研究表明,IUP模型能夠很好地捕捉潛在的城市發展主題,並利用所獲得的緊湊的城市主題表示對特定領域的城市流行度做出準確的預測。
在未來的工作中,可以爲潛在表示空間的維數增加一個貝葉斯非參數先驗。另一個可能的擴展是考慮城市區域功能隨時間的變化。提出的模型可以擴展到捕捉城市發展的時間模式。

[參考文檔]Simultaneous Urban Region Function Discovery and Popularity Estimation via an Infinite Urbanization Process Model

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章