Python數據挖掘與文本分析&Stata應用能力提升與實證前沿雲特訓
Python部分上課時間爲6月29日-7月2日,感興趣的童鞋歡迎關注
在大數據的今天,通過互聯網超文本鏈接,無數的個人、團體、公司、政府等不同組織形態的主體均深深嵌入到互聯網世界,在網絡世界中留下了大量的文本。社會、管理、經濟、營銷、金融等不同學科,均可以研究網絡上海量的文本,擴寬的研究對象和研究領域。下面大部分內容是三份文檔翻譯彙總而來,我覺得講的挺明白的,其中加入了我的一點點理解和擴充。
一、文本產生及其作用方式
How text reflects its producer?
How text impacts its receiver?
文本信息的 生產者producer 與 消費者receiver ,涵蓋 個人、公司(組織)、國家(社會) 三個層面。
需要注意的是文本的 反映reflects 和 影響impacts 並不是非此即彼,往往會同時起作用。
二、如何使用文本數據
三、文本信息的指標
粗略的分,文本信息可以分爲定性與定量兩種類型
早先的營銷領域,如在線評論文本分析指標多爲
數量,如文本長度(e.g., Godes and Mayzlin 2004; Moe and Trusov2011)
情感得分(效價,評論評分) (e.g., Godes and Silva 2012; Moe and Schweidel 2012; Ying, Feinberg and Wedel 2006)·
方差,如信息墒(e.g., Godes and Mayzlin 2004).
然而如今這些指標經常忽略了文本的豐富度。以下幾種是更好用的指標
四、文本分析步驟
五、文本分析技術對比
從左向右,自動化程度越來越高,人工介入的越來越少
據被壓縮成詞組頻數,定性的文本數據轉化爲定量的頻數。本課程中會涉及到的內容(x到的部分)
[ ] Thematic Analysis 定性
[x] Content Analysis
[x] Dictionary
[x] Bag of words 詞袋法
[x] Supervised ,監督學習 文本分類問題
[x] Unsupervised,如非監督LDA話題模型
[ ] Natural language processing
相關文獻
[1]Berger, Jonah, Ashlee Humphreys, Stephan Ludwig, Wendy W. Moe, Oded Netzer, and David A. Schweidel. "Uniting the tribes: Using text for marketing insight." Journal of Marketing (2019): 0022242919873106.
[2]Kenneth Benoit. July 16, 2019. “[Text as Data: An Overview](https://kenbenoit.net/pdfs/28 Benoit Text as Data draft 2.pdf).” Forthcoming in Cuirini, Luigi and Robert Franzese, eds. Handbook of Research Methods in Political Science and International Relations. Thousand Oaks: Sage.
[3]Banks, George C., Haley M. Woznyj, Ryan S. Wesslen, and Roxanne L. Ross. "A review of best practice recommendations for text analysis in R (and a user-friendly app)." Journal of Business and Psychology 33, no. 4 (2018): 445-459.
往期文章Python語法快速入門
Python網絡爬蟲與文本數據分析
讀完本文你就瞭解什麼是文本分析
綜述:文本分析在市場營銷研究中的應用
R語言dplyr包實操
小案例: Pandas的apply方法
從記者的Twitter關注看他們稿件的黨派傾向?
Pandas時間序列數據操作
70G上市公司定期報告數據集
文本數據清洗之正則表達式
shreport庫: 批量下載上海證券交易所上市公司年報
Numpy和Pandas性能改善的方法和技巧
漂亮~pandas可以無縫銜接Bokeh
YelpDaset: 酒店管理類數據集10+G
半個小時學會Markdown標記語法
後臺回覆關鍵詞【文本分析論文】,可獲得文本分析相關文獻