機器學習預測評論有用性

literature reviews

Methodology
dataset:294,034 reviewers 

除了消費者的文本反饋外,還收集了消費者的社會地位、餐廳類型、評論日期、餐廳的個別評論者的星級等相關信息。此外,還獲得了對每個獨立審查的有用性投票數,以衡量審查在研究中的有用性

dataprocess

文本預處理過程遵循先前研究的步驟,包括消除非英語字符和單詞、單詞文本標記、詞性標記、替換常見的否定詞、單詞詞幹提取和刪除低頻單詞(少於2%)。

Aspect Extraction

在預處理中去除不相關和非文本的內容後,將評論轉化爲合適的向量。該步驟旨在從獲得的評論中識別主要的餐飲方面。潛在的狄利克雷分配(LDA)識別評論中的主體對象。

Sentiment Detection
情感得分:對每個評論給出一個二元組,For instances, good is scored {3, 1}, and {1, 4} for the  bad .

where S = {s1, s2, ..., sl} denotes the sentiment score of each feature associated with aspect tj
Classifier Set Up
(1)NB+LR;(2) NB+SVM;(3)SVM+FDO

result

這三個城市的餐廳顧客評分以五星(53.62%)爲主,其次是四星(22.78%)和三星(9.94%)。在考據中,69.02%的人沒有得到一票贊成,而15.45%的考據只有一票贊成。只有大約1%的文本評論的支持票高於5票

Model Comparison

良好的口味和食物質量更有可能產生正面的在線評論。然而,本研究強調,顧客傾向於表達對價值的負面情緒,這與之前的研究結果不同,該研究表明,餐廳氛圍的積極情緒得分最低[78],顧客傾向於抱怨服務質量[79]。潛在的原因可能是這項研究從美國三個生活成本相對較高的大城市中提取了餐館評論。

貢獻:提出一種基於aspect的信息度;融合了多種算法

缺點:只選了三個城市,有樣本偏差;做了三分類預測,但是分類標準沒有給出(爲何5votes爲閾值);對不均衡樣本的處理沒有表述清楚;

最後纔看到是MDPI的,還以爲HOSPITALITY MANAGEMENT。。。湊合看吧。。。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章