量化投資學習筆記25——樸素貝葉斯:實操,泰坦尼克號乘客生還機會預測

參考:
https://blog.csdn.net/qian99/article/details/77916806
數據載入和清洗跟前面文章一樣的。
進行樸素貝葉斯模型建模
features = ['Pclass', 'Sex', 'Age', 'Family', 'Embarked', 'Cabin']
model = MultinomialNB(alpha = 2.0)
model.fit(train_data[features], train_data["Survived"])
print("模型評分:", model.score(train_data[features], train_data["Survived"]))
result = model.predict(test_data[features])
輸出到文件
output = pd.DataFrame({'PassengerId': test_data.PassengerId, 'Survived': result})
output.to_csv("submit05.csv", index = False)
print("結果輸出完畢!")
模型評分: 0.7755331088664422
提交一下看看。

結果還不如之前的邏輯迴歸,支持向量機呢!嘗試再改進一下看看,把年齡按15,55爲界劃分爲三個類型。
結果:
模型評分: 0.7721661054994389
還不如沒改呢!也提交一下看看。

結果評分更低了,所以機器學習除了算法選擇,特徵的選擇,處理也很重要。
本文代碼
https://github.com/zwdnet/MyQuant/blob/master/titanic/submit04.py

我發文章的四個地方,歡迎大家在朋友圈等地方分享,歡迎點“在看”。
我的個人博客地址:https://zwdnet.github.io
我的知乎文章地址: https://www.zhihu.com/people/zhao-you-min/posts
我的博客園博客地址: https://www.cnblogs.com/zwdnet/
我的微信個人訂閱號:趙瑜敏的口腔醫學學習園地

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章