我在git上push了我的代碼。同時做成jupyter view。
csdn取消了對jupyter view的支持,請移步。
這裏記錄我在解決1st place 方案時積累的知識. 1*1的卷積核的作用:可以增加通道或者降低通道數量,減少訓練參數. Xception: 綜述 Momentum優化SGD 遷移學習:根據數據集分四種情況,1.數據集比較小且
Display Advertising Challenge ---------2015/1/12 一:背景 CriteoLabs 2014年7月份在kaggle上發起了一次關於展示廣告點擊率的預估比賽。CriteoLabs是第三方展示
前言 第一次嘗試Kaggle,是經典的手寫數字識別的例子,其實這個MNIST數據集識別已經玩膩了,只不過這次是在Kaggle上,用他完成一整套的競賽流程,爲以後的大數據競賽做好準備,其實,對我而言,這次的MNIST數據集識別與平時
下週一平安科技的遠程面試,準備30分鐘的PPT,主要是介紹相關項目經驗,着重技術,代碼,模型,算法等方面 今天大致看了一下kaggle上面的入門級比賽,主要是熟悉一下流程 首先要註冊kaggle賬號,我用的是gmail郵箱登錄的
Instacart Market Basket Analysis kaggle賽題鏈接 數據理解 比賽使用的數據僅包含交易數據,不包含瀏覽數據。主要由以下幾張表構成: 訂單表 orders(訂單ID,用戶ID,所屬數據集,該用
分析數據-設置驗證集-檢查數據泄露 分析步驟: 瞭解領域知識 搜索關鍵詞,搜索數據的含義 檢查數據是否存在異常值,超出範圍的值 理解如何生成特徵 分析匿名數據(Anonymized data) 對於某些數據
均值編碼(mean ecoding) 1)有監督類型的編碼方式:根據label進行編碼,在類別Moscow中的feature_mean = #(target=1)/#Moscow(注意與frequency encoding編碼的區別)
前言 第一次參加Kaggle的時候,看了很多入門帖,但是還是看不懂不知道到底怎麼參加,是在Kaggle上提交代碼嗎,像互聯網公司程序員在線考試一樣?還是提交預測的結果? 沒有一個像”Hello World”一樣簡單但是又完整的流程
文章目錄0.寫在前面1.EDA1.1 觀察數據1.2 處理缺失值1.3 挖掘數據隱含信息以便模型利用2.Deep Feature Engineering3.特徵篩選+降維(實驗記錄)4.lightGBM+best_paramete
建築樓層大規模能量預測代碼筆記 記錄的都是一些python的寫法問題,歸結於自己太菜了,python如此強大的功能,很多都沒看到過 from sklearn.preprocessing import LabelEncoder fr
百度AI Studio使用kaggle的記錄 因爲沒有實際主機,所以只能白嫖百度的這個免費算力,然後想用它跑一些代碼,比如kaggle上面的競賽題目,可是數據集不能直接下載,如果下載到本地,數據集太大不給上傳,所以只能通過命令行的
Kaggle --ASHRAE - Great Energy Predictor III 和大佬室友進行這種比賽,完全不知道該怎麼搞啊,只能在kaggle上面看了看別人的東西,這個大佬寫的還挺簡捷的,所以自己拷貝下來運行了一遍
Kaggle Digit Recognizer別人分享的tricks 自己在利用CNN做了kaggle上的入門題——Digit Recognizer,簡單的利用了CNN的網絡架構就實現了0.98+的準確率,但還是不夠啊,所以看了上
目錄 讀取數據 表格類型數據 讀數據,看行數、列數,前幾行 EDA 查看目標變量分佈 目標變量爲分類變量 查看缺失值 目標dataframe缺失數據的分佈 查看不同類型變量情況 Category/分類變量預處理 object類型的變量
IEEE Fraud Detection - Data Processing and Simplest Model In this section we will do some data cleaning jobs, which