原创 山東大學實訓 Day10

寫了一下幾種算法模型 def linear_regression(): print("線性迴歸方法") from sklearn.linear_model import LinearRegression from

原创 山東大學實訓 Day11

把上次的模型改成迴歸模型,然後看幾個指標 其他參數不更改的情況下,mae指標達到了200多 調參,整理,最後建立的是4層神經網絡,大小爲128x64x32x1,超過這個就出現過擬合,mae在105左右。  

原创 山東大學實訓 Day8

總算是面試完了,寫這篇博客還沒出結果... 拿到了比較全的數據集,該數據集裏包含了學生的圖書館門禁、借書和消費記錄,以此來預測成績。 做了一下數據的處理: import numpy as np import sys from skle

原创 山東大學實訓彙報

博客瀏覽 1.https://blog.csdn.net/qq_41032884/article/details/106619158 2.https://blog.csdn.net/qq_41032884/article/details/

原创 山東大學實訓 Day9

修改了幾個bug,做了一下數據分析 後50位:   borrow access total_cost meal_cost 1st 2nd count 50.000000 50.000000 50.000000 50.000000 50.0

原创 山東大學實訓 Day6

隔了好幾天,一方面準備保研,一方面因爲和老師商討的結果一直沒下來,老師還在找別的數據集 數據量實在太少了,老師建議我先做個二分類,把每科成績在後15%的認定爲有不及格風險的人,看看效果。 我現在只做了svm,今天上午面試來着。 from

原创 山東大學實訓 Day7

找到一個比較綜合的數據集,打算試一下 用svm做的原數據集,因爲數據量過小,交叉驗證出來的結果p、r和f1值有出現0的情況。 淚流滿面,明天還有面試

原创 容易出錯的大數進制轉換

一開始做題的時候習慣性用int,沒考慮到溢出的問題。 遇到大數類型的題,其都是要通過string類型輸入進行轉換,要額外注意。 以前在做十進制和二進制轉換的時候,通常我們用餘數除2的方法,再將最後的字符串倒過來即可,但在大數情況下,我們不

原创 山東大學實訓 Day4

先比較了幾種模型在數據集上效果,沒調參,效果都不太好 from __future__ import division import time import numpy as np from sklearn.svm import SVR

原创 山東大學實訓 Day3

我錯了,我真的錯了 我爲什麼看到gcForest源代碼裏有邏輯迴歸的字樣,再加上老師沒阻止我,再加上知乎也這麼說,就相信了這能做迴歸任務呢...... 我現在心態爆炸了,重新開始 今天唯一做的就是debug...... 沒了 明天svm迴

原创 山東大學實訓 Day1

經過昨晚的討論,我們暫時做了簡單的分工,我負責算法部分。 這次的項目實訓,我們計劃做一個成績預測系統。目前我們只拿到了學生的慕課學習記錄數據集,上面記錄了學生使用慕課上課的一些情況,比如提交作業數,上課次數,發言等,最後有學生在該課程的成

原创 山東大學實訓 Day2

上午對慕課學習記錄做了預處理 原來的數據樣例: 處理代碼: ''' 對mooc上課記錄數據的預處理 ''' import pandas as pd import numpy as np import json if __name__

原创 山東大學實訓 Day5

昨天晚上的報錯原來是因爲.DS_Store文件 改了錯之後出來的結果當然是非常不理想 ========== data/wlkc120302_mooc.csv ========== ev

原创 DeLiGAN論文筆記

論文鏈接:https://arxiv.org/pdf/1706.02071.pdf 該文主要解決的是在小樣本訓練數據的情況下如何提高數據的多樣性的問題。 論文主要有兩個貢獻點: 對原始GAN用於生成數據的潛在空間(latent space

原创 GAN以及小樣本數據擴增的一些論文筆記

1. 幾種常見的GAN介紹 1.1. 原始GAN 1.2. CGAN 1.3. Semi-Supervised GAN 1.4. AC-GAN 2. Data Augmentation with