原创 迴歸

本文主要記錄一下相關的概念….. Regression 之前研究過的一些通過監督學習解決的分類問題,都具有一個共同的特徵,就是其輸出的類別都是離散型變量。 當我們需要去預測的對象類型是連續類型的時候,該怎麼去解決它呢? 迴歸分析

原创 貝葉斯網絡(筆記)

貝葉斯定理 幾個概念: 1. 條件概率:P(A|B)=P(A⋂B)P(B) ,指在事件B發生的條件下A發生的概率。 2. 聯合概率:即A B同時發生的概率,即P(A,B)=P(A⋂B)=P(A|B)∗P(B)=P(B

原创 Deep Learning - 第一章:前言

作爲入門深度學習的好書:Deep Learning,這裏記錄一下自己閱讀學習過程中一些重要的地方! 表示學習 一般機器學習的任務是提取特徵集,利用特徵集來進行訓練分類。但是對於許多任務來說,很難知道應該提取哪些特徵。解決這個問題

原创 【論文筆記】深度特徵合成:實現數據科學自動化

原論文標題及鏈接:Deep Feature Synthesis: Towards Automating Data Science Endeavors 說明:本文只會介紹論文中博主覺得重要的部分,想要了解更多內容的,建議閱讀原論文哦!

原创 【推薦算法】協同過濾算法 - 簡記

1. 前言 在現今的推薦技術和算法中,基於協同過濾(Collaborative Filtering)的推薦方法是最被大家廣泛認可和採用的。 推薦算法用於給用戶做出合適的內容推薦,其場景用途非常廣泛,最常見的包括音樂歌單推薦,購物商品推

原创 【論文筆記】CatBoost: unbiased boosting with categorical features

原論文地址:here,本文主要記錄論文中重要的部分。 1. Abstract CatBoost 中最主要的兩個算法性的特點在於:實現了有序提升,排列驅動以代替經典算法;一種新穎的算法處理分類變量。這些方法旨在解決prediction

原创 【論文筆記】Hybrid Subspace Learning for High-Dimensional Data

論文鏈接:Hybrid Subspace Learning for High-Dimensional Data 1. Abstract 真實世界中,高維數據是一個非常普遍的問題。在高維空間中學習一個緊的,低維子空間的數據表達有助於區分

原创 【論文筆記】高維基因數據中的特徵選擇

原論文:Feature Selection for High-Dimensional Genomic Microarray Data 介紹 基因數據通常具有較高的維度,同時可用樣本數少。不到100例維度爲7000+的帶標籤的基因表達數

原创 【生存分析】參數模型 - 加速失效(AFT)模型

加速失效(AFT)模型 假設 TTT 爲失效時間,xxx 爲協變量,加速失效(accelerate failure time)模型的假設是,一個人的生存時間等於人羣基準生存時間 * 這個人的加速因子,其數學形式如下: T=t∗eθ⋅x

原创 Deep Survival: A Deep Cox Proportional Hazards Network

相關資源 原論文地址:here 論文中使用的深度生存分析庫:DeepSurv,是基於Theano 和 Lasagne庫實現的,支持訓練網絡模型,預測等功能。 考慮到DeepSurv庫中存在着一些錯誤以及未實現的功能,博主使用目前主流的深度

原创 【降維方法】- 非負矩陣分解【NMF】

簡介 非負矩陣分解(Non-negative Matrix Factorization),作爲一種非監督式的降維方法,其主要思想正如其名字描述的那樣:將一個非負原始矩陣分解爲兩個非負矩陣的積(Vm ∗ n=Wm ∗ r⋅V′r ∗ nVm

原创 使用深度學習進行生存分析

相關資源 原論文地址:here 論文中使用的深度生存分析庫:DeepSurv,是基於Theano 和 Lasagne庫實現的,支持訓練網絡模型,預測等功能。 考慮到DeepSurv庫中存在着一些錯誤以及未實現的功能,博主使用目前主流的深度

原创 【降維方法】- 線性判別分析(LDA)

參考:refenrence 簡介 線性判別分析(Linear Discriminant Analysis)作爲一種監督式的降維方法,同時也用作分類器,它主要思想是:使得對原空間進行投影運算後,類間的樣本點數據分佈間隔大,而類內樣本點數據分

原创 TensorFlow深度神經網絡提前穩定特徵重要性

論文地址:Early Stabilizing Feature Importance for TensorFlow Deep Neural Networks 博客裏只給出一下論文中介紹的方法這一章節,論文中前面介紹了神經網絡中特徵重要性評

原创 Codefest 17 C. Helga Hufflepuff's Cup(樹形DP)

題意: 在一棵樹上進行塗色,總共有 m 種顏色(編號1−m ),其中編號爲 k 的顏色爲特殊顏色,如果樹上一個節點染上了特殊顏色,則其鄰居節點的顏色編號都應該<k ,求在這棵樹上染色總共有多少種方法,染上特殊顏色的節點的數目不超過