原创 字節跳動面試準備(參考面經)

算法: 字節跳動,蘑菇街涼麪 字節跳動-ailab-視覺算法面經 字節跳動算法崗一二面面經 字節跳動算法工程師崗一二三面經 字節跳動算法二面涼經 字節二面涼經 字節跳動面試一面涼涼 字節跳動算法崗一面涼經 字節跳動ailab面經

原创 python爬蟲(Python讀取TXT文件中的URL並下載文件)

前言:本人之前並沒有接觸過python爬蟲,但是現在因爲要做個試驗,需要下載海量人臉圖片,所以需要用到python爬蟲這個辦法。但是過程中遇到到了很多問題,程序調了很久都不成功,終於調通了,所以就記錄一下,萬一以後還能用到呢(順便

原创 機器學習之邏輯迴歸代碼

下面主要提供邏輯迴歸的代碼。 數據下載:數據下載 這是老師佈置的作業,現把完整代碼附上。 代碼如下(python 3.6): # -*- encoding: utf-8 -*- from __future__ import

原创 Resnet解決了什麼問題

先貼出論文的鏈接吧:If resnets are the answer, then what is the question? 從現在的網絡發展趨勢來看,網絡越深,精度會越高,但是傳統的堆疊網絡卻無法不斷加深網絡層數,原因是梯度

原创 排序算法(冒泡排序,選擇排序,快速排序)

排序算法作爲程序員必須掌握的最基礎算法,想到明年就要找工作了,心裏發慌,乾脆先從基礎做起並做點筆記。 一 冒泡排序(從小到大) 思想:在每一輪排序過程,都比較相鄰的元素,若前者大於後者,則進行交換,一輪結束後,最大的元素便移動到

原创 機器學習之python讀取CSV文件

當我們在用python處理機器學習的問題時,往往需要先讀取數據,這些數據通常都是文件,我今天遇到的是CSV文件,是在kaggle競賽數據集下載的(比如手寫數字識別,以及我在博客中用到的泰坦尼克數據都是CSV文件)。 數據下載地址

原创 阿里筆試3.23

才發現,做筆試犯了一個很低級的錯誤,導致一道題都沒通過,也不知道對不對,將就看吧 # 第一題:給定一個3*n的矩陣,從每一列選出一個數字組成一個長度爲n的列表,使得列表的絕對值之和最小,即sum(a[i]-a[i+1]). a=[

原创 優酷視頻增強和超分表率挑戰賽總結

Team 1st 研究現狀: 1 殘差結構:EDSR 2 多分支結構:REDNet 3循環結構:DRCN 4 漸進式結構:SCN 5 注意力機制:RCAN,DRLN 6 對抗模型:ESRGAN 視頻幀對齊 視頻幀融合 方法:三維卷

原创 XGBoost 生成的樹

之前我有個疑問,XGBoost,生成的樹種,每棵樹用到了一樣的特徵碼? 所以,首先需要把樹給畫出來,請參考以下鏈接: https://blog.csdn.net/anshuai_aw1/article/details/829884

原创 機器學習之邏輯迴歸

我們知道,線性迴歸預測的是一個連續值或者任意實數,接下來,我們要解決的是一種0-1問題,也就是一種二分類問題。 邏輯迴歸在本質上和線性迴歸是一樣的,只是它在特徵到結果的映射加入了一層非線性映射,如下所示: 其中g(

原创 Robust PCA Low-rank(附matalb 代碼)

最近在看的論文中,包括人臉識別,以及深度神經網絡模型壓縮等論文中,都會有low-rank(低秩),低秩稀疏分解等解決方法,感覺關於low-rank的研究還挺火的,這個問題和Robust PCA問題很像,都需要解決一下問題:

原创 奇異值分解(SVD)

奇異值分解在矩陣理論中非常重要,也有很多實際運用,比如推薦系統,利用滿秩分解還能節約存儲空間。 在介紹原理之前,先說一下一些概念: 1 酉(you,三聲,我都不知道這個字怎麼讀,哈哈)矩陣。 如果n階復矩陣A滿足:

原创 機器學習初步瞭解

初學機器學習,作爲一個入門的新手,且第一次寫博客,因爲時間比較多同時也爲了理解地更加深刻,就把自己的想法寫出來,將來如果需要用到的話,也方便找到,理解地可能不是很準確,望大家理解。 重點內容 對機器學習的理解

原创 分享一個完整的scikit-learn 學習地址

scikit-learn 官方文檔中文教程: https://sklearn.apachecn.org/ 對應的github地址: https://github.com/scikit-learn/scikit-learn 在這個教