1.pandas入門:十分鐘搞定pandas
2.scikit-learn入門:sklearn使用總結
sklearn主要模塊和基本使用
簡介:經濟學家關心的一個重大問題是:人工智能會對就業帶來怎樣的衝擊?一個似乎取得了共識的觀點是:人工智能暫時會給就業市場帶來衝擊,導致結構性失業劇增,但長期來看,由於新技術開闢了新經濟領域,這種失業問題不一定會比現在更嚴重。原文鏈
機器/深度學習概率論與數理統計學習筆記
決策樹、隨機森林、GBDTxgboostfastRGF
準確率(查準率)、召回率(查全率)、F值 正確率、召回率和F值是目標的重要評價指標。 正確率 = 正確識別的個體總數 / 識別出的個體總數 召回率 = 正確識別的個體總數 / 測試集中存在的個體總數 F值 = 正確率 * 召回率 *
分類問題損失函數——交叉熵(crossentropy)和Softmax 交叉熵 交叉熵刻畫了兩個概率分佈之間的距離,是分類問題中使用廣泛的損失函數。給定兩個概率分佈p和q,交叉熵刻畫的是兩個概率分佈之間的距離: 對於交叉熵理解比較透徹:
數據歸一化(概率模型不需要) 目的:就是將數據的所有特徵都映射到同一尺度上,這樣可以避免由於量綱的不同使數據的某些特徵形成主導作用。 優點:加快了梯度下降求最優解的速度(橢圓、圓);有可能提高精度(原始數據可能突出數值較高的指標在綜合分析
L0正則化的值是模型參數中非零參數的個數。 L1正則化表示各個參數絕對值之和。 L2正則化標識各個參數的平方的和的開方值。 先討論幾個問題: 1)實現參數的稀疏有什麼好處嗎? 一個好處是可以簡化模型,避免過擬合。因爲一個模型中真正重要的參
簡介:視覺目標跟蹤 (visual object tracking) 是計算機視覺 (computer vision) 領域的一個重要研究問題。通常來說,視覺目標跟蹤是在一個視頻的後續幀中找到在當前幀中定義的感興趣物體 (obje
簡介:從2019年雙十一的 “蓋樓 ”到今年618的 “開列車”,在大促互動遊戲背後,是業務多變性、產品穩定性和研發效率的多重博弈。本文介紹了淘系互動前端團隊如何應對研發效率 & 產品穩定性的挑戰,內容涵蓋“互動智能測試” & “
簡介:什麼是搜索的時效性?有哪些特徵?如何優化?本文分享神馬搜索在搜索排序時效性問題上的實踐和探索,從基礎特徵優化開始,通過標註數據進行排序和召回模型優化,以及時效性排序的召回體系和收錄體系。較長,同學們可收藏後再看。一 問題定
對模型評估,我們需要得到的文件: 1.各類檢測到的目標框txt文件。需要通過下面對程序生成。 txt文件內容如下,第一列是圖像名字(不帶後綴),第二列是置信度,剩下依次是xmin、ymin、xmax、ymax 2.Annota
簡介:達摩院發佈的 “2020 十大科技趨勢” 預測中,一個重要趨勢就是人工智能從感知智能向認知智能演進。作爲認知智能的一個重要核心技術,自然語言處理在過去一年中有了進一步的發展,無論從技術和產品都有顯著的成果,例如大規模預訓練語
簡介:在解決實際問題的時候,很多人認爲只要有機器學習算法就可以了,實際上要把一個算法落地還需要解決很多工程上的難題。本文將和大家分享如何從零開始搭建一個GPU加速的分佈式機器學習系統,介紹在搭建過程中遇到的問題和解決方法。一 背
簡介:進步是否會持續不減,摩爾定律式的理論在未來幾年或即將碰壁,仍有待觀察。八年前,一種機器學習算法學會了識別一隻貓,它震驚了全世界。幾年後,人工智能可以準確地翻譯語言,打敗世界圍棋冠軍。現在,機器學習已經開始在諸如 “星際爭霸”
簡介:在這個追求高清畫質的時代,我們對渣畫質的容忍度越來越低。在知乎上搜索「低分辨率」、「渣畫質」,會看到一大片諸如「如何補救清晰度低的照片」、「如何拯救渣畫質」之類的問題。那麼,將渣到馬賽克級別的畫面秒變高清,是一種怎樣的體驗?