原创 Python內存泄露的診斷

Python內存泄露的診斷 內存泄露的原因內存泄露的診斷思路內存泄露診斷用到的工具內存泄露診斷的步驟參考文檔 對於一個用 python 實現的,長期運行的後臺服務進程來說,如果內存持續增長,那麼很可能是有了內存方面的問題。 在我曾

原创 靈異的shell

1 引子2 語法介紹 2.1 定義2.2 管道2.3 引用 (QUOTING)2.4 參數 (PARAMETERS)2.5 擴展 (EXPANSION)2.6 重定向3 小技巧4 工具 4.1 log4sh4.2 shunit4.3

原创 互聯網薪水

原创 機器學習&數據挖掘筆記_16(常見面試之機器學習算法思想簡單梳理)

前言:   找工作時(IT行業),除了常見的軟件開發以外,機器學習崗位也可以當作是一個選擇,不少計算機方向的研究生都會接觸這個,如果你的研究方向是機器學習/數據挖掘之類,且又對其非常感興趣的話,可以考慮考慮該崗位,畢竟在機器智能沒達到

原创 Linux下文本的高效處理

1 引言2 關於輸入3 文本輸出 3.1 整個輸出3.2 部分輸出4 文本搜索 4.1 grep (Global Regular Expression Print)4.2 fgrep4.3 egrep4.4 rgrep4.5 agre

原创 Python pdb 簡要指南

Python pdb 簡要指南 pdb常用的啓動方式 a) 通過 pdb.run 方法: >>> import pdb >>> import mymodule >>> pdb.run('mymodule.test()') b)

原创 理解矩陣,矩陣背後的現實意義

線性代數課程,無論你從行列式入手還是直接從矩陣入手,從一開始就充斥着莫名其妙。比如說,在全國一般工科院系教學中應用最廣泛的同濟線性代數教材(現在到了第四版),一上來就介紹逆序數這個“前無古人,後無來者”的古怪概念,然後用逆序數給出行

原创 推薦系統中矩陣分解方法:svd,非對稱svd和svd++的區別

Some SVD-inspired methods used in the Netflix Prize include: Standard SVD: Once you've represented users and movies as

原创 在Quora上關於netflix的top model的總結

I'll try to describe some of the ideas here. Matrix factorization techniques and ensemble methods are perhaps the algor

原创 理解矩陣、矩陣的現實意義(二)

上一篇裏說“矩陣是運動的描述”,到現在爲止,好像大家都還沒什麼意見。但是我相信早晚會有數學系出身的網友來拍板轉。因爲運動這個概念,在數學和物理裏是跟微積分聯繫在一起的。我們學習微積分的時候,總會有人照本宣科地告訴你,初等數學是研究常量

原创 Cracking the coding interview--問題與解答

作者:Hawstein 出處:http://hawstein.com/posts/ctci-solutions-contents.html 聲明:本文采用以下協議進行授權: 自由轉載-非商用-非衍生-保持署名|Creative Comm

原创 word2vec的學習思路

夜裏坐在椅子上發着呆,想着到底接下來學點什麼比較合適,大腦裏把知識列舉了一遍,卻突然間把之前一直沒有想通的word2vec明白了一些。大致說一下該算法的學習順序所及參考文獻。不會Latex的人只能截圖了…..1. 多層神經網絡  

原创 Implicit data and collaborative filtering(隱式反饋和協同過濾)

這片文章來自spotify,一個美國音樂推薦網站軟件工程師ERIK BERNHARDSSON的文章,文章解釋了推薦系統當中常見的幾個誤區和他自己的一個理解。 A lot of people these days know about

原创 用python寫文件輸出,解決輸出的中文爲亂碼問題

(1)、python代碼文件的編碼 py文件默認是ASCII編碼,中文在顯示時會做一個ASCII到系統默認編碼的轉換,這時就會出錯:SyntaxError: Non-ASCII character。需要在代碼文件的第一行或第二行添加編

原创 數組統計分析

數組統計分析 原題 給定數組A,大小爲n,數組元素爲1到n的數字,不過有的數字出現了多次,有的數字沒有出現。請給出算法和程序,統計哪些數字沒有出現,哪些數字出現了多少次。能夠在O(n)的時間複雜度,O(1)的空間複雜度要求下完成麼?