原创 自己動手寫網絡爬蟲學習筆記

剛開始學《自己動手寫網絡爬蟲》,只實現了第一部分的內容。現在做一個總結。 這本書中主要用到了HttpClient和HtmlParser這兩個開源的jar包。同時,還要依賴codec.這個開源包。 HttpClient用的是3.x版本的

原创 latex調整itemize的間距大小

原文鏈接:http://blog.csdn.net/fandroid/article/details/54644966 問題:默認情況下itemize的各項間的間距較大,佔用文章空間較多,那麼如何調整呢? 方法: 1. 單獨設置每

原创 EM算法和GMM

最近在學習Andrew Ng 教授的機器學習課件。第7和第8章,主要講解EM算法和GMM。論文講解淺顯易懂,但有些內容不完整。比如,沒有寫出來協方差Σ 的求解過程,沒有具體的實例應用。本文在原論文的基礎上,增加了協方差的求解過程,和使用G

原创 推薦系統-基於隱語義模型(LFM)

在上一篇博客,我們大致講解了《推薦系統實踐》中基於鄰域的算法和代碼實現,在這一篇博客,我們繼續講解基於隱語義模型(Latent Factor Model)的推薦系統。 隱語義模型是近幾年推薦系統領域最爲熱門的研究話題,它的核心思想是通過隱

原创 LeetCode 338. Counting Bits

Given a non negative integer number num. For every numbers i in the range 0 ≤ i ≤ num calculate the number of 1’s in th

原创 Python import機制詳解

文章轉載於:點擊打開鏈接 一 module通常模塊爲一個文件,直接使用import來導入就好了。可以作爲module的文件類型有".py"、".pyo"、".pyc"、".pyd"、".so"、".dll"。 二 package通常

原创 推薦系統-基於鄰域的算法

最近在看項亮的《推薦系統實踐》,文章只有只有代碼片段,沒有完整的代碼。所以在原有代碼之上,根據書籍介紹的內容,還原了部分代碼。 UserCF算法(基於用戶的協同過濾算法): 令N(u) 表示用戶u 的正反饋的物品集合,令N(v) 表示

原创 LeetCode 322. Coin Change

You are given coins of different denominations and a total amount of money amount. Write a function to compute the fewe

原创 python中的combinations和permutations

排列和組合是數論中的基本概念。在python中,實現了組合函數combinations 和 排列函數permutations。兩個函數都在itertools包中。舉例如下: from itertools import combinatio

原创 Python 程序擴展名(py, pyc, pyw, pyo, pyd)及發佈程序時的選擇

擴展名 在寫Python程序時我們常見的擴展名是py, pyc,其實還有其他幾種擴展名。下面是幾種擴展名的用法。 py py就是最基本的源碼擴展名。windows下直接雙擊運行會調用python.exe執行。 pyw pyw是

原创 handsontable所有版本下載地址

Handsontable Community Edition (CE) 是一個開源的JavaScript電子表格組件,非常流行的web應用程序的UI組件,可用於 各種技術,如React、Angular和Vue,它很容易與任何數據源集成並提

原创 換零錢問題

題型1:求總數 1角 2角 5角硬幣有無限個,給定一個money值,求由可以兌換的硬幣的組合數 思路: 完全揹包的變體。 dp[i][j]表示前i個硬幣且要兌換的錢數爲j時的總的組合數, 假設money = 6,具體情況如下:

原创 Linux常用命令

1 如何從標準輸入讀取數據 使用read命令。 myvar=”Hi there” read myvar 2 每個腳本開始的 #!/bin/sh 或 #!/bin/bash 表示什麼意思 ? 表示使用的shell。#!/bin/sh

原创 LeetCode 32. Longest Valid Parentheses

Given a string containing just the characters ‘(’ and ‘)’, find the length of the longest valid (well-formed) parenthes

原创 機器學習總結之第二章模型評估與選擇

原文鏈接:點擊打開鏈接 2.1經驗誤差與過擬合 錯誤率 = a個樣本分類錯誤/m個樣本 精度 = 1 - 錯誤率 誤差:學習器實際預測輸出與樣本的真是輸出之間的差異。 訓練誤差:即經驗誤差。學習器在訓練集上的誤差。 泛化誤差:學習器在新