原创 【收藏】100 個 PyCharm For Mac 快捷鍵

作爲真正生產力工具的 Mac, 在 Python 開發中配合 PyCharm 快捷鍵, 可以讓生產力倍增, 本文用 按鍵位分類 和 按功能分類 兩種方式整理 PyCharm 的快捷鍵. 對於筆者認爲很有用, 但初學者可能未使用過的快捷鍵,

原创 LeetCode每日一題14. 最接近的三數之和

題目 給定一個包括 n 個整數的數組 nums 和 一個目標值 target。找出 nums 中的三個整數,使得它們的和與 target 最接近。返回這三個數的和。假定每組輸入只存在唯一答案。 例如,給定數組 nums = [-1,2,1

原创 LeetCode 每日一題 230. 二叉搜索樹中第K小的元素

題目 給定一個二叉搜索樹,編寫一個函數 kthSmallest 來查找其中第 k 個最小的元素。 說明: 你可以假設 k 總是有效的,1 ≤ k ≤ 二叉搜索樹元素個數。 示例 1: 輸入: root = [3,1,4,null,2],

原创 查找論文文獻的小技巧

Intro 無論是大學期間的小論文還是令人頭禿的畢業論文, 查找文獻是必不可少的環節. 而這個過程說到底就兩句話: 去哪裏找 在哪裏下 本文以工科論文爲背景撰寫, 以查找 "模式識別" 這一關鍵詞爲例. 去哪裏找 維基百科 維基百科

原创 Django 博客生成 Markdown 摘要的幾種方式對比

方式一: 直接取 Markdown 文字的前100個字(不推薦) 這種簡單粗暴的方式很不友好, 如果開頭是一張圖片或者是鏈接, 那麼用戶可能只看到鏈接, 體驗感很差. 方式二: 使用正則去掉Markdown (有門檻) 通過研究 Mark

原创 爲你的爬蟲添加 IP 池反反爬策略

最近發現自己之前爬的某個網站更換了新的網頁設計,於是重寫了爬蟲,在測試的時候突然被封了 IP,雖然說一般網站都不是永久封 IP,但是等不了的我還是嘗試用 IP 池來突破該網站的反爬。 而就在我測試爬下來的 IP 能不能使用的時候,某提供

原创 無監督學習 - 聚類度量指標

簡介 首先必須明確,分類和聚類是兩個不同的東西。 分類的目的是確認數據屬於哪個類別。分類必須有明確的邊界,或者說分類是有標準答案的。通過對已知分類數據進行訓練和學習,找出已知分類特徵,再對未知分類的數據進行分類。因此分類通常是有監督學習。

原创 無監督學習的聚類度量指標

目錄簡介外部信息指標調整後的 Rand 指數(Adjusted Rand Index,ARI)Fowlkes-Mallows 指數(Fowlkes-Mallows index,FMI)Jaccard 指數內部信息指標輪廓係數(Silh

原创 爬蟲的另一種思路 -- robots.txt

近兩年出現曾報道一些關於非法抓取數據的程序員被告上法庭的事例, 而非法抓取的一個典型做法就是不遵守網站的 robots.txt 規則進行爬取. 早年就曾有搜索引擎不遵守淘寶的 robots.txt 還去收錄網站的信息被告的案例. 在 Sc

原创 Python Web工程師面試總結(二)- Python基礎

上篇籠統地聊了整個知識框架,這一篇會重點談談其中的常問的 Python 基礎知識部分。 題目: 談談 Python2 與 Python3 的差別 Python 中的單下劃線與雙下劃線分別指什麼 聊聊 Python 中的可變對象與不可變

原创 Python Web工程師面試總結(一)- 總體框架

面試了一家初創公司, 面試官問的問題並不是說很難, 但是覆蓋面比較廣, 有一些基礎概念不清晰的話, 很容易被問倒. 一些資料顯示, 對 Python Web 開發工程師的一些技術棧要求如下: 熟悉Python語言 對 HTML/ CS

原创 一次 Python Web工程師面試總結(上)

面試了一家初創公司, 面試官問的問題並不是說很難, 但是覆蓋面比較廣, 有一些基礎概念不清晰的話, 很容易被問倒. 一些資料顯示, 對 Python Web 開發工程師的一些技術棧要求如下: 熟悉Python語言 對 HTML/ CSS

原创 將博客搬至CSDN

FesonX將博客搬至CSDN,今後會同步更新

原创 將博客搬至CSDN

FesonX將博客搬至CSDN,今後會同步更新

原创 LeetCode每日一題122: 買賣股票的最佳時機 II

題目 給定一個數組,它的第 i 個元素是一支給定股票第 i 天的價格。 設計一個算法來計算你所能獲取的最大利潤。你可以儘可能地完成更多的交易(多次買賣一支股票)。 注意:你不能同時參與多筆交易(你必須在再次購買前出售掉之前的股票)。 示例