原创 一個遊戲社交產品

現在朋友圈也好,QQ空間也好,都充斥着大量不想看到的信息,新浪微博更是讓人沒有打開的慾望。這其中的無聊的內容主要分兩種:一種是來自偶爾發有用信息的無聊的人,比如一些公共號;另外一種是有趣的人偶爾發的無聊的東西,比如正在做代購的朋友。那是不

原创 如何評論一個網站

續上篇。 其實跟登錄網站一個道理,把評論內容以及特定的字段post到特定的網址即可。因爲我並沒有這方面興趣,也研究不深,只能泛泛的說說。 首先還是抓取,看看發送過去的是什麼。比如csdn: 發現其他兩個字段是空的,只需要發送內容字段就

原创 如何登錄一個網站

登錄一個沒有驗證碼的網站是很簡單的,只需要找到登錄的地址,再post它所需要的包即可。 首先就要抓取發送的包。我這裏用的是firefox的httpfox插件。 如圖就是我在研究刷評論的時候的截圖,post方法後面的就是登錄網址,而下面

原创 Mac如何修改文件夾權限

續《如何卸載canopy》 卸載canopy之後,重新安裝了MySQLdb,當新建cursor時,會提示以下錯誤: The Python egg cache directory is currently set to: /Users/

原创 計算機網絡的受攻擊能力分析

計算機網路可以看作無向圖,我以其中最大的連接體的大小來衡量網絡的能力。實際上,攻擊網絡,也就是把網絡分割成一個一個的小連接體。 源代碼:https://github.com/gt11799/computer_network_analyse

原创 無向圖處理的四個基礎模塊

源代碼:https://github.com/gt11799/undirected_graph_compute Coursera算法課的本週應用是建立在無向圖的處理上的。根據要求,我寫了四個處理模塊。 def bfs_visited(ug

原创 python中使用mysql要注意的問題

最近在爬蟲有些進展,決定用mysql儲存數據。今天遇到了很多問題,一一記下來作爲備忘。 雖然說root用戶最好不用,但是,新增加一個數據庫之後,權限的設置着實讓人頭疼,有時候把所有的權限都給了,依然說沒有權限。最好是用root測試完成之後

原创 手工分析網頁內容

今天學到的東西都沒有什麼技術含量,但是又實在是累了,學不進去了。就寫下來吧。 這裏有個矛盾,我今天寫的這篇文章涉及很多不相干的知識點,如果分成多篇文章,會有更大的可能性被搜索到;但是寫成一篇更像是一天的總結,而且這些知識點拆開來都是可以谷

原创 如何登錄csdn

csdn一直是我比較討厭的網站之一,總感覺它是想寧可錯殺一千,絕不放過一個。爬蟲抓取,遠程登錄等等都設置了很多障礙。 csdn登錄的時候會發過來一個webflow號碼,登錄的時候需要一起發回去。這個其實很簡單,先對網站發送一個get請求,

原创 測試array的迭代效率(如何選取迭代順序)

一個函數有兩個輸入量,一個算術複雜度高,一個算術複雜度低,你會把哪個放到外循環,哪個放到內循環? 想想也知道應該把算術複雜度低的放到內循環,因爲每次外循環迭代,內循環就要計算一次。 如果是用array類型,那麼內循環就省了(可以直接計算數

原创 heapq簡析

今天發現了一個很好玩的python模塊-heapq heapq是python核心庫之一,運用的是最小堆的排序算法。它保證了列表在一系列操作之後,始終保證了a[0]是最小值。 最小堆排序算法:簡單來說,就是數據儲存在一個二叉樹中,這個二叉樹

原创 如何把列表儲存在文件中

當一個列表比較大時,想要把列表(或者其他類型)永久儲存,或者用文件中轉。那麼怎麼把列表儲存在文件中呢? 本週我要運算一個很大的列表,該列表的處理又橫跨多個模塊,如果使用return傳遞,就太佔內存了。 普通的文件只能存儲str類型,需要把

原创 matplotlib中的subplot 練習

今天用到了matplotlib中的subplot,本來看起來很簡單的運用,卻也不怎麼順利。 用nodes的數量和概率p產生有向圖,我希望自己的結果中能夠呈現同一概率,不同nodes的對比,以及同樣數量的nodes,不同概率的對比。 遇到的

原创 Mac 如何卸載canopy

Canopy是python的編輯器之一,當我開始學python的時候糊里糊塗的就用上了。Canopy自帶很多的擴展包,其中包括了ipython和pip,以及我自己安裝的easy_install,以致於用pip和easy安裝的其他擴展包都安

原创 用python繪出一個莫比烏斯環

昨天寫了一篇subplot的練習放到微信公衆賬號中,想用一個莫比烏斯環的圖片作爲封面圖片,就去維基百科上扒了一個。但是分辨率很低,就想自己繪出一個來。沒想到越陷越深,就一起把3D繪圖給學習了一遍。 (我昨天在CSDN發表了這篇文章,今天竟