原创 python:狂抓“某逼乎”精彩話題,撞破“某榴”新手賬號

上一篇寫了個有意思的文章:python 腳本撞庫國內“某榴”賬號 https://www.52pojie.cn/thread-837912-1-1.html 很多朋友反映,該榴賬號有google驗證,即時撞破賬號也無卵用,其實新手號還是可

原创 知乎話題爬蟲,python語言版

因爲要做觀點,觀點的屋子類似於知乎的話題,所以得想辦法把他給爬下來,搞了半天最終還是妥妥的搞定了,代碼是python寫的,不懂得麻煩自學哈!懂得直接看代碼,絕對可用 #coding:utf-8 """ @author:haoning @c

原创 如何邀請好友註冊您的網站(模擬百度網盤)

    花了一年時間做了個網盤下載站點,有興趣的朋友可以看看站名:去轉盤網 其中有個需求是想模擬百度網盤的邀請好友註冊功能,想了很久果然 "皇天不負有心人" ,終於整理出個思路,並且附上代碼,希望各位網友多多吐槽。我的思路大體是用網絡範圍

原创 怎麼判斷百度網盤分享連接已經失效?其實沒那麼簡單

   我不知道現在有多少人在用網盤搜索引擎,但就去轉盤網來說本人傾注了很多的心血,現在使用的人數也還可以,網盤資源都有個通病,那就是資源可能失效,但很多引擎都沒有做失效判斷,尤其是一些google自定義的引擎,技術含量不高,站長也就花心思

原创 圖片放大功能如何做?jquery實現

花了很長時間擼了個網站,觀點,其中需要一個圖片放大功能,網上找了半天發現都沒有中意的,最後無奈之下自己寫了一個,演示地址,演示圖片: 自我感覺效果還不錯,現在分享開來給大家看看,哪裏不好還請多多指教,謝謝大家。 css 部分: .

原创 百度圖片爬蟲-python語言

上一篇我寫了如何爬取百度網盤的爬蟲,在這裏還是重溫一下,把鏈接附上: http://blog.csdn.net/qq_34844199/article/details/51351680 這一篇我想寫寫如何爬取百度圖片的爬蟲,這個爬蟲

原创 git常用命令彙總(命令行模式)

由於之前做個web項目去轉盤網(http://www.quzhuanpan.com), 和幾個朋友一起做的,考慮到代碼託管,團隊協作,所以深入研究了下git,下面是一些git常用的命令,分享給大家,希望大家喜歡。 TEL:百度網盤爬蟲

原创 怎麼來爬取代理服務器ip地址?

     一年前突然有個靈感,想搞個強大的網盤搜索引擎,但由於大學本科學習軟件工程偏嵌入式方向,web方面的能力有點弱,不會jsp,不懂html,好久沒有玩過sql,但就是趁着年輕人的這股不妥協的勁兒,硬是把以前沒有學習的全部給學了一遍

原创 python語言磁力搜索引擎源碼公開,基於DHT協議

之前我在寫百度網盤爬蟲,百度圖片爬蟲的時候答應網友說,抽時間要把ok搜搜的的源碼公開,如今是時候兌現諾言了,下面就是爬蟲的所有代碼,完全,徹底的公開,你會不會寫程序都可以使用,不過請先裝個linux系統,具備公網條件,然後運行:  pyt

原创 數據庫自動備份原理,實戰

前幾篇博客已經相繼公開了去轉盤網的所有技術細節,如下: 百度網盤爬蟲 中文分詞算法 邀請好友註冊 js分頁部分代碼 這篇博客我將繼續公開數據庫自動備份的代碼。可以這麼說,沒有數據庫,一切就是個蛋,沒有數據庫備份,一切還是個蛋,

原创 搜索引擎之全文搜索算法功能實現(基於Lucene)

之前做去轉盤網的時候,我已經公開了非全文搜索的代碼,需要的朋友希望能夠前去閱讀我的博客。本文主要討論如何進行全文搜索,由於本人花了很長時間設計了新作:觀點,觀點對全文搜索的要求還是很高的,所以我又花了不少時間研究全文搜索,你可以先體驗下:

原创 大量 python 爬蟲源碼分享--說說 python 爬蟲這件小事

沒有爬蟲就沒有互聯網,越來越覺得寫 python 爬蟲原來是一件快樂而高興的事情,以下是本人收集整理的一批 python 爬蟲代碼,順便分享到了別的網站上,喜歡的下下來看看吧。  內容: yunpan.360.cn.py 360 網盤爬蟲

原创 java中文分詞算法

 我想只要是學過數據庫的孩紙,不管是mysql,還是sqlsever,一提到查找,本能的想到的便是like關鍵字,其實去轉盤網(分類模式)之前也是採用這種算法,但我可以告訴大家一個很不幸的事情,like匹配其實會浪費大量的有用資源,

原创 兼容所有瀏覽器的複製到剪切板功能,懸浮層不能複製問題解決

   瀏覽器複製其實是一個十分令人頭疼的問題,因爲這涉及到瀏覽器安全,所以瀏覽器本生不會提供相應接口,我們也沒有辦法通過純js來實現這個功能,但是你會看到很多網站,如百度雲盤他們卻做到了這個功能,那究竟他們是如何實現的,今天就讓我帶你去

原创 網站真分頁js代碼該怎麼寫?

真分頁這個詞對程序猿們來說,並不是一個陌生的詞彙,但是如果你是初次學習真分頁,或許還是得花點時間小小研究下,下面是之前去轉盤網(喜歡的可以看看,也可以進入引擎模式)的真分頁js部分代碼,html部分的我就不寫了,稍微處理下代碼就可以使用