原创 Python3爬蟲之二網頁解析【爬取自己CSDN博客信息】

        與Java類比,Java的網頁解析有Jsoup工具,Python的網頁解析工具對應的是BeautifulSoup。詳情可以閱讀其官方文檔。         這裏以爬取我的CSDN博客信息,包括獲取每篇博客的標題、鏈接、書寫

原创 Java爬蟲系列之三模擬瀏覽器【模塊瀏覽OSChina網站】

        第一節的學習使得我們學會使用HttpClient請求網頁的基本方法;第二節進一步學習了Jsoup從網頁中解析出所需要的內容。但在請求時,我們仍可能遇到目標網址沒有錯,但就是請求得不到響應的情況,比如OSChina、CSD

原创 日誌記錄方法---SLF4J和Log4j

        SLF4J(Simple Logging Facade For Java),沒有實現具體的日誌解決方法,只是一個抽象塊層,使代碼可以獨立於任意特定的日誌API。         Log4j(Log For Java),是A

原创 日誌規範建設

一、日誌 1、日誌的作用 日誌記錄用戶操作、系統運行狀態,好的日誌系統可以幫助研發和運維: 掌握線上服務運行狀態; 快速定位線上問題; 發現系統瓶頸; 服務報警; 挖掘數據價值; …… 2、日誌級別 基本級別(由低到高): DEBUG:T

原创 Kafka知識點總結二

        上一節從各概念入手總結了Kafka的知識,這裏從系統結構展開,進一步總結Kafka的知識點。         Kafka以集羣的方式部署,集羣由多個服務器(Broker)組成,每個Broker的Kafka由哪些層組成呢?答

原创 Python3爬蟲之四簡單爬蟲架構【爬取百度百科python詞條網頁】

        前面介紹了Python寫簡單的爬蟲程序,這裏參考慕課網Python開發簡單爬蟲總結一下爬蟲的架構。讓我們的爬蟲程序模塊劃分更加明確,代碼具有更佳的邏輯性、可讀性。因此,我們可以將整個爬蟲程序總結爲以下5個模塊:    

原创 Java註解及通過自定義Java註解實現數據庫的操作

在Java程序中通過註解,可以讓編程更加簡潔、代碼更加清晰。因此在Java框架代碼中,嵌入了大量的註解。 講註解,首先得講註解的概念:Java提供了一種原程序中的元素關聯任何信息和任何元數據的途徑和方法。 一、註解的分類 1、按照運行機制

原创 Java爬蟲系列之四模擬登錄【模擬登錄人人網】

        通過前面的學習,我們已經可以對不需要登錄的網頁正常訪問,但現在的網頁大部分都需要用戶註冊,因此這裏以學人人網爲例,學習一下網站的模擬登錄。         首先對http://www.renren.com/進行爬取,對得到

原创 Spring boot之AOP面向切面編程

        如果說依賴注入(DI,Dependency Injection)有助於應用對象之間的解耦,那麼面向切面編程(AOP,Aspect Oriented Programing)則有助於橫切關注點與它們所影響的對象之間的解耦!!!

原创 Kafka知識點總結一

        之前學習過kafka,但在項目中用的時候,發現還有一些點特別需要注意,這裏全部總結一下: 1、Kafka是一個【消息訂閱-發佈系統】         由消息生產者(Producer)和消息消費者(Consumer)組成,P

原创 Python3爬蟲之五網頁下載器的幾種方法【Python使用cookie模擬登錄CSDN】

(1)直接請求 from urllib import request # 目標網址 url = "http://www.zhihu.com" # 直接請求 response = request.urlopen(url) # 獲取

原创 Spring boot之代碼規範書寫

        在實際工程中的代碼應該儘量保證良好的代碼風格,這裏以前面的例子爲例:向數據庫中插入學生信息時,如果學號滿足要求,插入成功,則返回該記錄具體信息字段;如果插入失敗,則返回錯誤及錯誤提示信息。 第一步:首先建立一個消息返回內容

原创 Python3爬蟲之六網頁的初步分析【抓取豆瓣最新電影影評並用詞雲顯示】

在做本章內容之前,先做兩件事:1、安裝結巴分詞jieba;2、安裝雲詞庫wordcloud 一、安裝結巴分詞 1、上Git上下載Jieba源碼:https://github.com/xingzhexiaozhu/jieba 2、進入對應的

原创 Spring boot之單元測試

        在寫工程代碼的時候,經常需要調試自己的方法、接口是否有問題,能否正常調用,尤其多人合作開發項目時,工同程的融合,每個接口的問題都將導致工程不能正常運行。        對於Spring boot程序,框架對測試提供了很好的

原创 Python3爬蟲之一初試

        前面系列學習了Java的爬蟲,相比而言,樓主更傾向於Python簡潔易懂。與Java類似,都要封裝請求,Python2系列使用的是urllib2,Python3後全部融合爲urllib。         下面以請求知乎首頁