原创 一篇博文讓你看懂網絡爬蟲

本文爲原創博客,僅供技術學習使用。未經允許,禁止將其複製下來上傳到百度文庫等平臺。如有轉載請註明本文博客的地址(鏈接)。 網絡爬蟲的原理 寫網絡爬蟲的原因 網絡爬蟲的流程 java網絡爬蟲要具備哪些基礎知識? 網絡爬蟲的原理

原创 查找算法(1)折半查找法

原理 優缺點 程序範例 原理 折半查找的原理是將排序好的數列分割成兩份,然後將要查找的數字與中間位置的數字比較。如果要查找的數字小於中間位置的數字,就可以確定要找的數字在整個數列的前半段,反之在後半段,如果要查找的數字正好與

原创 算法的時間複雜度

定義 計算方法 舉例說明 常見的時間複雜度 定義 算法的時間複雜度是用一種“概量”的概念來衡量算法的運行時間。當計算時間複雜度的時候,我們會發現其實時間複雜度就是某一算法的執行次數的一個概略的量度。 計算方法 1、找到執行次

原创 經典的營銷管理模型

現在,讓我來爲大家總結幾個重要的營銷管理模型。其中營銷方面的理論模型有4P、用戶使用行爲、STP理論、SWOT等,而管理方面的有PEST、5W2H、時間管理、生命週期、邏輯樹、金字塔、SMART原則等。這些都是經典的營銷、管理方面

原创 程序、算法和數據結構的關係

本文爲原創博客,僅供技術學習使用。未經允許,禁止將其複製下來上傳到百度文庫等平臺。如有轉載請註明本文博客的地址(鏈接)。 數據結構的研究重點是在計算機的程序設計領域,使用何種方式對相關數據組合,以提高程序的執行效率。算法的主要目的

原创 排序算法(1)選擇排序法

原理 舉例 程序範例 原理 選擇排序法屬於排序算法中常見的也是大家最容易理解的排序算法,可以作爲排序算法的入門來學習。 那麼選擇排序法的原理是什麼呢?選擇排序就是當n個數字需要由大到小排序時,首先以第1個位置的數字,依次與

原创 排序算法(2)冒泡排序法

原理 舉例 程序範例 原理 冒泡排序法的名字由來是因爲這種方法排序的原理就好像是水中的氣泡往水面浮一樣。 那麼冒泡排序法的原理是什麼呢?冒泡排序法由第1個數字開始,比較相鄰數字的大小,如果大小順序和所要的不一致時,則將兩個

原创 python基礎知識(一)

python程序元素 1.縮進:1個tab鍵或4個空格,表示代碼的層次關係 2.註釋:註釋不被執行。 單行註釋以#開頭。 多行註釋以三引號開始和結束: “”” xxxxx “”” 3.常量與變量:常量是執行過程中值不發生改變

原创 Hive學習筆記(一)集合數據類型和文本文件數據編碼

集合數據類型 集合數據類型分爲STRUCT,MAP,ARRAY三種。 下面一個例子用於演示如何使用這些數據類型,這是一張虛構的人力資源應用程序的中的員工表: CREATE TABLE employees ( name S

原创 mysql跨服務器存儲

進行網絡爬蟲的時候,爲了檢測爬蟲的java程序有沒有問題,會首先在自己本機的mysql數據庫上測試。當測試完成後,我直接運行程序把數據存儲在了本機的數據庫中。但是畢竟團隊其他成員需要對數據進行處理,所以要把數據放在研究所的服務器上

原创 網絡爬蟲抓包的使用

本文爲原創博客,僅供技術學習使用。未經允許,禁止將其複製下來上傳到百度文庫等平臺。如有轉載請註明本文博客的地址(鏈接)。 網絡爬蟲的第一步就是分析要爬取的數據的類型,這要通過抓包完成。在瀏覽器裏的頁面發生的數據通信,只需要打開Ch

原创 一個程序的設計步驟

本文爲原創博客,僅供技術學習使用。未經允許,禁止將其複製下來上傳到百度文庫等平臺。如有轉載請註明本文博客的地址(鏈接)。 一個程序的設計步驟: 步驟1:需求認識 瞭解程序所要解決的問題是什麼,有哪些輸入和輸出等。 步驟2:設

原创 Eclipse 導入java project亂碼問題

Eclipse導入java project出現亂碼問題,大多都是因爲編碼不對。 只需三步就可以解決這個問題: 對某工程更改編碼: 鼠標移到工程名或文件名,右鍵->Properties->Resource->Text file

原创 python開發環境安裝及配置

Anaconda是什麼? Anaconda是python的一個科學計算髮行版,內置了數百個python經常會使用的庫,也包括做機器學習或數據挖掘的庫,如Scikit-learn、NumPy、SciPy和Pandas等,其中可能有

原创 推薦系統的評測指標新穎性和驚喜度的區別

本文爲原創博客,僅供技術學習使用。未經允許,禁止將其複製下來上傳到百度文庫等平臺。如有轉載請註明本文博客的地址(鏈接)。 什麼是新穎的推薦 新穎的推薦是指給用戶推薦那些他們以前沒有聽說過的物品。 什麼是驚喜的推薦 驚喜的推薦是