原创 爬蟲怎麼實現

言歸正傳,java實現網絡爬蟲一般有五種方法(據我所知,要是有其他方法的同學歡迎分享) 1.基於socket通信編寫爬蟲:最底層的方式,同時也是執行最高效的,不過開發效率最低。 2.基於HttpURLConnection類編寫爬蟲:jav

原创 NFA算法

1、問題概述   NFA 和 DFA淺析---要深入瞭解正則表達式,必須首先理解有窮自動機。 有窮自動機(Finite Automate)是用來模擬實物系統的數學模型,它包括如下五個部分: 有窮狀態集States 輸入字符集Input

原创 enjoy模板

--用不到的時候,不要手裏有錘子就看誰都像是釘子 Enjoy 是基於 Java 語言的極度輕量級魔板引擎。僅 171K 並且不依賴任何第三方。極簡設計僅 if、for、switch、set、define、include、render 七個

原创 架構師之路

架構的定義 我們來看看軟件架構的一般定義: 程序和計算系統軟件體系結構是指系統的一個或多個結構。 該結構包括軟件的構建,構建的外部可見屬性以及它們之間的相互關係。 該體系結構不是可操作的軟件。 具體來說,這是一個表達式,它使軟件工程師能夠

原创 go語言入門

go語言的官網訪問不了,建議使用國內的鏡像下載。 一、基本數據類型和操作符 (1)文件名&關鍵字&標識符 1.1、文件名 go程序的文件名後綴爲 .go 1.2、標識符 標識符即表示成變量/函數名/類名等的字符串,以字母或下劃線開頭,大小

原创 PouchDB的簡單用法

簡介 PouchDB是受 Apache CouchDB啓發爲Web設計的一款佔用空間少的數據庫。 PouchDB項目的目標是幫助開發者構建線上和線下都能很好地使用的Web應用程序,在應用程序離線的時候,可以將用戶數據保存在本地,當恢復在線

原创 python入門

爲什麼要學習python 編程語言流行指數(PYPL)排行榜近日公佈了2019年2月份榜單。 在最新一期榜單上,Python的份額高達26.42%,穩居第一,並且猛增5.2%,同時成爲增長勢頭最好的語言。而被擠到第二的Java,目前份額爲

原创 正則表達式總結

1.  技術用途 • 匹配     給定的字符串是否符合正則表達式的過濾邏輯 • 篩選     可以通過正則表達式,從字符串中獲取我們想要的特定部分 2.  內容概述 2.1  元字符   (1)  .:      匹配除了換行符以外的任

原创 git如何切分支

1.簡單說一下在Idea中如何在界面上操作,切分支: (1)用Git管理的項目,點擊Idea界面最底欄的Version Control,會看到每次的提交記錄: (2)在你需要切的那一次提交記錄上,點擊右鍵,選擇New Branch,輸入

原创 Java架構師之路:Java程序員必看的15本書的電子版下載地址

作爲Java程序員來說,最痛苦的事情莫過於可以選擇的範圍太廣,可以讀的書太多,往往容易無所適從。我想就我自己讀過的技術書籍中挑選出來一些,按照學習的先後順序,推薦給大家,特別是那些想不斷提高自己技術水平的Java程序員們。 一、Java編

原创 Vue入門

1.目前主流的前端框架:AngularJS,Vue,React:    注意:BootStrap不是前端框架,只是一個佈局,可以搭配這些前端框架使用;              Jquery不能算是一個前端框架,只能算是一個類庫。 2.三

原创 機器學習十大常用算法

原文出處: 不會停的蝸牛    通過本篇文章可以對ML的常用算法有個常識性的認識,沒有代碼,沒有複雜的理論推導,就是圖解一下,知道這些算法是什麼,它們是怎麼應用的,例子主要是分類問題。 每個算法都看了好幾個視頻,挑出講的最清晰明瞭有趣的,

原创 Java中如何測試一個對象所佔的內存大小

一、 基本的數據類型所佔的內存大小 1.基本的數據類型所佔的內存大小: 類型 名稱 存儲需求/字節 bit數 範圍 整型 byte 1 8 -128~127 最大存儲數據量 255 整型 short 2 16 -32768~32767 最

原创 拜占庭問題

一、定義 1.拜占庭問題        拜占庭問題是分佈式系統中的模型基礎,也是區塊鏈的核心。其根本是假設在消息傳輸過程中,在信道可靠的情況下,如何在有信息欺騙的情況下,做到有效容錯,從而做出正確的決策。 二、相關解決方案 1. 用口頭消

原创 埋點

一、概念 1.埋點 埋點分析,是網站分析的一種常用的數據採集方法,簡單來說,就是在應用中添加監控點。 2.目的 獲取目標數據 二、埋點數據分類 埋點主要應用在電商方面,根據用戶的行爲進行數據統計,再分析數據,爲企業的決策提供數據支撐。主要