原创 一步一步跟我學習lucene(9)---lucene搜索之拼寫檢查和相似度查詢提示(spellcheck)

suggest應用場景 用戶的輸入行爲是不確定的,而我們在寫程序的時候總是想讓用戶按照指定的內容或指定格式的內容進行搜索,這裏就要進行人工干預用戶輸入的搜索條件了;我們在用百度谷歌等搜索引擎的時候經常會看到按鍵放下的時候直接會提示用戶是否

原创 一步一步跟我學習lucene(1)---lucene的IndexWriter對象創建和索引策略的選擇

應工作的需要(數據量大造成原有系統查詢效率低),最近做了搜索引擎相關的內容,之前培訓的時候對lucene即有接觸,當時做的是3.x版本的,本人比較激進,毫不猶豫的選擇了lucene5版本(15年剛發佈的,O(∩_∩)O哈哈~)。 luce

原创 一步一步跟我學習lucene(7)---lucene搜索之IndexSearcher構建過程

最近一直在寫一步一步跟我學習lucene系列(http://blog.csdn.net/wuyinggui10000/article/category/3173543),個人的博客也收到了很多的訪問量,謝謝大家的關注,這也是對我個人的一個

原创 一步一步跟我學習lucene(6)---lucene索引優化之多線程創建索引

這兩天工作有點忙,博客更新不及時,請大家見諒; 前面瞭解到lucene在索引創建的時候一個IndexWriter獲取到一個讀寫鎖,這樣勢在lucene創建大數據量的索引的時候,執行效率低下的問題; 查看前面文檔一步一步跟我學習lucene

原创 Mysql 5.7 Root密碼忘記回覆(重置root密碼)

mysql因其開源且易用的特點佔用了數據庫的大半壁江山,工作中也算是應用的最多的數據庫軟件; 下載了個Mac版的mysql server,版本爲5.7.11,傻瓜式的安裝,安裝成功後提示初始密碼彈窗窗口; 機器上安裝的數據庫軟件是Sequ

原创 一步一步跟我學習lucene(10)---lucene搜索之聯想詞提示之suggest原理和應用

昨天瞭解了suggest包中的spell相關的內容,主要是拼寫檢查和相似度查詢提示; 今天準備瞭解下關於聯想詞的內容,lucene的聯想詞是在org.apache.lucene.search.suggest包下邊,提供了自動補全或者聯想提

原创 java實現類似與redis的hash存儲操作

最近做一個報表系統,統計全天的指定時間的數據,數據又分了好幾類,數據模型如下 time         typeA        valueA time         typeB        valueB 聯想到此種數據存儲模式跟re

原创 一步一步跟我學習lucene(11)---lucene搜索之高亮顯示highlighter

highlighter介紹 這幾天一直加班,博客有三天沒有更新了,望見諒;我們在做查詢的時候,希望對我們自己的搜索結果與搜索內容相近的地方進行着重顯示,就如下面的效果 這裏我們搜索的內容是“一步一步跟我學習lucene”,搜索引擎展示的結

原创 一步一步跟我學習lucene(5)---lucene的索引構建原理

lucene創建索引的原理 IndexWriter的addDocument方法詳解 今天看了IndexWriter類的addDocument方法,IndexWriter對此方法的說明如下: Adds a document to this

原创 一步一步跟我學習lucene(13)---lucene搜索之自定義排序的實現原理和編寫自己的自定義排序工具

自定義排序說明 我們在做lucene搜索的時候,可能會需要排序功能,雖然lucene內置了多種類型的排序,但是如果在需要先進行某些值的運算然後在排序的時候就有點顯得無能爲力了; 要做自定義查詢,我們就要研究lucene已經實現的排序功能,

原创 一步一步跟我學習lucene(14)---lucene搜索之facet查詢原理和facet查詢實例

Facet說明 我們在瀏覽網站的時候,經常會遇到按某一類條件查詢的情況,這種情況尤以電商網站最多,以天貓商城爲例,我們選擇某一個品牌,系統會將該品牌對應的商品展示出來,效果圖如下: 如上圖,我們關注的是品牌,選購熱點等方面,對於類似的功能

原创 利用selenium訪問某網站實現模擬人機交互爬蟲

   高考剛結束,堂侄面臨志願投遞的問題,之前用jsoup模擬抓取過不少網站,但是抓取高考信息網(gkcx.eol.cn)的時候遇到了問題,部分接口返回的內容爲密文,查看網站js,應該是採用了PBKDF2加密方式,而且加密方式也挺複雜,走

原创 java源碼分析二:String類

String類概述 字符串的表示 常量,final修飾,不可變性 String對象具有隻讀特性,指向它的任何引用都不可能改變它的值 +和+=操作   String類實現接口 String主要構造函數 public String() {}

原创 Java源碼分析01-Object類

    衆所周知,object在java中的地位是超然的存在--所有類的默認父類。     基於此,所有對象(包括array)都實現了object類的方法;      Object方法名稱 方法解讀   private static

原创 Java源碼學習(目錄)

    今天開始寫幾個 jdk源碼相關的內容,後續相關博客內容地址會在此博客更新彙總;     源碼分析基於jdk1.8 java源碼分析一:Object類