原创 scala 泛型之初解,定界,類型約束,逆變與協變

scala 的泛型應用如下: 一、初解 當構建一個類或者函數時,如果我們不知道(或者說不確定)傳入的參數的具體數據類型,這時候可以泛型,例子如下: 1-1例子: object test0 extends App{ val str

原创 農業垂直搜索引擎二》系統總設計

3 系統設計 3.1 農業垂直搜素引擎體系結構  由於垂直搜索引擎只對主題進行索引,所以在網絡爬蟲部分需要做普通搜索引擎所沒有的URL過濾。另外在提取信息與普通的搜索引擎不同,這裏需要對html頁面進行解析,並只提取指定的文章標題,時間和

原创 PyDev Unresolved Import Error

引起Unresolved Import的原因有很多,下面我分情況總結一下: 一、如果引入的是python系統包錯誤 這種情況首先確保該model在系統包是存在的。例如 1-1)先在工程的中查看改model是否存在: 1-2)再在Wind

原创 垂直搜索引擎四》文本處理模塊的設計與實現

4.2文本處理模塊的設計與實現 4.2.1 文本處理模塊的總設計 另外還對信息過濾模塊主要要做的事情有三個: (1) 對抓下來的HTML網頁進行解析,提取出所關心的文章標題,時間和正文; (2) 對文章標題和內容進行分詞; (3) 去重。

原创 垂直搜索引擎三》爬蟲機器人模塊的設計與實現

4 功能模塊的設計與實現 4.1. 爬蟲機器人模塊的設計與實現 本系統因爲是隻針對農業進行垂直搜索,所以爬蟲只爬相關的主題內容,所以採取聚焦爬蟲的方式進行。聚焦爬蟲,又稱主題爬蟲(或專業爬蟲),是“面向特定主題”的一種網絡爬蟲程序。它與我

原创 scala map/list/array/的常用內置遍歷操作總結

Scala 是面向函數的,所以在集合函數裏,它很輕易地提供了非常豐富遍歷操作,數組變換操作。這對於我們數據挖掘,爬蟲,文本處理等都非常有幫助。有了這些內置的遍歷變換操作,我們再也不用像java那樣寫一個笨笨的for循環來迭代,然後還要定

原创 垂直搜索引擎七》web模塊的設計與實現

4.5web模塊的設計與實現 4.5.1 web模塊的總設計 Web客戶端主要是業務端的web前後端管理與展示。主要包括的內容有: (1)索引管理; (2)欄目管理; (3)用戶權限管理; (4)前端搜索展示。         Web模塊

原创 Groovy(一)環境搭建

Step1:配置JDK Groovy是依賴於Java的,所以首先要配置好JDK。 Step2:下載Groovy 下載地址,下載下來解壓即可。 Step3:配置Groovy環境變量 新建GROOVY_HOME,值爲剛

原创 Linux 批量更改文件後綴名

原文:http://blog.csdn.net/longxibendi/article/details/6387732 一.rename解決 1.  Ubuntu系統下 rename 's//.c//.h/'  ./*   把

原创 Scala Actor(一):簡單入門

(ps:雖然scala.actors最近被拋棄,但可作爲新手入門理解scala的併發編程原理) 原博文地址爲:http://blog.csdn.net/yyywyr/article/details/50465411 原文如下: Jav

原创 Scala 淺談scala閉包與java回調函數

閉包是指可以包含自由(未綁定到特定對象)變量的代碼塊;這些變量不是在這個代碼塊內或者任何全局上下文中定義的,而是在定義代碼塊的環境中定義(局部變量)。“閉包” 一詞來源於以下兩者的結合:要執行的代碼塊(由於自由變量被包含在代碼塊中,這些自

原创 Scala Actot(二):共享--react,loop,loopwhile實現共享以及while的共享失效性

一、前言 考慮一個發送消息給另一個actor的actor。如果每個actor都在單獨的線程中運行,我們很容易實現控制流轉。作爲消息發送方的actor將消息發到郵箱中,然後它的線程繼續執行。而每當有條目被放入郵箱時,作爲消息接收方的acto

原创 JAVA ArrayList clear() gc()垃圾回收

       下載LOFTER我的照片書  | 一、一個簡單的例子        代碼圖           圖1 圖1爲上代碼圖的運行結果,說明在創建了一個大小爲100W的列

原创 垂直搜索引擎六》搜索與更新模塊的設計與實現

4.4 搜索與更新模塊的設計與實現 4.4.1搜索與更新模塊的總設計 搜索與更新模塊主要是分別對Solr和Luecne的查詢模塊進行封裝。封裝的內容包括: (1) 通用的查詢過程; (2) 把參數封裝爲類; (3) 把返回結果封裝成類;

原创 scala List集合的用法

一、前言: 人們常說,Scala是一個難掌握的語言,一是其面向函數和麪向對象結合的原因,二是其豐富的語法和內置函數。 對於Conllection 這一章的內容,更多的是利用內置函數靈活地運用,避免自己重複造輪子(要求性能高除外)