原创 執行./nutch 命令後出現的nutch腳本用法解讀

Usage: nutch COMMAND   where COMMAND is one of:   inject        inject new urls into the database  :注入新的url到數據庫中 hosti

原创 有8個一樣的球,其中有一個要重一些。有一個天平,怎麼稱,才能2次就把重的球找出來?

分別拿3個球放在天平的兩邊,如果天平平衡,則再稱剩餘的兩個球;如果天平不平衡,則把重的一邊的3個球中任選2個球放在天平兩邊, 若天平平衡,則剩餘的那個球是比較重的那個,若不平衡,則天平下沉的一端是那個重一些的球

原创 轉:cygwin簡單應用及Nutch之Crawler工作流程

cygwin簡單應用:cygwin home 目錄: ls /                   -- 根目錄 ls /cygdrive            -- 查看本地操作系統的盤符,如c盤、d盤 pwd            

原创 Java實現快速排序

package com.lstc.sort; /** * 快速排序算法實現: * 時間效率:快速排序算法的運行時間依賴於劃分是否平衡,即根據樞軸元素 pivot * 將序列劃分爲兩個子序列中的元素個數,而劃分是否平衡又依賴於所使用

原创 轉:Nutch-2.2.1腳本分析

爲了對Nutch進行定製化,需要看懂Nutch的源碼。 版本:2.2.1   最新版本 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~· ? 1 2 3 我們知道執行nutch時,會敲入 ./bin/

原创 java多態的實現主要體現在哪些方面

thinking in java3中的多態 People are often confused by other, non-object-oriented features of Java, like method overloading

原创 轉載:通過Java API編程實現Nutch Crawler抓取數據存儲到MySQL數據庫

Nutch Crawler抓取數據並存儲到MySQL Apache Nutch是在Java平臺上開發的開源網絡爬蟲工具。按照Nutch官方網站給出的嚮導,通過使用Nutch命令,可以比較容易地抓取指定種子網站的數據。不過,若是要通過它提

原创 轉:Cygwin下VI命令使用

在安裝了cgywin之後,在裏面會經常用到VI命令,在進行VLC編譯時會用到VI的創建文件、修改文件等命令,如果你嫌麻煩,則可以在windows下直接對文件進行操作,如果想學下VI使用,下面的教程非常好。從一開始我也不習慣在cygwin下

原创 hibernate對數據庫進行CRUD操作

package com.hibernate.test; import java.util.List; import org.hibernate.Session; import org.hibernate.SessionFactory;

原创 WEB服務器、應用服務器、Tomcat、Servlet

Web服務器:專門處理HTTP請求,提供WEB信息瀏覽服務 應用服務器:可解析運行後臺代碼,爲應用服務器提供商業邏輯 Servlet:是一種運行在支持Java語言的服務器上的組件 Tomcat是一個Servlet容器,也是具備WEB服務器

原创 Hive定義、Hive與HBase關係、Hive與RDBMS的關係、數據庫與數據倉庫的區別

1、Hive定義 Hive 是建立在 Hadoop 上的數據倉庫基礎構架。它提供了一系列的工具,可以用來進行數據提取轉化加載(ETL),這是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。Hive 定義了簡單的類 SQ

原创 路由器和交換機有什麼區別

首先說交換機(又名交換式集線器)作用可以簡單的理解爲將一些機器連接起來組成一個局域網。而路由器與交換機有明顯區別,它的作用在於連接不同的網段並且找到網絡中數據傳輸最合適的路徑 ,可以說一般情況下個人用戶需求不大。路由器是產生於交換機之後,

原创 hibernate中的sessionFactory接口講解

 * 1 在sessionFactory中存放這配置文件和所有的映射文件信息  * 2 sessionFactory是一個重量級的類(接口)  * 3、一個數據庫只能有一個sessionFactory  * 4、一個配置文件只能連接一個數

原创 Hive簡介

Hive是構建在Hadoop HDFS上的一個數據倉庫,本質就是一個數據庫 Hadoop和hive都是基於Linux操作系統構建的 Hive可以用來

原创 使用json來定義函數,在裏面可以定義多個函數

<script> //普通方法 function add(a,b){ return a+b; } add(3,4); //使用json來定義函數,在裏面可以定義多個函數