原创 mysql存取圖片

package com.mycompany.mysql.image; import java.io.*; import java.sql.*; public class Main { public stati

原创 一種基於HBase韻海量圖片存儲技術

轉載自:http://articles.e-works.net.cn/storage/article112957.htm 一種基於HBase韻海量圖片存儲技術 針對海量圖片存儲,已有若干個基於Hadoop的方案被設計出

原创 hbase-java-client

package hbase.test; import java.io.IOException; import org.apache.avro.generic.GenericData; import org.apache.hadoop.c

原创 hbase

數據字典用來存儲了系統的元數據。HBase的元數據包括:用戶表的定義、表的切分方案、分片的分佈情況(即分片分佈在哪個regionserver上)、分片對應的數據文件和日誌文件。其中,分片和數據文件的映射關係是通過目錄映射實現的,即不同

原创 gora-hbase

package org.apdplat.demo.gora; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.IOExcepti

原创 hbase-MR

</pre><pre name="code" class="java">package hbase.test; import java.io.IOException; import org.apache.hadoop.conf.Conf

原创 shell-進程

#!/bin/bash #HTML存儲父母錄 HTML_DIR_PARENT="/home/xxx/zcreader/temp/" #當前日期字符串 CURRENT_DATE=`date +%Y%m%d` #當前日期HTML目錄 HTM

原创 gora-mr

package org.apdplat.demo.gora; import java.io.IOException; import org.apache.avro.util.Utf8; import org.apache.gora.m

原创 spring上傳圖片

import java.io.BufferedOutputStream; import java.io.FileNotFoundException; import java.io.IOException; import org.sprin

原创 hadoop-回收站

配置: core-site.xml <property> <name>fs.trash.interval</name> <value>0</value> <description>Number of minutes betwe

原创 shell-crontab(定時調度)

crontab: usage error: unrecognized option usage: crontab [-u user] file crontab [ -u user ] [ -i ] { -e | -l | -r }

原创 Nutch入門白話版

不得不說,Nutch的入門官方文檔寫的真不清晰明瞭。害的我按照官方文檔折騰半天。 Nutch現在已經到了2.2.2版本,而且版本1.x已經更新到了1

原创 andriod

[2014-05-21 14:44:26 - helloworld] /home/zcwangjb/programs/adt-bundle-linu

原创 shell-sed

1. 刪除包含xx的行   sed -i '/xx/d' a.txt 2. 刪除以xx開頭的行   sed -i '/^xx/d' a.txt 3.

原创 Nutch爬蟲運行流程分析

前一篇中,記錄了一次爬取的日誌信息(見這裏),這一篇根據日誌分析Nutch爬蟲的運行流程。