原创 solr安裝及詳解
###說明: 1. solr已內置jetty服務,默認端口8983,可以很方便的在web端操作,不用安裝tomcat。 2. 安裝完成後,建議使用谷歌瀏覽器訪問,有的瀏覽器可能會報錯。 3. 開放zk要用到的端口或關閉防火牆 4
原创 ES合併操作小結
一:mget批量處理 1、批量查詢的好處 就是一條一條的查詢,比如說要查詢100條數據,那麼就要發送100次網絡請求,這個開銷還是很大的 如果進行批量查詢的話,查詢100條數據,就只要發送1次網絡請求,網絡請求的性能開銷縮減100倍 2
原创 安裝CDH的超詳細步驟
一、準備工作 1、下載安裝包,規劃三臺機器 Cloudera Manager 5.9http://archive-primary.cloudera.com/cm5/cm/5/cloudera-manager-el6-cm5.9.0_x8
原创 elasticsearch5.2.0和Kibana安裝詳解及問題
一、es集羣的規劃準備: 1、修改/etc/hosts文件 192.168.233.131 node1 192.168.233.132 node2
原创 Elasticsearch 與kibana簡單語法
1、集羣狀態 get /_cat/health?v (?v顯示錶頭) epoch timestamp cluster status node.total node.data shards pri relo init u
原创 VNC連接linux桌面
一、鏡像掛載配置yum源 [root@node6 ~]# cat /etc/yum.repos.d/CentOS-Base.repo [CentOS-Base] name=CentOS-Base baseurl=file
原创 solr的軟硬提交
最近又被soft commit 和 hard commit搞得有點迷糊,其實都怪自己沒有早點看源代碼。問題出自這段代碼,這也是我一開始接觸solr時,查到的代碼sample(事實證明問題都出在這裏,引以爲戒,有問題真的不要不求甚解) if
原创 zookeeper啓動時報錯排除
1.執行zkServer.sh start 後顯示: JMX enabled by default Using config:/home/Hadoop/app/zookeeper-3.4.5/bin/../conf/zoo.cf
原创 zookeeper的日常運維
儘管zookeeper在編程上有很多的阱陷,API也非常的難用,但zookeeper服務本身可以說是很牢靠的了,所以在網上貌似關於運維的文章比較少。 但省心並不代表不會出麻煩,下面總結下zookeeper運維相關的東東。 重要的參考資料
原创 zookeeper的配置項詳解
ooKeepeer的功能特性是通過ZooKeeper配置文件來進行控制管理(默認zoo.cfg配置文件)的。詳細介紹ZooKeeper配置文件中每一
原创 hive on spark的安裝實現
Hive on Spark安裝,hive是基於Hadoop的數據倉庫,hdfs爲hive存儲空間,mapreduce爲hive的sql計算引擎。但是由於mapreduce很多計算過程都要經過硬盤讀寫等劣勢,和spark等計算引擎
原创 HDFS小文件的合併優化
HDFS小文件的合併優化 我們都知道,HDFS設計是用來存儲海量數據的,特別適合存儲TB、PB量級別的數據。但是隨着時間的推移,HDFS上可能會存在大量的小文件,這裏說的小文件指的是文件大小遠遠小於一個HDFS塊(128MB)的大
原创 solr優化
海量數據的索引,第一個要解決的是數據存儲的問題,solr提供數據存儲平臺有兩種,第一個是本地磁盤,另一個是HDFS,我們可以通過solrhome的配置來實現。在本次實踐中,我們選擇的是本地磁盤,因爲採用的solrcloud部署模式,本
原创 安裝oralce11g詳細步驟
安裝oralce11g詳細步驟 一、安裝環境準備 安裝環境爲centos6.5,在官網下載的linux.x64_11gR2_database_1of2.zip、linux.x64_11gR2_database_2of
原创 mapreduce的timeout參數設置
1. 如果碰到異常“Task attempt failed to report status for xxx seconds. Killing!”,最可能是碰到死循環了。 2. 如果沒有死循環:控制超時的屬性是:mapred.task.t