原创 Fully generated SQL is a required output link property 錯誤解決

第一次玩datastage,版本是7.5.1A 數據庫是oracle 10g 拖了一個ORAOCI9 stage 當源當query type 選 use sql builder tool 的時候 我View Data 就報錯 fully

原创 數據挖掘算法之 apriori

//關聯規則之 apriori算法 //實現 2006年5月 //作者:郭運凱 #include<stdio.h> #include <string.h> typedef  struct { int item[100];  //數據項

原创 決策樹算法ID3算法源代碼&數據文件

////////////////////////////////////////////////////////////////////////// /* * * * * 文件名稱:ID3.cpp * * 摘 要:ID3算法實現 *

原创 數據挖掘十大經典算法之apriori算法&源代碼

數據挖掘十大經典算法 國際權威的學術組織the IEEE International Conference on Data Mining (ICDM) 2006年12月評選出了數據挖掘領域的十大經典算法:C4.5, k-Means,

原创 互信息 Mutual Information

互信息(Mutual Information)在統計語言模型中被廣泛採用。如果用A表示包含詞條t且屬於類別c的文檔頻數,B爲包含t但是不屬於c的文檔頻數,C表示屬於c但是不包含t的文檔頻數,N表示語料中文檔總數,t和c的互信息可由下式計算

原创 C++ 返回 一個字符串在另外一個字符串中的位置,不存在時返回-1

 #include <stdio.h> #include <string.h> int  Find_Pos(char *s,char * t) {

原创 ID3 決策樹算法僞代碼及註解

算法:Generate_decision_tree(samples, attribute)。由給定的訓練數據產生一棵判定樹。 輸入:訓練樣本samples,由離散值屬性表示;候選屬性的集合attribute_list。 輸出:一棵判定樹。

原创 eclipse 輸出日誌信息到控制檯

eclipse 輸出日誌信息到控制檯 在run/run Configurations Arguments 下的 Program arguments: 添加 -consolelog參數,即可將所有的日誌輸出到控制檯,以方便查看

原创 hadoop 用戶創建data目錄時 DataNode無法啓動

場景:Centos 6.4 X64      hadoop 0.20.205 配置文件 hdfs-site.xml     <?xml version="1.0"?> <?xml-stylesheet type="text/xsl" hr

原创 hive 打開調試模式

打開調試模式: hive -hiveconf hive.root.logger=DEBUG,console

原创 oracle 修改字符集導致 -bash: /root: is a directory

場景: oracle在linux命令行下查詢時,中文顯示爲亂碼,百度,google的解決方法是修改/etc/sysconfig/i18n,設置LANG="zh_CN.UTF-8",修改後,導致系統在啓動時出現 -bash: /root:

原创 There is insufficient memory for the Java Runtime Environment to continue. 解決

在Centos  6.4 X64, JDK 1.7 U21下用hadoop 1.2.1 運行 mahout 0.9,處理一個5GB的數據,系統提示There is insufficient memory for the Java Runt

原创 CentOS 6.3 發佈 附ISO下載地址

感謝OwnLinux.org的投遞 CentOS 團員已經發布了 CentOS 6 系列的第三個版本,CentOS 6.3 基於上游的紅帽 RHEL 6.3。CentOS 是一個企業級的 Linux 發行版本,CentOS 是 RHEL

原创 大型網站架構演變過程、大併發服務器架構

大型網站架構演變過程、大併發服務器架構 分類: muduo網絡庫2013-11-14 12:39 2231人閱讀 評論(7) 收藏 舉報 大型網站架構大併發服務器架構 大型網站架構演變過程: [Step1]web ser

原创 Hadoop0.20.2在Linux X64下的分佈式配置和使用

Hadoop0.20.2在Linux X64下的分佈式配置和使用   2013年3月  郭運凱 目   錄 介紹...2 1 集羣網絡環境介紹及快速部署...2 2 SSH無密碼驗證配置...6 2.1配置所有節點之間SSH無密碼驗證..