原创 如何利用位運算求一個集合的子集(java版)

       在學習FP-Growth的時候,有一個部分是需要求一個集合的全部非空子集。因此結合spmf平臺上fp-frowth的源代碼和其他csdn上源代碼的學習,總結一下如何使用位與運算求一個集合的子集。 一:基礎介紹 1.右移( >

原创 數據處理-數據可視化-折線圖的繪製(python版)

#encoding=utf-8 import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = ['Arial Unicode MS'] #折線圖 # x = ["隨機

原创 機器學習,數據挖掘,計算機方面牛人博主鏈接

1.機器學習,深度學習,概率論 DriveC 2.機器學習,自然語言處理,深度學習,基礎知識 AI檸檬 3.科學空間,數學,計算機科學 科學空間 4.廖雪峯官方網站 廖雪峯 5.數據挖掘(老師推薦) 數據挖掘 6.AI,機器學習(老師推薦

原创 map迭代實際過程區別于思維慣性(python版)

問題引入:     同學在調試python代碼的兩個for循環遍歷時發現輸出有問題,因爲遍歷的有map()在,由於這個可迭代對象的出現,導致map()只能循環迭代一輪。 問題實質:     python中,map()對象,只能遍歷一次,即

原创 二分查找的實際應用(Java版)

 一:問題引入 在學習Apriori算法的時候,其中有一個實現細節是  * 利用二分查找來判斷A集合的子集是否存在於B集合中  * 藉此機會,我們複習一下二分查找 二:問題實例化  把Apriori算法中的問題抽象出來就是判斷數組A中的各

原创 數據分析-數據預處理-根據CSV格式的數據的第一列作爲key,若第一列的key相等,則將相同的key後面的第二列合併添加(Java版)

一:題目--文章需要解決的問題 題目的意思也可以表述爲:         將一堆項集數據,根據數據的第一列值是否相同,來判斷第二列的值是否該進行合併,相當於使之變成序列數據集。 題目的樣例1表述:        輸出的數據格式 (可以先用

原创 數據分析-數據預處理-數據數量統計和柱狀圖繪製(Excel版處理)

一:解決的問題:        問題描述1:原始數據在Excel裏面,且每行都只有一個單元格存放該行的所有數據;我們需要做的事情是統計該Excel表每行數據的個數。       問題描述2:     1)原始數據集          2)

原创 數據挖掘-課內課程-基礎知識遷移

1.最大模式:對於頻繁模式p,使得p的任何真超模式都不是頻繁的。 2.頻繁閉項集:是一個頻繁的閉的項集,項集c是閉的:如果不存在c的超集c',使得每個包含c的事務也包含c'.                      通俗的講:c的直接超

原创 數據挖掘-序列模式挖掘--GSP算法

一:基本概念介紹 序列模式挖掘:指挖掘相對時間或其他模式出現頻率高的模式 序列模式挖掘的動機:大型連鎖超市的交易數據有一系列的用戶事物數據庫。每一條記錄包括用戶的ID,事物發生的時間和事物涉及的項目。如果能夠在其中挖掘涉及事物間關聯關係的

原创 數據挖掘-序列模式挖掘-基礎知識和概念總結(sequential pattern mining)

一:基礎概念介紹 序列模式挖掘:指挖掘相對時間或其他模式出現頻率高的模式 序列模式挖掘的動機:大型連鎖超市的交易數據有一系列的用戶事物數據庫。每一條記錄包括用戶的ID,事物發生的時間和事物涉及的項目。如果能夠在其中挖掘涉及事物間關聯關係的

原创 數據挖掘-項集挖掘-apriori算法和fp-growth算法(論文核心思想)

如何尋找頻繁模式呢?(apriori和fp-growth算法對應的兩篇論文的最核心思路總結)        1.最原始的方法:各個項進行排列組合,即找出所有的候選集,然後再一一判斷這些候選集是否是頻繁項集。        2.aprior

原创 數據挖掘-數據挖掘綜述-基礎知識和概念總結

數據挖掘-數據挖掘綜述-基礎知識和概念總結                                                  目錄 數據挖掘-數據挖掘綜述-基礎知識和概念總結 1.數據挖掘的發展歷史 1.1 20世紀60年

原创 算法-智能算法/傳統算法-多種算法介紹及異同點

算法-智能算法/傳統算法-多種算法介紹及異同點                                                                         目錄 一:描述分治法,貪心算法,動態規劃算法,

原创 數據分析-數據預處理-完成數據統計的柱狀圖的繪製(Java版本)

一:問題描述        在我的博客文章https://blog.csdn.net/yezonghui/article/details/105665709裏面詳細介紹使用Excel進行數據分離,每行序列長度統計,長度數量計算,柱狀圖的繪

原创 圖像處理-增強現實-基本概念總結

1.增強現實         增強現實是一個新興的多學科交叉研究領域,它的研究範圍非常廣泛,包括以下多門技術:信號處理、計算機圖形學、圖像處理、計算機網絡、三維建模技術、三維渲染技術、新型顯示器和傳感器的開發與設計。 一個完善的AR系統包