原创 【機器學習】K近鄰算法原理

一文詳解,K近鄰算法原理。碼字不易,喜歡請點贊,謝謝!!! 一、KNN簡介 K近鄰(k-NearestNeighbor)算法,簡稱KNN。KNN是數據挖掘中十分常用的算法,其原理簡單。 KNN的思想就是,選取k個最鄰近的點,這k個

原创 【機器學習】線性迴歸原理

線性迴歸可謂是機器學習最簡單的入門了,本文從最小二乘法開始講解線性迴歸的過程。由於本文的公式比較複雜,手打比較麻煩,因此部分公式推導會在草稿紙上進行,然後以圖片的形式展示。整理不易,還望點個贊,謝謝。 其實,我們對線性迴歸並不默

原创 【機器學習】關聯規則原理及實例

一、關聯規則簡介 關聯規則(Apriori算法),又稱爲關聯分析。其目的是找出,一堆事物中具有關聯的事物。 關聯規則最經典的案例就是“啤酒與尿布”,沃爾瑪擁有世界上最大的數據倉庫系統,爲了能夠準確瞭解顧客在其門店的購買習慣,沃爾瑪

原创 【算法與數據結構】必備知識點彙總

1.數據結構基礎 2.線性表(順序存儲、鏈式存儲) 元素之間是有順序的:第一個元素無前驅,最後一個元素無後繼,其他元素都有前驅和後繼 順序存儲結構:用一段地址連續的存儲單元一次存儲線性表的數據元素(存取時間複雜度爲O(1),插入

原创 【算法與數據結構】稀疏矩陣

稀疏矩陣的存儲方式: 1.三元組(行、列,值) 2.行邏輯鏈接的順序表 3.十字鏈表

原创 【Windows XP】下載地址及產品密鑰

這次需要在虛擬機中裝XP系統,找了好多產品密鑰都是不好用的,最後終於找到合適的了,迫不及待的分享。 1.XP系統下載 http://msdn.itellyou.cn/ 用迅雷下載Windows XP Professional wi

原创 【算法與數據結構】三、循環隊列

FIFO(先進先出) rear:隊尾 front:對頭 N:隊長 操作: push:r=(r+1)%N pop:f=(f+1)%N full:(r+1)%N=f empty:f=r length:(r-f+N)%N

原创 【虛擬機】VMware Workstation 12下載安裝教程

1.安裝包 鏈接:https://pan.baidu.com/s/11vte21whG-jeETZ7vNFdvA 提取碼:w5b3 2.虛擬機安裝密鑰 鏈接:https://pan.baidu.com/s/1tqAHI_GtWzj

原创 【Python】實現十大查找和排序算法

1.順序查找 按照列表順序挨個對比是否爲目標值,知道找到,時間複雜度O(N) nums = [4,7,12,20,36,48,50,77,90] n = 36 for i in nums: if(i == n):

原创 【Hadoop】慢慢自學

分佈式存儲(HDFS)、分佈式處理技術(MapReduce) 批處理:MapReduce、Spark 流計算:Storm等 圖計算:Pregel等 查詢分析計算:Hive等 雲計算:解決分佈式存儲和分佈式技術 物聯網:感知層、網絡

原创 【Python】四種命名方式

1.object:公用方法 2.object:半保護形式,‘protect’,只有類對象和子類對象能訪問這些變量。它在模塊或類外不可以使用,因此不能用‘from module import *’導入。它們的名字實際上是_class

原创 【Python】遞歸實現n的全排列

這是面試字節跳動的大數據崗位時候面試官給的一個題目,就是輸出n個數的全排列。 當n=1是,perm(1)= [[1]] 當n=2是,對於perm(1)裏面的每個子list,n可以在list的第0個位置到最後一個位置,這裏perm(

原创 【Python】pickle包的dump函數和load函數

pickle包的dump函數和load函數分別實現了數據的序列化和反序列化。 一、dump()方法 pickle.dump(obj, file, [,protocol]) 註釋:序列化對象,將對象obj保存到文件file中去。參數

原创 【Python】圖形交互界面GUI之tkinter各大控件詳解

tkinter控件 目前tkinter在GUI方面主要用的控件有Label、Button、Canvas、messagebox等,具體見下表。 組件 作用 Label 標籤:主要用於顯示文本和圖像 Button 按

原创 【Python】爬取天眼查公司電話以及地址信息

背景:其實兩年前就爬了天眼查的很多信息,包括電話、地址等基本信息之外,還有公司的股東、專利以及對外投資等信息,但是當時的電腦沒備份,代碼都沒了。這次山東的某個教育機構有償找我幫爬天眼查公司電話以及地址信息,所以就重新爬了一下天眼查