[cs231n]KNN與SVM區別

原創

Extreme_Programmer

2020-06-20 07:00

部分資料來源於網絡，僅做個人學習之用

KNN	SVM
沒有訓練過程，只是將訓練數據與訓練數據進行距離度量來實現分類。基本原理就是找到訓練數據集裏面離需要預測的樣本點距離最近的k個值（距離可以使用比如歐式距離，k的值需要自己調參），然後把這k個點的label做個投票，選出一個label做爲預測	是先在訓練集上訓練一個模型，然後用這個模型直接對測試集進行分類。這兩個步驟是獨立的。需要超平面wx+b來分割數據集（此處以線性可分爲例），因此會有一個模型訓練過程來找到w和b的值。訓練完成之後就可以拿去預測了，根據函數y=wx+b的值來確定樣本點x的label，不需要再考慮訓練集
knn沒有訓練過程，但是預測過程需要挨個計算每個訓練樣本和測試樣本的距離，當訓練集和測試集很大時，預測效率低。	svm有一個訓練過程，訓練完直接得到超平面函數，根據超平面函數直接判定預測點的label，預測效率很高
物以類聚，人以羣分。如果你的朋友裏大部分是北京人，就預測你也是北京人。如果你的朋友裏大部分是河北人，那就預測你是河北人。不管你住哪裏。	就像是在河北和北京之間有一條邊界線，如果一個人居住在北京一側就預測爲北京人，在河北一側，就預測爲河北人。但是住在河北的北京人和住在北京的河北人就會被誤判。
KNN對每個樣本都要考慮。	SVM是要去找一個函數把達到樣本可分
KNN不能處理樣本維度太高的東西	SVM處理高緯度數據比較優秀
假設每條數據有兩個特徵值x和y，一個label，即點的顏色，先將所有數據放在平面直角座標系中，如下圖1.1的紅點和藍點，紅點和藍點所構成的所有點即爲訓練集，而綠點則是測試點，k最鄰近問題的最鄰近就是直觀的鄰近的意思，即離得近，而k指的是找幾個離得最近的，如果k=3，那麼所選的點即爲實線所包含的三個點，若k=5，則爲虛線所包含的五個點，而對於預測點分類的預測則是根據所選k個點中最多個數的類別所確定，同樣以下圖爲例，如果k=3，那麼預測點的結果將爲紅色（2個紅色，1個藍色），如果k=5，那麼預測點的結果將爲藍色（3個藍色，2個紅色），由此可見，參數k的選取直接影響了預測結果的準確度。	SVM 指的是這個模型是一個機器，此外它的作用是分類，所以可以理解爲一個分類用的機器，support vevtoe之後再介紹。同樣爲了簡單介紹採用二維介紹，樣本同樣是帶有顏色label的有x和y兩個屬性的訓練點集合，svm要要找一條線，使得把兩個類別的點區分開來，那麼對於接下來的測試點，看測試點位於哪一側，就將其歸類於該類，那麼問題來了，符合這個要求的線有很多條，比如圖中的黑線和灰線就是其中的兩條，那麼什麼纔是最優解呢，現在就要介紹support vector了，就是兩個類別中的點離這條分割線最近的距離，如何纔是最優解呢，就是讓兩個類別的離分割線最近的點，再回到最近的問題，什麼纔是最優解呢，那就是支持向量離分割線越遠越好，因爲距離越遠，允許容納的點越多，使得分類的越平均，更加理想。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

「遊記」2024 吉林省賽和 2024 東北四省賽

Before 本文是 \(2024\) 中國大學生程序設計競賽全國邀請賽（長春）暨第 \(17\) 屆吉林省大學生設計競賽和新建比賽的遊記寫的很爛寫的很爛寫的很爛 Day0 省賽報到及熱身賽。 \(14：00\) 前報到。 \(12：

2024-05-18 14:35:35

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

一、前言在使用yolo做人工智能運算後，運算結果除了一個方框，還可能需要增加文字顯示在對應方框上，以便標記是何種物體，比如顯示是人還是動物，或者還有可能追蹤人員，顯示該人員的姓名。這種應用場景非常普遍，而且非常有必要，可以非常直觀的直接看

2024-05-18 14:35:25

WPS技巧——MARK住

一、如何對一列數據進行相同操作，比如全都添加雙引號 https://www.jiachong.com/wps/340708.html 1.首先打開表格,按Ctrl+C複製第一個單元格內容, 2.然後把複製的單元格內容按Ctrl+V粘貼到與其

2024-05-18 14:34:35

LightDB通過金融信創生態實驗室測試

　　恆生電子LightDB順利通過了金融信創生態實驗室的產品測試，本次測試基於典型金融業務場景並在國產硬件環境中進行，經過測試，LightDB在產品性能、功能性、兼容性以及可靠性等多個維度100%符合金融業務系統，表現優異。　　在本

2024-05-18 14:32:25

國產數據庫金融行業實踐者：LightDB通過強制性國家標準GB18030-2022最高級別認證

　　8月1日，強制性國家標準GB 18030-2022《信息技術中文編碼字符集》實施。10月09日，恆生電子LightDB正式通過中國電子技術標準化研究院強制性國家標準GB18030-2022《信息技術中文編碼字符集》最高級（實現級別

2024-05-18 14:32:25

記一次asp.net 8 服務器爆滿的解決過程

1.描述一下服務器配置: 一臺2c4g的centos,做api接口反代一臺8c16g的windows 2019 作爲實際服務器,跑了iis,sql server,mongodb,redis 2.業務描述 2.0 服務器分爲兩個站

2024-05-18 14:26:04

一次nginx文件打開數的問題排查處理

現象：nginx域名配置合併之後，發現consul-template無法完成nginx重載，然後發現需要重啓nginx，才能讓配置生效。注意：下次哪個服務有報錯，就看重啓時所有日誌輸出，各種情況日誌輸出。不要忽略細節。很多時候其實已經

2024-05-18 14:17:33

docker 運行minio standalone模式

sudo docker run -it -d --name minio_latest -p 9000:9000 -p 9001:9001 -v /minio/data:/data -e MINIO_ROOT_USER="賬號" -e MIN

2024-05-18 14:15:13

HTML 09 - Quotations

Quotations in HTML allow you to include and format quoted text within your web content. HTML provides tags such as <bl

2024-05-18 14:14:12

HTML 10 - Comments

HTML Comments are used to comment in HTML codes, so the developer can understand the purpose of that code section and it

2024-05-18 14:14:12

Nginx R31 doc 官方文檔-01-nginx 如何安裝

從 Ubuntu 存儲庫安裝預構建的 Ubuntu 包更新 Ubuntu 存儲庫信息： sudo apt-get update 安裝包： sudo apt-get install nginx 驗證安裝： sudo ngin

2024-05-18 14:01:41

Android 15 的新功能與適配

前臺服務變化前臺服務一直是比較損耗電池壽命的操作，在 Android 15 Beta 2 裏，**dataSync 和 mediaProcessing 的前臺服務類型現在有大約 6 小時的超時時間**，之後系統將調用 Android 15

2024-05-18 14:00:31

高薪線下週末班馬上開班，手把手帶你提升職業技能

管理學大師彼得·德魯克說“終身學習是現在社會的生存法則”，而現實中，很少有人能清醒地意識到這一點，人們總是習慣在舒適區兜圈，重複做已經掌握的事情，對真正需要突破的職業困境視而不見。偶爾看到同事跳槽漲薪，技術越來越嫺熟，自己也期望着可以跟他

霍格沃茲測試學院

2024-05-18 13:54:11

提升團隊生產力：2024年必知的一體化協同辦公平臺

本文介紹的主流一體化協同辦公平臺有：Worktile、PingCode、Microsoft Teams、釘釘、Google Workspace、Jive、Avaya、Bitrix24、Asana、ClickUp、飛書。在現代工作環

2024-05-18 13:54:00

Mono 支持LoongArch架構

近期，著名的.NET開源社區Mono正式支持LoongArch（龍架構），目前LoongArch64架構已出現在.NET社區主幹分支上。詳細內容可以跟蹤 https://github.com/mono/mono/issues/21381,

2024-05-18 13:53:40

24小時熱門文章

最新文章

最新評論文章