原创 統計學---極端異常值的檢測

你在整理統計公司人的收入情況,手一抖,不小心把某個人的月薪26249變成262490了,某個人的月薪16895變成1689.5了。於是變成了如下的情況: incomes=[25590, 23306, 26780, 29463, 2

原创 統計學---掌握數據的整體狀態

我們日常工作生活中會獲得各種數據,我們希望瞭解這些數據所代表的整體狀態,從而可以用來描述、比較和評價。 例如一個公司每個人的收入,一個公司保齡球對抗賽的分組成績,這些獲得的數據都是數值型數據。我們假設公司有3個部門,每個部門有6個

原创 圖像平均操作爲什麼能降噪

前面提到,帶有噪聲的圖像可以看作原始圖像函數與噪聲函數的和。 f(x,y)=I(x,y)+Noise(x,y) 那麼我們怎樣從帶有噪聲的圖像f(x, y)中去掉Noise得到I(x, y)呢?很自然的能想到,既然能加上噪聲函數,

原创 Pandas的DataFrame輸出截斷和省略問題

我們看一個現象: import pandas as pd titanic = pd.read_csv('titanic_data.csv') print(titanic.head()) Titanic_data.csv是kaggl

原创 損失函數爲什麼用平方形式(二)

我們在以前談過《線性迴歸損失函數爲什麼要用平方形式》,除了這篇文章中提到的理由外。還有什麼依據呢? 平方形式的損失函數一般爲: C=12∑i=1n(yi−yˆi)2 這稱爲SSE(The sum of squares due

原创 python列表的append和extend

如何對python的列表進行元素擴充,有幾個方法:append,extend,“+”。 lst = [1, 2, 3, 4] lst.append(5) print(lst) 輸出: [1, 2, 3, 4, 5] 如果添加2個元

原创 統計學---數據的標準化

北京2017年中考科目有6門,其分值分別是語文120,數學120,外語120,物理100,化學80,體育40,總分580分。 那麼問題來了,數學考了100分就一定比物理考了90分強嗎?語文100分與外語100分的含金量是一樣的嗎?

原创 Python的生成器(generator)

如果函數要產生一系列結果,那麼最簡單的做法是把這些結果放在一份列表(list)中,並將其返回給函數調用者。例如我們要獲得一份文本中每個單詞的長度。 def get_word(text): result = [] f

原创 爲什麼用加權平均來降噪

前面提到,我們想到了用平均操作來降低噪聲。降低噪聲的意義是顯而易見的,當我們需要圖像增強,以提升圖像的質量時,必須降低甚至消除噪聲。 用平均操作來降低噪聲是一種好方法,其基於的原理是:每個像素點的值與其周邊像素點的值比較接近。 但

原创 空間濾波器是怎麼來的

前面提到,我們可以用平均或加權平均來降低噪聲,以增強圖像。前面我們是對像素點的周邊8領域進行的操作,要是我們想對周邊更多領域進行操作呢?如果我們想要調整加權的權重值呢? 那麼用前2篇文章中的方法顯然是非常煩瑣且不靈活的。我們注意到

原创 圖像爲什麼能相減

前面提到,我們可以把圖像看作一個函數,函數和函數之間是可以相加的。 f(x,y)=I1(x,y)+I2(x,y) 那麼,既然函數可以相加,函數也是可以相減的。所以,圖像之間是不是也能相減呢?答案是肯定的。我們知道10-8=2,

原创 圖像爲什麼能相加

我們知道2個矩陣是可以執行加法運算的,那2個圖像能不能相加呢?當然是可以的。前面提到,圖像就是函數,函數可以相加,圖像當然也可以相加。 我們知道2個矩陣相加必須是同一維度的,即行列相同,圖像當然也一樣,即寬度和高度相同。 我們看下

原创 圖像模糊有什麼用

我們前面提到,使用平均操作或加權平均操作可以降低圖像的噪聲,並由此引出了空間濾波器的概念。 這種平均操作或加權平均操作的空間濾波器,根據平均操作的特點,可以叫做均值濾波器;其主要應用就是降低噪聲,根據應用的特點,也可以叫做平滑濾波

原创 數字圖像的加載、顯示和輸出

圖像處理的最基本工作,也是第一步工作:讀取、顯示和輸出圖片。 1.圖像讀取 opencv圖像讀取的函數是:imread(圖像路徑,加載模式);輸入參數有2個: “圖像路徑”是一個字符串;使用絕對路徑和相對路徑都是可以的,但相對路

原创 圖像就是矩陣

學過線性代數的對矩陣並不陌生。一般來說,圖像是一個標準的矩形,有着寬度(width)和高度(height)。而矩陣有着行(row)和列(column),矩陣的操作在數學和計算機中的處理都很常見且成熟,於是很自然的就把圖像作爲一個矩