說明:
numpy包中可以生成隨機數,也可以生成隨機分佈;本文針對隨機數的生成講述,之後會結合matplotlib模塊,單獨寫一下分佈函數的使用及繪製
-
np.random.seed()
的作用:使得隨機數據可預測
當我們設置相同的seed,每次生成的隨機數相同。如果不設置seed,則每次會生成不同的隨機數
np.random.seed(1676)
np.random.rand(5)
>> array([ 0.39983389, 0.29426895, 0.89541728, 0.71807369, 0.3531823 ])
-
numpy.random.rand
(d0,d1,…,dn):根據給定維度生成[0,1)之間的數組,服從均勻分佈
(1)rand函數根據給定維度生成[0,1)之間的數據,包含0,不包含1
(2)dn表格每個維度
(3)返回值爲指定維度的array
# 4*2的數組,取值在[0,1)之間,服從均勻分佈
np.random.rand(4,2)
>> array([[ 0.02173903, 0.44376568],
[ 0.25309942, 0.85259262],
[ 0.56465709, 0.95135013],
[ 0.14145746, 0.55389458]])
# shape: 4*3*2 的三維數組,取值在[0,1)之間,服從均勻分佈
np.random.rand(4,3,2)
>> array([[[ 0.08256277, 0.11408276],
[ 0.11182496, 0.51452019],
[ 0.09731856, 0.18279204]],
[[ 0.74637005, 0.76065562],
[ 0.32060311, 0.69410458],
[ 0.28890543, 0.68532579]],
[[ 0.72110169, 0.52517524],
[ 0.32876607, 0.66632414],
[ 0.45762399, 0.49176764]],
[[ 0.73886671, 0.81877121],
[ 0.03984658, 0.99454548],
[ 0.18205926, 0.99637823]]])
-
numpy.random.randint
(low, high=None, size=None, dtype=’l’):生成在半開半閉區間[low,high)上離散均勻分佈的整數值
(1)若high=None,則取值區間變爲[0,low)
(2)size數組維度大小,默認值None,即生成一個隨機數
(3)dtype爲數據類型,默認的數據類型是np.int
# 返回[0,1)之間的整數,所以只有0
np.random.randint(1,size=5)
array([0, 0, 0, 0, 0])
# 返回1個[1,5)時間的隨機整數
np.random.randint(1,5)
4
# 返回一個shape:2*2
np.random.randint(-5,5,size=(2,2))
array([[ 2, -1],
[ 2, 0]])
-
numpy.random.randn
(d0,d1,…,dn):一個或一組樣本,具有標準正態分佈
標準正態分佈又稱爲u分佈,是以0爲均值、以1爲標準差的正態分佈,記爲N(0,1)
# 當沒有參數時,返回單個數據
np.random.randn()
>> -1.1241580894939212
# 2*4的數組,服從標準正太分佈
np.random.randn(2,4)
- 以給定形狀返回[0,1)之間的隨機浮點數
(1)numpy.random.random_sample
(size=None)
(2)numpy.random.random
(size=None)
(3)numpy.random.ranf
(size=None)
(4)numpy.random.sample
(size=None)
# 使用隨機種子,生成隨機數,區間在[0,1)之間
np.random.seed(1)
print(np.random.random_sample(size=(3,2)))
print(np.random.random(size=(3,2)))
print(np.random.ranf(size=(3,2)))
print(np.random.sample(size=(3,2)))
---------------------
# 結果爲
[[4.17022005e-01 7.20324493e-01]
[1.14374817e-04 3.02332573e-01]
[1.46755891e-01 9.23385948e-02]]
[[0.18626021 0.34556073]
[0.39676747 0.53881673]
[0.41919451 0.6852195 ]]
[[0.20445225 0.87811744]
[0.02738759 0.67046751]
[0.4173048 0.55868983]]
[[0.14038694 0.19810149]
[0.80074457 0.96826158]
[0.31342418 0.69232262]]
-
numpy.random.choice
(a,size=None,replace=True,p=None) :
(1)若a爲數組,則從a中選取元素;
(2)若a爲單個int類型數,則選取range(a)中的數
(3)replace是bool類型,爲True,則選取的元素會出現重複;反之不會出現重複
(4)p爲數組,裏面存放選到每個數的可能性,即概率
# 在range(5)中取3個數,默認replace=True可以重複
np.random.choice(5,3)
array([4, 1, 4])
# 當replace爲False時,生成的隨機數不能有重複的數值
np.random.choice(5, 3, replace=False)
array([0, 3, 1])
# 在range(5)中取元素,生成3*2的數組,默認replace=True可以重複
np.random.choice(5,size=(3,2))
array([[1, 0],
[4, 2],
[3, 3]])
# 從demo_list中選取元素,生成3*3的數組
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3))
array([['moto', 'iphone', 'xiaomi'],
['lenovo', 'xiaomi', 'xiaomi'],
['xiaomi', 'lenovo', 'iphone']],
dtype='<U7')
# 參數p的長度與參數a的長度需要一致;且p裏的數據之和應爲1
# 即給出的是a中各個元素出現的概率
# 所以結果出現“sansumg”的次數多,因爲它的概率大
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3), p=[0.1,0.6,0.1,0.1,0.1])
array([['sansumg', 'sansumg', 'sansumg'],
['sansumg', 'sansumg', 'sansumg'],
['sansumg', 'xiaomi', 'iphone']],
dtype='<U7')