Numpy生成隨機數

說明:
numpy包中可以生成隨機數,也可以生成隨機分佈;本文針對隨機數的生成講述,之後會結合matplotlib模塊,單獨寫一下分佈函數的使用及繪製


  • np.random.seed()的作用:使得隨機數據可預測

當我們設置相同的seed,每次生成的隨機數相同。如果不設置seed,則每次會生成不同的隨機數

np.random.seed(1676)
np.random.rand(5)

>> array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])
  • numpy.random.rand(d0,d1,…,dn):根據給定維度生成[0,1)之間的數組,服從均勻分佈

(1)rand函數根據給定維度生成[0,1)之間的數據,包含0,不包含1
(2)dn表格每個維度
(3)返回值爲指定維度的array

# 4*2的數組,取值在[0,1)之間,服從均勻分佈
np.random.rand(4,2)
>> array([[ 0.02173903,  0.44376568],
       [ 0.25309942,  0.85259262],
       [ 0.56465709,  0.95135013],
       [ 0.14145746,  0.55389458]])

# shape: 4*3*2 的三維數組,取值在[0,1)之間,服從均勻分佈
np.random.rand(4,3,2) 
>> array([[[ 0.08256277,  0.11408276],
        [ 0.11182496,  0.51452019],
        [ 0.09731856,  0.18279204]],

       [[ 0.74637005,  0.76065562],
        [ 0.32060311,  0.69410458],
        [ 0.28890543,  0.68532579]],

       [[ 0.72110169,  0.52517524],
        [ 0.32876607,  0.66632414],
        [ 0.45762399,  0.49176764]],

       [[ 0.73886671,  0.81877121],
        [ 0.03984658,  0.99454548],
        [ 0.18205926,  0.99637823]]])
  • numpy.random.randint(low, high=None, size=None, dtype=’l’):生成在半開半閉區間[low,high)上離散均勻分佈的整數值

(1)若high=None,則取值區間變爲[0,low)
(2)size數組維度大小,默認值None,即生成一個隨機數
(3)dtype爲數據類型,默認的數據類型是np.int

# 返回[0,1)之間的整數,所以只有0
np.random.randint(1,size=5) 
array([0, 0, 0, 0, 0])

# 返回1個[1,5)時間的隨機整數
np.random.randint(1,5) 
4

# 返回一個shape:2*2 
np.random.randint(-5,5,size=(2,2))
array([[ 2, -1],
       [ 2,  0]])
  • numpy.random.randn(d0,d1,…,dn):一個或一組樣本,具有標準正態分佈

標準正態分佈又稱爲u分佈,是以0爲均值、以1爲標準差的正態分佈,記爲N(0,1)

# 當沒有參數時,返回單個數據
np.random.randn() 
>> -1.1241580894939212

# 2*4的數組,服從標準正太分佈
np.random.randn(2,4)
  • 以給定形狀返回[0,1)之間的隨機浮點數

(1)numpy.random.random_sample(size=None)
(2)numpy.random.random(size=None)
(3)numpy.random.ranf(size=None)
(4)numpy.random.sample(size=None)

#  使用隨機種子,生成隨機數,區間在[0,1)之間
np.random.seed(1)
print(np.random.random_sample(size=(3,2)))
print(np.random.random(size=(3,2)))
print(np.random.ranf(size=(3,2)))
print(np.random.sample(size=(3,2)))

---------------------
# 結果爲
[[4.17022005e-01 7.20324493e-01]
 [1.14374817e-04 3.02332573e-01]
 [1.46755891e-01 9.23385948e-02]]
[[0.18626021 0.34556073]
 [0.39676747 0.53881673]
 [0.41919451 0.6852195 ]]
[[0.20445225 0.87811744]
 [0.02738759 0.67046751]
 [0.4173048  0.55868983]]
[[0.14038694 0.19810149]
 [0.80074457 0.96826158]
 [0.31342418 0.69232262]]
  • numpy.random.choice(a,size=None,replace=True,p=None) :

(1)若a爲數組,則從a中選取元素;
(2)若a爲單個int類型數,則選取range(a)中的數
(3)replace是bool類型,爲True,則選取的元素會出現重複;反之不會出現重複
(4)p爲數組,裏面存放選到每個數的可能性,即概率

# 在range(5)中取3個數,默認replace=True可以重複
np.random.choice(5,3)
array([4, 1, 4])

# 當replace爲False時,生成的隨機數不能有重複的數值
np.random.choice(5, 3, replace=False)
array([0, 3, 1])

# 在range(5)中取元素,生成3*2的數組,默認replace=True可以重複
np.random.choice(5,size=(3,2))
array([[1, 0],
       [4, 2],
       [3, 3]])

# 從demo_list中選取元素,生成3*3的數組
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3))
array([['moto', 'iphone', 'xiaomi'],
       ['lenovo', 'xiaomi', 'xiaomi'],
       ['xiaomi', 'lenovo', 'iphone']],
      dtype='<U7')

# 參數p的長度與參數a的長度需要一致;且p裏的數據之和應爲1
# 即給出的是a中各個元素出現的概率
# 所以結果出現“sansumg”的次數多,因爲它的概率大
demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
np.random.choice(demo_list,size=(3,3), p=[0.1,0.6,0.1,0.1,0.1])
array([['sansumg', 'sansumg', 'sansumg'],
       ['sansumg', 'sansumg', 'sansumg'],
       ['sansumg', 'xiaomi', 'iphone']],
      dtype='<U7')
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章