偽隨機數

偽隨機數

偽隨機數是用確定性的算法計算出來自[0,1]均勻分布的隨機數序列。並不真正的隨機,但具有類似於隨機數的統計特徵,如均勻性、獨立性等。在計算偽隨機數時,若使用的初值(種子)不變,那么偽隨機數的數序也不變。偽隨機數可以用計算機大量生成,在模擬研究中為了提高模擬效率,一般採用偽隨機數代替真正的隨機數。模擬中使用的一般是循環周期極長並能通過隨機數檢驗的偽隨機數,以保證計算結果的隨機性。

基本介紹

  • 中文名:偽隨機數
  • 方法:直接法,逆轉法
  • 套用:程式語言
  • 性質:名詞
生成方法,程式實例,生成器缺點,

生成方法

一般地,偽隨機數的生成方法主要有以下3種:
(1) 直接法(Direct Method),根據分布函式的物理意義生成。缺點是僅適用於某些具有特殊分布的隨機數,如二項式分布、泊松分布。
(2) 逆轉法(Inversion Method),假設U服從[0,1]區間上的均勻分布,令X=F-1(U),則X的累計分布函式(CDF)為F。該方法原理簡單、編程方便、適用性廣。
(3)接受拒絕法(Acceptance-Rejection Method):假設希望生成的隨機數的機率密度函式(PDF)為f,則首先找到一個PDF為g的隨機數發生器與常數c,使得f(x)≤cg(x),然後根據接收拒絕算法求解。由於算法平均運算c次才能得到一個希望生成的隨機數,因此c的取值必須儘可能小。顯然,該算法的缺點是較難確定g與c。
偽隨機數發生器偽隨機數發生器
因此,偽隨機數生成器(PRNG)一般採用逆轉法,其基礎是均勻分布,均勻分布PRNG的優劣決定了整個隨機數體系的優劣[7]。下文研究均勻分布的PRNG。

程式實例

C語言程式例
下面看這樣一個C程式:
偽隨機數偽隨機數
//rand01.c#include <stdlib.h>static unsigned int RAND_SEED;unsigned int random(void){    RAND_SEED=(RAND_SEED*123+59)%65536;    return(RAND_SEED);}void random_start(void){    int temp[2];    movedata(0x0040,0x006c,FP_SEG(temp),FP_OFF(temp),4);    RAND_SEED=temp[0];}main(){    unsigned int i,n;    random_start();    for(i=0;i<10;i++)        printf("%u\t",random());    printf("\n");}
這個程式(rand01.c)完整地闡述了隨機數產生的過程:
首先,主程式調用random_start()方法,random_start()方法中的這一句我很感興趣:
movedata(0x0040,0x006c,FP_SEG(temp),FP_OFF(temp),4);
這個函式用來移動記憶體數據,其中FP_SEG(far pointer to segment)是取temp數組段地址的函式,FP_OFF(far pointer to offset)是取temp數組相對地址的函式,movedata函式的作用是把位於0040:006CH存儲單元中的雙字放到數組temp的聲明的兩個存儲單元中。這樣可以通過temp數組把0040:006CH處的一個16位的數送給RAND_SEED。
偽隨機數理論推導偽隨機數理論推導
random用來根據隨機種子RAND_SEED的值計算得出隨機數,其中這一句:
RAND_SEED=(RAND_SEED*123+59)%65536;
是用來計算隨機數的方法,隨機數的計算方法在不同的計算機中是不同的,即使在相同的計算機中安裝的不同的作業系統中也是不同的。我在linux和windows下分別試過,相同的隨機種子在這兩種作業系統中生成的隨機數是不同的,這說明它們的計算方法不同。
現在,我們明白隨機種子是從哪兒獲得的,而且知道隨機數是怎樣通過隨機種子計算出來的了。那么,隨機種子為什麼要在記憶體的0040:006CH處取?0040:006CH處存放的是什麼?
學過《計算機組成原理與接口技術》這門課的人可能會記得在編制ROM BIOS時鐘中斷服務程式時會用到Intel 8253定時/計數器,它與Intel 8259中斷晶片的通信使得中斷服務程式得以運轉,主機板每秒產生的18.2次中斷正是處理器根據定時/記數器值控制中斷晶片產生的。在我們計算機的主機板上都會有這樣一個定時/記數器用來計算當前系統時間,每過一個時鐘信號周期都會使記數器加一,而這個記數器的值存放在哪兒呢?沒錯,就在記憶體的0040:006CH處,其實這一段記憶體空間是這樣定義的:
TIMER_LOW DW ? ;地址為 0040:006CH
TIMER_HIGH DW ? ;地址為 0040:006EH
TIMER_OFT DB ? ;地址為 0040:0070H
時鐘中斷服務程式中,每當TIMER_LOW轉滿時,此時,記數器也會轉滿,記數器的值歸零,即TIMER_LOW處的16位二進制歸零,而TIMER_HIGH加一。rand01.c中的
movedata(0x0040,0x006c,FP_SEG(temp),FP_OFF(temp),4);
正是把TIMER_LOW和TIMER_HIGH兩個16位二進制數放進temp數組,再送往RAND_SEED,從而獲得了“隨機種子”。
現在,可以確定的一點是,隨機種子來自系統時鐘,確切地說,是來自計算機主機板上的定時/計數器在記憶體中的記數值。這樣,我們總結一下前面的分析,並討論一下這些結論在程式中的套用:
1.隨機數是由隨機種子根據一定的計算方法計算出來的數值。所以,只要計算方法一定,隨機種子一定,那么產生的隨機數就不會變。
C++程式例
看下面這個C++程式:
偽隨機數理論推導偽隨機數理論推導
//rand02.cpp#include <iostream>using namespace std;int main(){    unsigned int seed=5;    srand(seed);    unsigned int r=rand();    cout<<"r = "<<r<<endl; //根據C++ 98標準,可以不用return語句來結束main函式    return 0;}
在相同的平台環境下,編譯生成exe後,每次運行它,顯示的隨機數都是一樣的。這是因為在相同的編譯平台環境下,由隨機種子生成隨機數的計算方法都是一樣的,再加上隨機種子一樣,所以產生的隨機數就是一樣的。
2.只要用戶或第三方不設定隨機種子,那么在默認情況下隨機種子來自系統時鐘(即定時/計數器的值)
C++程式例2
看下面這個C++程式:
//rand03.cpp#include <iostream>#include <cstdlib>using namespace std;int main(){    srand((unsigned)time(NULL));    unsigned int r=rand();    cout<<"r = "<<r<<endl; //根據C++ 98標準,可以不用return語句來結束main函式    return 0;}
這裡用戶和其他程式沒有設定隨機種子,則使用系統定時/計數器的值做為隨機種子,所以,在相同的平台環境下,編譯生成exe後,每次運行它,顯示的隨機數會是偽隨機數,即每次運行顯示的結果會有不同。
3.建議:如果想在一個程式中生成隨機數序列,需要至多在生成隨機數之前設定一次隨機種子。
生成一個隨機字元串
看下面這個用來生成一個隨機字元串的C++程式:(原來的程式我編譯不了,就改了改,加了一些頭檔案)(我不是上面那個括弧里的人。我又對源程式進行了一下簡化,可以實現相同的功能)
//我不是上面那兩個括弧里的人,我只對源程式進行了一下格式化編輯//我不是上面那兩個括弧里和那個注釋掉的人,我只是將源程式的一個無用變數去掉#include <iostream>#include <ctime>#include <cstdlib>#define n 20using namespace std;int main(){    srand (time(0));    for (int i=0;i<n;++i) cout<<char(rand()%26+97);    cout<<endl;    return 0;}
偽隨機數發生器偽隨機數發生器
你可能會遇到這種情況,在VB中,在使用timer控制項編製程序的時候會發現用相同的時間間隔生成的一組隨機數會顯得有規律,而由用戶按鍵command事件產生的一組隨機數卻顯得比較隨機,為什麼?根據我們上面的分析,你可以很快想出答案。這是因為timer是由計算機時鐘記數器精確控制時間間隔的控制項,時間間隔相同,記數器前後的值之差相同,這樣時鐘取值就是呈線性規律的,所以隨機種子是呈線性規律的,生成的隨機數也是有規律的。而用戶按鍵事件產生隨機數確實更呈現隨機性,因為事件是由人按鍵引起的,而人不能保證嚴格的按鍵時間間隔,即使嚴格地去做,也不可能完全精確做到,只要時間間隔相差一微秒,記數器前後的值之差就不相同了,隨機種子的變化就失去了線性規律,那么生成的隨機數就更沒有規律了,所以這樣生成的一組隨機數更隨機。這讓我想到了各種晚會的抽獎程式,如果用人來按鍵產生幸運觀眾的話,那就會很好的實現隨機性原則,結果就會更公正。
總結
1.計算機的偽隨機數是由隨機種子根據一定的計算方法計算出來的數值。所以,只要計算方法一定,隨機種子一定,那么產生的隨機數就是固定的。
2.只要用戶或第三方不設定隨機種子,那么在默認情況下隨機種子來自系統時鐘。

生成器缺點

重複做N=10000次試驗,每次產生S=20與S=100個隨機分布的樣本,同時採用Kolmogorov- Smirnov假設檢驗(hypothesis test)來確定樣本是否滿足均勻分布。規定:
① 0假設(null hypothesis)為樣本服從均勻分布;② 1假設(alternative hypothesis)為樣本不服從均勻分布。
採用P值(∈[0, 1])衡量,P值越趨近於0,表示越有理由拒絕0假設,即樣本不服從均勻分布;P值越趨近於1,表示越有理由接受0假設,即樣本服從均勻分布。
如圖1與圖2所示:隨著P值下降,樣本也越來越不服從均勻分布。實踐中希望P值越大越好。然而統計學的結論顯示,P值一定服從均勻分布,與NS大小無關,這表明由於隨機性,總會出現某次抽樣得到的樣本不服從、甚至遠離均勻分布。另外,樣本大小的不同,造成檢驗標準的不同,直觀上看S=100對應的均勻分布普遍比S=20對應的更均勻。因此,小樣本情況下均勻分布PRNG的差異性尤為嚴重。

相關詞條

熱門詞條

聯絡我們