內存拷貝函數實現

原型:void*memcpy(void*dest, const void*src,unsigned int count); 

功能:由src所指內存區域複製count個字節到dest所指內存區域。  

說明:srcdest所指內存區域不能重疊,函數返回指向dest的指針。    

舉例:           

  1. //   memcpy.c                         
  2. #include   <stdlib.h>             
  3. #include   <string.h>             
  4. main()             
  5. {                 
  6.     char *s= "Golden  Global   View ";  
  7.     char d[20];  
  8.     clrscr();  
  9.     memcpy(d,s,strlen(s));  
  10.     d[strlen(s)]=0;  
  11.     printf( "%s ",d);  
  12.     getchar();  
  13.     return   0;  
  14. }  

下面自行實現這個函數

程序清單 1 V0.1版程序 

  1. void MyMemMove(char *dst,char *src,int count)   
  2. {   
  3.     while(count--)   
  4.         *dst++ = *src++;   
  5. }   
程序清單 2 測試V0.1用例 
  1. void Test()   
  2. {   
  3.     char p1[256] = ”hello,world!”;   
  4.     char p2[256] = {0};   
  5.     MyMemMove(p2,p1,strlen(p1));   
  6.     printf(“%s”,p2);   
  7. }   
    客觀地講,相比那些交白卷或者函數聲明都不會寫的同學來說,能夠寫出這段代碼的同學已經非常不錯了,至少在C語言這門課程上已經達到了現行高校的教育目標,但是離企業的用人要求還有一定的距離。我們不妨將上面的程序稱爲V0.1版本,看看還有沒有什麼地方可以改進。 
   首先我們看看函數聲明是否合理,V0.1版的程序將源地址和目的地址都用char *來表示,這樣當然也沒有什麼問題,但是讓其他人使用起來卻很不方便,假如現在要將count個連續的結構體對象移動到另外一個地方去,如果要使用v0.1的程序的話,正確的寫法如下: 
    MyMemMove((char *)dst,(char *)src,sizeof(TheStruct)*count); 
也就是說我們需要將結構體指針強制轉換成char * 才能夠正常工作,這樣除了字符串以外其它的類型都不可避免地要進行指針強制轉換,否則編譯器就會呱呱叫,比如在VC++2008下就會出現這樣的錯誤: 
error C2664: 'MyMemMove' : cannot convert parameter 1 from 'TheStruct *'to 'char *' ;那麼如何解決這個問題呢?其實很簡單,我們知道有一種特別的指針,任何類型的指針都可以對它賦值,那就是void *,所以應該將源地址和目的地址都用void*來表示。當然函數體的內容也要作相應的改變,這樣我們就得到了V0.2版的程序。 
程序清單 3 V0.2版程序 

  1. void MyMemMove(void *dst,void *src,int count)   
  2. {   
  3.     while (count--)   
  4.     {   
  5.         *(char *)dst = *(char *)src;   
  6.         dst = (char *)dst + 1;   
  7.         src = (char *)src + 1;   
  8.     }   
  9. }   
有的同學可能會問,這裏面不是還有指針強制轉換嗎?只不過是換了地方。沒錯,強制指針轉換確實是從使用者的代碼轉移到了庫的代碼裏,但我們可以將 MyMemMove理解爲庫,而將Test理解爲使用者,事實上通過調整之後的效果卻有天壤之別,V0.1是一逸永勞,而V0.2是一勞永逸! 
     還有幾個細節需要注意,爲了實現鏈式表達式,我們應該將返回值也改爲void *。此外,如果我們不小心將“*(char *)dst = *(char *)src;”寫反了,寫成“*(char *)src =*(char *)dst;”編譯照樣通過,而爲了找出這個錯誤又得花費不少時間。注意到src所指向的內容在這個函數內不應該被改變,所有對src所指的內容賦值都應該被禁止,所以這個參數應該用const修飾,如果有類似的錯誤在編譯時就能夠被發現: 
error C3892: 'src' : you cannot assign to a variable that is const ;作爲程序員犯錯誤在所難免,但是我們可以利用相對難犯錯誤的機器,也就是編譯器來降低犯錯誤的概率,這樣我們就得到了V0.3版的程序。 
程序清單 4 V0.3版程序 

  1. void * MyMemMove(void *dst,const void *src,int count)   
  2. {   
  3.     void *ret=dst;   
  4.     while (count--)   
  5.     {   
  6.         *(char *)dst = *(char *)src;   
  7.         dst = (char *)dst + 1;   
  8.         src = (char *)src + 1;   
  9.     }   
  10.     return ret;  
  11. }   
     現在再來考慮這樣一種情況,有使用者這樣調用庫:MyMemMove(NULL,src, count),這是完全可能的,因爲一般來說這些地址都是程序計算出來的,那就難免會算錯,出現零地址或者其它的非法地址也不足爲奇。可以預料的是,如果出現這種情況的話,則程序馬上就會down掉,更糟糕的是你不知道錯誤出在哪裏,於是不得不投入大量的精力在浩瀚的代碼中尋找bug。解決這類問題的通用辦法是對輸入參數作合法性檢查,也就是V0.4版程序。 
程序清單 5 V0.4版程序 

  1. void * MyMemMove(void *dst,const void *src,int count)   
  2. {   
  3.     void *ret=dst;   
  4.     if (NULL==dst||NULL ==src)   
  5.     {   
  6.         return dst;   
  7.     }   
  8.     while (count--)   
  9.     {   
  10.         *(char *)dst = *(char *)src;   
  11.         dst = (char *)dst + 1;   
  12.         src = (char *)src + 1;   
  13.     }   
  14.     return ret;   
  15. }   

     上面之所以寫成“if(NULL==dst||NULL ==src)”而不是寫成“if (dst == NULL || src == NULL)”,也是爲了降低犯錯誤的概率。我們知道,在C語言裏面“==”和“=”都是合法的運算符,如果我們不小心寫成了“if (dst = NULL || src = NULL)”還是可以編譯通過,而意思卻完全不一樣了,但是如果寫成“if (NULL=dst||NULL =src)”,則編譯的時候就通不過了,所以我們要養成良好的程序設計習慣:常量與變量作條件判斷時應該把常量寫在前面。V0.4版的代碼首先對參數進行合法性檢查,如果不合法就直接返回,這樣雖然程序dwon掉的可能性降低了,但是性能卻大打折扣了,因爲每次調用都會進行一次判斷,特別是頻繁的調用和性能要求比較高的場合,它在性能上的損失就不可小覷。如果通過長期的嚴格測試,能夠保證使用者不會使用零地址作爲參數調用MyMemMove函數,則希望有簡單的方法關掉參數合法性檢查。我們知道宏就有這種開關的作用,所以V0.5版程序也就出來了。 

程序清單 6 V0.5版程序

  1. void * MyMemMove(void *dst,const void *src,int count)   
  2. {   
  3.     void *ret=dst;   
  4. #ifdef DEBUG   
  5.     if (NULL==dst||NULL ==src)   
  6.     {   
  7.         return dst;   
  8.     }   
  9. #endif   
  10.     while (count--)   
  11.     {   
  12.         *(char *)dst = *(char *)src;   
  13.         dst = (char *)dst + 1;   
  14.         src = (char *)src + 1;   
  15.     }   
  16.     return ret;   
  17. }   
     如果在調試時我們加入“#defineDEBUG”語句,增強程序的健壯性,那麼在調試通過後我們再改爲“#undef DEBUG”語句,提高程序的性能。事實上在標準庫裏已經存在類似功能的宏:assert,而且更加好用,它還可以在定義DEBUG時指出代碼在那一行檢查失敗,而在沒有定義DEBUG時完全可以把它當作不存在。assert(_Expression)的使用非常簡單,當_Expression爲0時,調試器就可以出現一個調試錯誤,有了這個好東西代碼就容易多了。 
程序清單 7 V0.6版程序 

  1. void * MyMemMove(void *dst,const void *src,int count)   
  2. {   
  3.     assert(dst);   
  4.     assert(src);   
  5.     void *ret=dst;   
  6.     while (count--)   
  7.     {   
  8.         *(char *)dst = *(char *)src;   
  9.         dst = (char *)dst + 1;   
  10.         src = (char *)src + 1;   
  11.     }   
  12.     return ret;   
  13. }   
    到目前爲止,在語言層面上,我們的程序基本上沒有什麼問題了,那麼是否真的就沒有問題了呢?這就要求程序員從邏輯上考慮了,這也是優秀程序員必須具備的素質,那就是思維的嚴謹性,否則程序就會有非常隱藏的bug,就這個例子來說,如果用戶用下面的代碼來調用你的程序。 
程序清單 8 重疊的內存測試 

  1. void Test()   
  2. {   
  3.     char p [256]= "hello,world!";   
  4.     MyMemMove(p+1,p,strlen(p)+1);   
  5.     printf("%s\n",p);   
  6. }   
    如果你身邊有電腦,你可以試一下,你會發現輸出並不是我們期待的“hhello,world!”(在“hello world!”前加個h),而是“hhhhhhhhhhhhhh”,這是什麼原因呢?原因出在源地址區間和目的地址區間有重疊的地方,V0.6版的程序無意之中將源地址區間的內容修改了!有些反映快的同學馬上會說我從高地址開始拷貝。粗略地看,似乎能解決這個問題,雖然區間是重疊了,但是在修改以前已經拷貝了,所以不影響結果。但是仔細一想,這其實是犯了和上面一樣的思維不嚴謹的錯誤,因爲用戶這樣調用還是會出錯: 
MyMemMove( p, p+1, strlen(p)+1); 所以最完美的解決方案還是判斷源地址和目的地址的大小,才決定到底是從高地址開始拷貝還是低地址開始拷貝,所以V0.7順利成章地出來了。 
程序清單 9 V0.7版程序 

  1. void * MyMemMove(void *dst,const void *src,int count)   
  2. {   
  3.     assert(dst);   
  4.     assert(src);   
  5.     void * ret = dst;   
  6.     if (dst <= src || (char *)dst >= ((char *)src + count)) {   
  7.         while (count--) {   
  8.             *(char *)dst = *(char *)src;   
  9.             dst = (char *)dst + 1;   
  10.             src = (char *)src + 1;   
  11.         }   
  12.     }   
  13.     else {   
  14.         dst = (char *)dst + count - 1;   
  15.         src = (char *)src + count - 1;   
  16.         while (count--) {   
  17.             *(char *)dst = *(char *)src;   
  18.             dst = (char *)dst - 1;   
  19.         src = (char *)src - 1;   
  20.         }   
  21.     }   
  22.     return(ret);   
  23. }   
    經過以上7個版本的修改,我們的程序終於可以算是“工業級”了。回頭再來看看前面的測試用例,就會發現那根本就算不上是測試用例,因爲它只調用了最正常的一種情況,根本達不到測試的目的。有了上面的經歷,測試用例也就相應地出現了,我們不妨用字符數組來模擬內存。 
程序清單 10 相對全面的測試用例 

  1. void Test()   
  2. {   
  3.     char p1[256] = "hello,world!";   
  4.     char p2[256] = {0};   
  5.     MyMemMove(p2,p1,strlen(p1)+1);   
  6.     printf("%s\n",p2);   
  7.     MyMemMove(NULL,p1,strlen(p1)+1);   
  8.     MyMemMove(p2,NULL,strlen(p1)+1);   
  9.     MyMemMove(p1+1,p1,strlen(p1)+1);   
  10.     printf("%s\n",p1);   
  11.     MyMemMove(p1,p1+1,strlen(p1)+1);   
  12.     printf("%s\n",p1);   
  13. }    

  1. void * memcpy ( void * dst,const void * src,size_t count)  
  2. {  
  3.     void * ret = dst;  
  4.     while (count--) {  
  5.         *(char *)dst = *(char *)src;  
  6.         dst = (char *)dst + 1;  
  7.         src = (char *)src + 1;  
  8.     }  
  9.     return(ret);  
  10. }  
  11. char *strcpy(char *des, const char *src){  
  12.     assert((des != NULL) && (src != NULL));  
  13.     char *ret = des; // 防止改變des的地址  
  14.     while ((*des++ = *src++) !='\0') ;  
  15.     return ret;  
  16. }  
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章