bzero 和memset的區別

bzero

  原型:extern void bzero(void *s, int n);
  用法:#include <string.h>
  功能:置字節字符串s的前n個字節爲零且包括‘\0’。
  說明:bzero無返回值,並且使用strings.h頭文件,strings.h曾經是posix標準的一部分,但是在POSIX.1-2001標準裏面,這些函數被標記爲了遺留函數而不推薦使用。在POSIX.1-2008標準裏已經沒有這些函數了。推薦使用memset替代bzero。
 
  void *memset(void *s, int ch, size_t n);
  函數解釋:將s中前n個字節替換爲ch並返回s;
  memset:作用是在一段內存塊中填充某個給定的值,它是對較大的結構體或數組進行清零操作的一種最快方法。
  常見的三種錯誤
  第一: 搞反了ch 和 n的位置.
  一定要記住 如果要把一個char a[20]清零, 一定是 memset(a, 0, 20)
  而不是 memset(a, 20, 0)
  第二: 過度使用memset, 我想這些程序員可能有某種心理陰影, 他們懼怕未經初始化的內存, 所以他們會寫出這樣的代碼:
  char buffer[20];
  memset(buffer, 0, sizeof((char)*20));
  strcpy(buffer, "123");
  這裏的memset是多餘的. 因爲這塊內存馬上就被覆蓋了, 清零沒有意義.
  第三: 其實這個錯誤嚴格來講不能算用錯memset, 但是它經常在使用memset的場合出現

 

關於字符數組的初始化,在項目的壓力測試中,發現性能明顯下降,變懷疑在程序中的若干臨時字符數組的初始化(使用bzero)身上。於是修改爲首個字符置零的方式而非全部置零的方式初始化,響應得到明顯的提升。原來在mp3檢索的每一條結果都要進行bzero對臨時數組初始化,每一個請求需要30次的bzero對臨時數組的置零。於是想到了,在非必要的情況下,只對臨時數組的第一個(或前幾個)字符置零的初始化方式對比與使用bzero的話,能夠明顯提高性能。

在此之外,又想起另外兩種對數組所有字節都置零的方式,順便比較一下他們之間的性能,寫個簡單的程序如下:

#include <stdio.h>
#include <sys/time.h>
#include <string.h>

#define TIMEDIFF(s, e) (((e.tv_sec)-(s.tv_sec))*1000000 + (e.tv_usec) - (s.tv_usec))

int main()
{
struct timeval s, e;
char a[1024], b[1024*1024], c[1024*1024*4];

gettimeofday(&s, NULL);
bzero(a, sizeof(a));
gettimeofday(&e, NULL);
printf("bzero 1k: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
bzero(b, sizeof(b));
gettimeofday(&e, NULL);
printf("bzero 1m: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
bzero(c, sizeof(c));
gettimeofday(&e, NULL);
printf("bzero 4M: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
memset(a, 0, sizeof(a));
gettimeofday(&e, NULL);
printf("memset 1k: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
memset(b, 0, sizeof(b));
gettimeofday(&e, NULL);
printf("memset 1M: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
memset(c, 0, sizeof(c));
gettimeofday(&e, NULL);
printf("memset 4M: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
for(int i=0; i<sizeof(a); ++i)
a[i]=0;
gettimeofday(&e, NULL);
printf("for 1k: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
for(int i=0; i<sizeof(b); ++i)
b[i]=0;
gettimeofday(&e, NULL);
printf("for 1M: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
memset(c, 0, sizeof(c));
gettimeofday(&e, NULL);
printf("memset 4M: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
for(int i=0; i<sizeof(a); ++i)
a[i]=0;
gettimeofday(&e, NULL);
printf("for 1k: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
for(int i=0; i<sizeof(b); ++i)
b[i]=0;
gettimeofday(&e, NULL);
printf("for 1M: %d\n", TIMEDIFF(s, e));

gettimeofday(&s, NULL);
for(int i=0; i<sizeof(c); ++i)
c[i]=0;
gettimeofday(&e, NULL);
printf("for 4M: %d\n", TIMEDIFF(s, e));
}

運行的結果基本上是,在數組較小的情況下,bzero的效率比memset高;當數組超過一定大小之後,bzero的效率開始比memset低;數組越大,memset的性能優勢越明顯。而在數組較小的情況下,memset的性能甚至不如直接for循環對數組中的每一個字節置零的方法。

以下的運行結果的數值單位是微秒(gettimeofday的默認單位)。

第一次運行:
bzero 1k: 6
bzero 1m: 2168
bzero 4M: 9136
memset 1k: 11
memset 1M: 1303
memset 4M: 5483
for 1k: 12
for 1M: 4934
for 4M: 21313

再一次運行:
bzero 1k: 6
bzero 1m: 2160
bzero 4M: 9067
memset 1k: 17
memset 1M: 1257
memset 4M: 5115
for 1k: 11
for 1M: 4866
for 4M: 19201

此後,又寫了個小程序,測試在堆上的數組中,bzero和memset的效率,發現兩者差不多。可能由於,裏面原來的數據就比較有規則,不管是否先對數組置一隨機值。(malloc開闢字符數組空間時,會清零的。)

#include <stdio.h>
#include <string.h>
#include <sys/time.h>
#include <stdlib.h>
#include <time.h>

#define TIMEDIFF(s, e) (((e.tv_sec)-(s.tv_sec))*1000000 + (e.tv_usec) - (s.tv_usec))

int main()
{
srand(time(NULL));
char *array;
struct timeval s, e;
int tb, tm;
for(int i=1; i<1024*1024*1024; i*=2)
{
array=(char*)malloc(i);
memset(array, rand()%256, i);
gettimeofday(&s, NULL);
bzero(array, i);
gettimeofday(&e, NULL);
tb=TIMEDIFF(s, e);
free(array);

array=(char*)malloc(i);
memset(array, rand()%256, i);
gettimeofday(&s, NULL);
memset(array, 0, i);
gettimeofday(&e, NULL);
tm=TIMEDIFF(s, e);
free(array);

printf("array size: %d \tbzero time: %d \tmemset time: %d \tbzero>memset?: %d\n", i, tb, tm, (tb>tm));

}
}


運行結果:
array size: 1 bzero time: 28 memset time: 1 bzero>memset?: 1
array size: 2 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 4 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 8 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 16 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 32 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 64 bzero time: 1 memset time: 0 bzero>memset?: 1
array size: 128 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 256 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 512 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 1024 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 2048 bzero time: 1 memset time: 1 bzero>memset?: 0
array size: 4096 bzero time: 2 memset time: 2 bzero>memset?: 0
array size: 8192 bzero time: 2 memset time: 2 bzero>memset?: 0
array size: 16384 bzero time: 5 memset time: 6 bzero>memset?: 0
array size: 32768 bzero time: 9 memset time: 8 bzero>memset?: 1
array size: 65536 bzero time: 27 memset time: 24 bzero>memset?: 1
array size: 131072 bzero time: 81 memset time: 68 bzero>memset?: 1
array size: 262144 bzero time: 190 memset time: 169 bzero>memset?: 1
array size: 524288 bzero time: 447 memset time: 393 bzero>memset?: 1
array size: 1048576 bzero time: 996 memset time: 973 bzero>memset?: 1
array size: 2097152 bzero time: 2258 memset time: 2272 bzero>memset?: 0
array size: 4194304 bzero time: 4821 memset time: 4799 bzero>memset?: 1
array size: 8388608 bzero time: 9797 memset time: 9799 bzero>memset?: 0
array size: 16777216 bzero time: 19764 memset time: 19737 bzero>memset?: 1
array size: 33554432 bzero time: 39687 memset time: 39675 bzero>memset?: 1
array size: 67108864 bzero time: 79907 memset time: 79324 bzero>memset?: 1
array size: 134217728 bzero time: 158956 memset time: 158775 bzero>memset?: 1
array size: 268435456 bzero time: 318247 memset time: 318632 bzero>memset?: 0
array size: 536870912 bzero time: 638536 memset time: 638883 bzero>memset?: 0

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章