最近需要用到內存對齊的內存分配函數,參考網上的一些實現,自己也試着寫了一個,經過測試可以使用。歡迎拍磚,微笑。
0.內存對齊的大小
#define CACHE_LINE_SIZE 64 /*內存對齊的大小,我們選用一個cache line的大小*/
#define CACHE_LINE_MASK (CACHE_LINE_SIZE - 1) /*用於計算對齊的掩碼*/
1.內存對齊的malloc()
void *al_malloc(size_t size)
{
void *aligned_memory = NULL;
void *malloced_memory = NULL;
int tmp = 0;
if (size == 0)
{
return NULL;
}
/*如果申請內存的大小小於CACHE_LINE_SIZE,則不進行對齊,以節省空間。*/
if (size < CACHE_LINE_SIZE)
{
/*多申請一個指針大小的空間,用於保存對齊前的地址*/
malloced_memory = malloc(size + sizeof(void *));
/*得到對齊後的地址*/
aligned_memory = (void *)((char *)malloced_memory + sizeof(void *));
/*保存對齊前的地址*/
((void **)aligned_memory)[-1] = malloced_memory;
return aligned_memory;
}
/*多申請一個cache line大小的空間,用於對齊操作,或者保存對齊前的地址*/
malloced_memory = malloc(size + CACHE_LINE_SIZE);
/*判斷申請到的地址是否已經對齊*/
tmp = (uint64_t)malloced_memory & CACHE_LINE_MASK;
if (tmp == 0)
{
/*如果地址本身已經對齊,則只需保存該地址即可,
但申請到的地址要保存到對齊地址的前一個單元,
因此要將本身已經對齊的地址後移cache line個單元,
那麼在申請的時候就應該多申請cache line個單元*/
aligned_memory = (void *)((char *)malloced_memory + CACHE_LINE_SIZE);
}
else
{
/*得到對齊後的地址*/
aligned_memory = (void *)(((uint64_t)malloced_memory + CACHE_LINE_MASK)
& ~CACHE_LINE_MASK);
}
/*保存對齊前的地址*/
((void **)aligned_memory)[-1] = malloced_memory;
return aligned_memory;
}
2.內存對齊的realloc()
void *al_realloc(void *addr, size_t size)
{
void *real_addr = NULL;
void *malloced_addr = NULL;
void *aligned_addr = NULL;
char *p = NULL;
char *q = NULL;
int delt = 0;
int new_size = 0;
if (addr == NULL)
{
/*如果傳入內存首地址爲空,則相當於調用malloc()*/
return al_malloc(size);
}
if (size == 0)
{
/*如果傳入申請內存大小爲0,則相當於調用free()*/
al_free(addr);
return NULL;
}
/*多申請cache line大小的空間*/
new_size = size + CACHE_LINE_SIZE;
/*addr是使用al_malloc()或al_realloc()分配得到的一個對齊地址,
real_addr爲addr所指向的內存塊對齊前的真實起址*/
real_addr = ((void **)addr)[-1];
/*以內存塊的真實首地址爲起址,重新申請內存*/
malloced_addr = realloc(real_addr, new_size);
if (malloced_addr == real_addr)
{
/*如果新申請的內存是原內存塊的擴展, 則直接返回原來對齊的地址*/
return addr;
}
/*得到原內存塊中第一個數據在新內存塊中的存儲位置*/
addr = (void *)((char *)malloced_addr + ((char *)addr - (char *)real_addr));
/*得到對齊後的地址*/
aligned_addr = (void *)(((uint64_t)malloced_addr + CACHE_LINE_MASK)
& ~CACHE_LINE_MASK);
if (aligned_addr < addr)
{
/*對齊後的地址在第一個數據的前面,則將所有數據向前移動delt個單元*/
delt = addr - aligned_addr;
q = (char *)malloced_addr + new_size - 1;
for (p = (char *)addr; p <= q; p++)
{
*(p - delt) = *p;
}
} else if (addr < aligned_addr)
{
/*對齊後的地址在第一個數據的後面,則將所有數據向後移動delt個單元*/
delt = aligned_addr - addr;
q = (char *)addr;
for (p = (char *)malloced_addr + new_size - delt - 1; p >= q; p--)
{
*(p + delt) = *p;
}
}
/*保存對齊前的地址*/
((void **)aligned_addr)[-1] = malloced_addr;
return aligned_addr;
}
3.內存對齊的free()
void al_free (void *p)
{
if(p)
{
/*傳入要釋放的內存塊的真實首地址*/
free(((void **)p)[-1]);
}
}