Linux系統調用之SYSCALL_DEFINE

相信熟悉系統調用的都知道,系統調用在內核中的入口都是sys_xxx,我也不例外,記得有一次,我抱着學習一下socket內核實現的心態想在內核中尋找sys_socket系統調用,卻發現只能找到宏定義,怎麼也找不到函數實現。後來經過查閱才知道,原來Linux的系統調用都改爲SYSCALL_DEFINE定義的了。相信大家都很疑惑,原來的sys_xxx不是挺好的嗎?爲什麼要定義成SYSCALL_DEFINE呢?我也很疑惑,所以我看了一下SYSCALL_DEFINE的定義,如下:

#define SYSCALL_DEFINE0(name)	   asmlinkage long sys_##name(void)
#define SYSCALL_DEFINE1(name, ...) SYSCALL_DEFINEx(1, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE2(name, ...) SYSCALL_DEFINEx(2, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE3(name, ...) SYSCALL_DEFINEx(3, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE4(name, ...) SYSCALL_DEFINEx(4, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE5(name, ...) SYSCALL_DEFINEx(5, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE6(name, ...) SYSCALL_DEFINEx(6, _##name, __VA_ARGS__)

 

#define SYSCALL_DEFINEx(x, name, ...)					\
	asmlinkage long sys##name(__SC_DECL##x(__VA_ARGS__));		\
	static inline long SYSC##name(__SC_DECL##x(__VA_ARGS__));	\
	asmlinkage long SyS##name(__SC_LONG##x(__VA_ARGS__))		\
	{								\
		__SC_TEST##x(__VA_ARGS__);				\
		return (long) SYSC##name(__SC_CAST##x(__VA_ARGS__));	\
	}								\
	SYSCALL_ALIAS(sys##name, SyS##name);				\
	static inline long SYSC##name(__SC_DECL##x(__VA_ARGS__))



相信大家猛一下看到這麼一大堆東西,有點蒙,不着急,一點一點來看。我們就拿socket來舉例,SYSCALL_DEFINEx裏面的x代表的是系統調用參數個數。sys_socket的宏定義爲:

asmlinkage long sys_socket(int, int, int);那麼可以看出來對應的應該是SYSCALL_DEFINE3。到socket.c裏面找到socket的定義如下:

SYSCALL_DEFINE3(socket, int, family, int, type, int, protocol)

 

我們把它打開看一下:

首先##是連接符,__VA_ARGS__代表前面...裏面的可變參數,也就是說展開後結果爲

SYSCALL_DEFINEx(3, _socket,  int, family, int, type, int, protocol)

 

那麼再將上面的展開,結果如下:

	asmlinkage long sys_socket(__SC_DECL3(int, family, int, type, int, protocol));		\
	static inline long SYSC_socket(__SC_DECL3(int, family, int, type, int, protocol));	\
	asmlinkage long SyS_socket(__SC_LONG3(int, family, int, type, int, protocol))		\
	{								\
		__SC_TEST3(int, family, int, type, int, protocol);				\
		return (long) SYSC_socket(__SC_CAST3(int, family, int, type, int, protocol));	\
	}								\
	SYSCALL_ALIAS(sys_socket, SyS_socket);				\
	static inline long SYSC_sockt(__SC_DECL3(int, family, int, type, int, protocol))


這回大家看到了第一行熟悉的sys_socket了。哎,不對,這好像只是一個函數聲明,不是定義吧,那麼定義跑到哪裏去了?向下接着看,定義其實在最後一行,結尾沒有加分號,下面再加上一對大括號,可不就是定義。那麼上面的一大堆是幹什麼用的呢?

先看SYSCALL_ALIAS,根據名字就可以知道,這個宏定義的意思其實就是將SyS_socket的別名設爲sys_socket,也就是說調用sys_socket其實就是在調用SyS_sockt。

定義如下:

#define SYSCALL_ALIAS(alias, name)					\
	asm ("\t.globl " #alias "\n\t.set " #alias ", " #name "\n"	\
	     "\t.globl ." #alias "\n\t.set ." #alias ", ." #name)

那麼SyS_socket裏面就調用到了SYSC_socket了,就調用到了函數定義裏去了。這樣子兜了一大圈,通過別名再調用到函數定義,如此麻煩到底是爲了什麼?難道是大神們在秀技術?顯得高大上嗎?NO,關鍵在那幾個我們一直沒有介紹到的宏,__SC_DECL3,__SC_LONG3,__SC_CAST3。

大家看一下定義:

#define __SC_DECL1(t1, a1)	t1 a1
#define __SC_DECL2(t2, a2, ...) t2 a2, __SC_DECL1(__VA_ARGS__)
#define __SC_DECL3(t3, a3, ...) t3 a3, __SC_DECL2(__VA_ARGS__)
#define __SC_DECL4(t4, a4, ...) t4 a4, __SC_DECL3(__VA_ARGS__)
#define __SC_DECL5(t5, a5, ...) t5 a5, __SC_DECL4(__VA_ARGS__)
#define __SC_DECL6(t6, a6, ...) t6 a6, __SC_DECL5(__VA_ARGS__)

#define __SC_LONG1(t1, a1) 	long a1
#define __SC_LONG2(t2, a2, ...) long a2, __SC_LONG1(__VA_ARGS__)
#define __SC_LONG3(t3, a3, ...) long a3, __SC_LONG2(__VA_ARGS__)
#define __SC_LONG4(t4, a4, ...) long a4, __SC_LONG3(__VA_ARGS__)
#define __SC_LONG5(t5, a5, ...) long a5, __SC_LONG4(__VA_ARGS__)
#define __SC_LONG6(t6, a6, ...) long a6, __SC_LONG5(__VA_ARGS__)

#define __SC_CAST1(t1, a1)	(t1) a1
#define __SC_CAST2(t2, a2, ...) (t2) a2, __SC_CAST1(__VA_ARGS__)
#define __SC_CAST3(t3, a3, ...) (t3) a3, __SC_CAST2(__VA_ARGS__)
#define __SC_CAST4(t4, a4, ...) (t4) a4, __SC_CAST3(__VA_ARGS__)
#define __SC_CAST5(t5, a5, ...) (t5) a5, __SC_CAST4(__VA_ARGS__)
#define __SC_CAST6(t6, a6, ...) (t6) a6, __SC_CAST5(__VA_ARGS__)
#define __SC_TEST(type)		BUILD_BUG_ON(sizeof(type) > sizeof(long))
#define __SC_TEST1(t1, a1)	__SC_TEST(t1)
#define __SC_TEST2(t2, a2, ...)	__SC_TEST(t2); __SC_TEST1(__VA_ARGS__)
#define __SC_TEST3(t3, a3, ...)	__SC_TEST(t3); __SC_TEST2(__VA_ARGS__)
#define __SC_TEST4(t4, a4, ...)	__SC_TEST(t4); __SC_TEST3(__VA_ARGS__)
#define __SC_TEST5(t5, a5, ...)	__SC_TEST(t5); __SC_TEST4(__VA_ARGS__)
#define __SC_TEST6(t6, a6, ...)	__SC_TEST(t6); __SC_TEST5(__VA_ARGS__)

#define BUILD_BUG_ON(condition) ((void)sizeof(char[1 - 2*!!(condition)]))


 

展開過程如下:

	__SC_DECL3(int, family, int, type, int, protocol) -> int family, __SC_DECL2(int, type, int, protocol) -> int family, int type, __SC_DECL1(int, protocol) -> int family, int type, int protocol 

 

	__SC_LONG3(int, family, int, type, int, protocol) -> long family, __SC_LONG2(int, type, int, protocol) -> long family, long type , __SC_LONG1(int, protocol) -> long family, long type, long protocol

 

	__SC_CAST3(int, family, int, type, int, protocol) -> (int) family, __SC_CAST2(int, type, int, protocol) -> (int) family, (int) type, __SC_CAST1(int, protocol) -> (int) family, (int) type, (int) protocol 

 

	__SC_TEST3(int, family, int, type, int, protocol) ->  __SC_TEST(int); __SC_TEST2(int, type, int, protocol) -> __SC_TEST(int); __SC_TEST(int); __SC_TEST1(int, protocol) -> __SC_TEST(int); __SC_TEST(int); __SC_TEST(int); -> BUILD_BUG_ON(sizeof(int) > sizeof(long)); BUILD_BUG_ON(sizeof(int) > sizeof(long)); BUILD_BUG_ON(sizeof(int) > sizeof(long));

 

那麼上面的SYSCALL_DEFINEx就變爲了下面這段比較清晰的代碼了:

	asmlinkage long sys_socket(int family, int type, int protocol);		\
	static inline long SYSC_socket(int family, int type, int protocol );	\
	asmlinkage long SyS_socket(long family, long type, long protocol)		\
	{								\
		BUILD_BUG_ON(sizeof(int) > sizeof(long)); BUILD_BUG_ON(sizeof(int) > sizeof(long));			\
		return (long) SYSC_socket((int) family, (int) type, (int) protocol);	\
	}								\
	SYSCALL_ALIAS(sys_socket, SyS_socket);				\
	static inline long SYSC_sockt(int family, int type, int protocol)


大家這下總算看明白了吧,其實裏面做的工作,就是將系統調用的參數統一變爲了使用long型來接收,再強轉轉爲int,也就是系統調用本來傳下來的參數類型。那麼這麼強轉一下究竟是爲什麼呢?原因就是64位的Linux有一個名爲CVE-2009-2009的漏洞,這個漏洞的具體內容,請大家看我的另外一篇博客:

http://blog.csdn.net/hxmhyp/article/details/22619729,有詳細說明。

發佈了9 篇原創文章 · 獲贊 1 · 訪問量 1090
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章