1.ASN.1概述
抽象語法表示(標記)ASN.1(Abstract Syntax Notation One )一種數據定義語言,描述了對數據進行表示、編碼、傳輸和解碼的數據格式。網絡管理系統中的管理信息庫(MIB)、應用程序的數據結構、協議數據單元(PDU)都是用ASN.1定義的。
ASN.1優點:
通過如下的獨立:
⑴獨立於機器;
⑵獨立於程序語言;
⑶獨立於應用程序的內部表示,用一種統一的方式來描述數據結構。
解決如下的不同:
⑴程序語言之間數據類型不同
⑵不同機器平臺之間數據的存儲方式不同
⑶不同種類的計算機內部數據表示不同
比如:IBM爲EBCDIC,其它爲ASCⅡ;Intel的芯片從右到左計數字節數,而Motorola的芯片則從左到計數字節數。
在任何需要以數字方式發送信息的地方,都可使用ASN.1發送各種形式信息。包括音頻、視頻、圖片、數據等。由於各種系統對數據的定義並不完全相同, 這自然給利用其它系統的數據造成了障礙。表示層就擔負了消除這種障礙的任務。表示層如同應用程序和網絡之間的翻譯官:主要解決用戶信息的語法表示問題,即提供統一的、格式化的表示和轉換數據服務。數據的壓縮、解壓、加密、解密都在該層完成。
2.ASN.1語法.
ASN.1語法遵循傳統的巴科斯範式BNF風格.最基本的表達式如: Name ::= type . 表示爲定義某個名稱爲Name的元素,它的類型爲type. 例如: MyName ::= IA5String . 表示爲定義了一個名爲MyName的元素或變量,其類型爲ASN.1類型IA5String (類似於ASCII字符串).
ASN.1顯式值(Explict Value).
有些時候,我們需要定義一種ASN.1類型,它的子集元素包含預定義值. Name ::= type(Explict Value) . 顯式值(ExplictValue).必須是ASN.1類型允許選擇的值,而且也必須是元素所允許的值.例: MyName ::=IA5String (Tom) 表示MyName是字符串Tom的IA5String編碼.又例如:MyName ::= IA5String(Tom|Joe) 表示字符串的值既可以是Tom, 也可以是Joe.
這種語法的使用是爲了擴展確定的解碼器.例:
PublicKey::= SEQUENCE {
KeyType BOOLEAN(0),
Modulus INTEGER,
PubExponent INTEGER
}
PrivateKey ::= SEQUENCE {
KeyType BOOLEAN(1)
Modulus INTEGER,
PubExponent INTEGER,
PrivateExponent INTEGER
}
ASN.1容器(container)
容器是值一個包含了其他相同或者不同類型元素的數據類型(例如序列值SEQUENCE或集合值SET類型).目的是爲了組合一些複雜的數據類型集.ASN.1規範定義了4種容器類型:序列,單一序列(SEQUENCEOF),集合和單一集合(SET OF).雖然它們意義不同,但是語法是一樣的.
Name ::= Container {Name Type [ Name Type...]} 方括號中的內容和容器的元素個數都是可選項.還可以進行嵌套定義.
例:
UserRecord::= SEQUENCE {
Name SEQUENCE {
First IA5String,
Last IA5String
},
DoB UTCTIME
}
將其粗略的翻譯成C語言中的結構如下:
structUserRecord {
struct Name {
char *First,
char *Last
};
time_t DoB;
}
將其粗略的翻譯成ObjectPascal語言中的記錄如下(ObjectPascal不支持嵌套記錄):
Type
Name = record
First : String;
Last : String;
end;
UserRecord = record
aName : Name;
DoB : DateTime;
end;
ASN.1修改器
ASN.1定義了各種修改器,如可選(OPTIONAL),默認(DEFAULT),和選擇(CHOICE). 他們可以改變表達式的聲明.典型地用於定義一種要求編碼靈活,而定義又不繁瑣的類型.
<1>.可選(OPTIONAL)。顧名思義,其表示改變一個元素以便在編碼時它的類型是可選擇的.即編碼器可以忽略這個元素,解碼器不能假設它將出現.但當鄰接的兩個元素具有相同的類型時,會給解碼器帶來一些問題.
定義: Name ::= TypeOPTIONAL
例如:
Float::= SEQUENCE {
Exponent INTEGER OPTIONAL,
Mantissa INTEGER,
Sign BOOLEAN
}
當解碼器讀取這個結構時,在它看來第一個整數(INTEGER)可能是Exponent,也有可能認爲是Mantissa. 一般建議不使用這種方式定義結構.
<2>.默認(DEFAULT).默認修改器允許容器包含默認值.如果待編碼的數據值等同於它的默認值,那麼它將在發送的數據流中被忽略.例如:
Command::= SEQUENCE {
Token IA5String(NOP) DEFAULT,
Parameter INTEGER
}
如果編碼器把Token看成是代表字符串NOP,那麼序列將按照定義的那樣編碼爲:
Command ::= SEQUENCE {
Parameter INTEGER
}
<3>.選擇(CHOICE). 選擇修改器允許一個元素在給定的實例中可以有多個可能值.實質上說,解碼器將嘗試所有期望的解碼算法,直到有一個類型符合爲止.當一個複雜的容器中包含其他容器時,時候選擇器就十分有用了.例如:
UserKey::= SEQUENCE {
Name IA5String,
StartDate UTCTIME,
Expire UTCTIME,
KeyData CHOICE {
ECCKey ECCKeyType,
RSAKey RSAKeyType
}
}
上例簡單的允許ECC也允許RSA密鑰的公鑰證書.
3. ASN.1數據類型
任何ASN.1編碼都是以兩個字節開始(或者八位位組,含有8個二進制位),不管什麼類型,它們都是通用的.第一個字節是類型標識符,也包含一些修正位;第二各字節是長度.基本類型如下:
.布爾型(Boolean);
.八位位組串 (OCTETString);
.位串 (BITString);
.IA5String;
.可打印字符串(PrintableString);
.整數 (INTEGER);
.對象標識符 (OBJECTIdentifier, OID);
.世界協調時(UTCTIME);
.空 (NULL);
.序列,單一序列;
.集合;
.單一集合;
ASN.1布爾類型
布爾編碼的負載或者是全0或者是全1的八位位組。頭字節以0x01開始,長度編碼字節爲0x01,負載內容取決於布爾值的取值。
布爾值 |
編碼 |
False |
0x01 01 00 |
True |
0x01 01 FF |
ASN.1整數類型
整數類型表示一個有符號的任意精度的標量,它的編碼是可移植,平臺無關的。
正整數的編碼比較簡單。每個字節表示的最大整數是255 (0xFF), 存儲的實際數值分成字節大小的數字,並且以big-endian格式存儲。
八位位組{Xk,Xk-1,...., X0}將以遞減的順序從Xk到X0進行存儲.編碼規定正整數的第一個字節的最高位必須是0,即Xk的最高爲必須是0,爲1的話則爲負數.例如: x = 49468= 193 * 256 + 60 = 0xC1 * 0x FF + 0x3C; 即X1=0xC1, X0= 0x3C. 按正常規定,編碼應該是 0x02 02 C1 3C, 但是X1的最高位是1, 應該被看成負數.最簡單的方法是用前端零字節進行填充.編碼變爲 0x02 02 00 C1 3C.
負整數的編碼有些複雜.要先找到一個最小的256的冪,使它比要編碼的負數的絕對值還要大.例如:x = - 1555; 被1555大的256的最小的冪是256^2 = 65536; 然後將這個數跟負數相加以得到2的補碼. 65536 + (-1555) = 63981 = 0xF9 * 0xFF + 0x ED. 則編碼爲 0x02 02F9 ED.
以下是一些常用整數編碼的例子.
值 |
編碼 |
0 |
0x02 01 00 |
1 |
0x02 01 01 |
2 |
0x02 01 02 |
127 |
0x02 01 7F |
128 |
0x02 02 00 80 |
-1 |
0x02 01 FF |
-128 |
0x02 01 80 |
-32768 |
0x02 02 80 00 |
1234567890 |
0x02 04 49 96 02 D2 |
ANS.1位串類型
位串(BITSTRING)類型以可移植形式表示位數組.除了ASN.1頭部兩個字節之外,還有一個附加的頭部用來表示填充數據(通常是一個字節,因爲填充是爲了形成一個完整的字節).編碼規則:位串的第一位放到第一個負載字節的第8位;位串的第二位放到第一個負載字節的第7位; 依此類推.填充滿第一個負載字節,就繼續填充第二個負載字節.如果最後一個負載字節未被填充滿,空的位用0來填充, 0的個數存放到頭部用來表示填充數據的那個字節裏.
下面舉例說明:
有一個位串{1,0,0,0,1,1,1,0,1,0,0,1},開始填充負載字節.第一個字節填充後爲10001110= 0x 8E; 第二個字節填充後爲10010000 = 0x90, 低位4個0爲填充的空位.則,負載爲2個字節加上表示填充0個數的一個字節0x04總共3個字節.則完整的編碼爲:0x03 03 04 8E 90.
解碼器通過計算8 * 負載長度 - 填充數來得到存儲輸出所需要的位數.
ASN.1八位位組串類型
八位位組串(OCTET STRING)是保存字節數組,它和位串類型(BIT STRING)很相似.這種編碼非常簡單,像其他類型一樣對頭部進行編碼,然後直接將八位位組複製過去即可.例如:對{FE, ED, 6A, B4}編碼;首先存儲類型0x04, 接着是長度0x04,然後是字節本身0xFE ED 6A B4; 完整的編碼爲 0x04 04 FE ED 6A B4.
空類型
空(NULL)類型實際上是"佔位符", 它是含有空白選項的選擇修改器所特有.例如:
MyAccount ::= SEQUENCE {
Name IA5String,
Group IA5String,
Credentials CHOICE{
rsaKey RSAPublicKey,
passwdHash OCTET STRING,
none NULL
}
}
在上面這個結構中,帳號的證書應該包含一個RSA密鑰或一個密碼散列值或什麼都沒有.
空類型的編碼是 0x05 00.
ASN.1 對象標識符類型
對象標識符(OBJECTIDENTIFIER, OID)類型用層次的形式來表示標準規範.標識符樹通過一個點分的十進制符號來定義,這個符號以組織,子部分然後是標準的類型和各自的子標識符開始.
例如:MD5的OID 是1.2.840.113549.2.5 表示爲"iso(1) member-body (2) US (840) rsadsi(113549) digestAlgorithm(2) md5 (5)", 所以當解碼程序看到這個OID時,就知道是MD5散列.
OID在公鑰算法標準中很流行,它指出證書綁定了哪種散列算法. 同樣,也有公鑰算法,分組算法,和操作模式的OID. 它們是一種高效且可移植的表示數據包中所選算法的形式.
對OID的編碼規則:
前兩部分如果定義爲x.y, 那麼它們將合成一個字40*x + y, 其餘部分單獨作爲一個字節進行編碼.
每個字首先被分割爲最少數量的沒有頭零數字的7位數字.這些數字以big-endian格式進行組織,並且一個接一個地組合成字節. 除了編碼的最後一個字節外,其他所有字節的最高位(位8)都爲1.
舉例: 30331 = 1* 128^2 + 108 * 128 + 123 分割成7位數字(0x80)後爲{1,108,123}設置最高位後變成{129,236,123}.如果該字只有一個7位數字,那麼最高爲0.
MD5 OID的編碼:
1. 將1.2.840.113549.2.5轉換成字數組 {42, 840, 113549, 2, 5}.
2. 然後將每個字分割爲帶有最高位的7位數字,{{0x2A},{0x86,0x48},{0x86,0xF7,0x0D},{0x02},{0x05}}.
3. 最後完整的編碼爲 0x06 08 2A 86 48 86 F7 0D 02 05.
ASN.1序列和集合類型
序列(SEQUENCE)和單一序列(SEQUENCE OF)以及相應的集合(SET)和單一集合(SET OF)類型叫做"結構"類型或簡單容器.它們是一種用來把相關數據元素收集爲一個獨立的可解碼元素的簡單方法.
序列編碼有以下性質:
1. 編碼是結構化的.即頭字節的位6必須設置.
2. 編碼的內容是由ASN.1序列類型定義列表中的所有數據類型值的完全編碼所組成,並且按照它們出現的順序進行編碼,除非這些類型被可選(OPTIONAL)或默認(DEFAULT)關鍵字所引用.
例:考慮如下序列
User ::== SEQUENCE{
ID INTEGER,
Active BOOLEAN
}
當取值爲{32,TRUE}時,編碼爲 0x 3006 02 01 20 01 01 FF} 在ASN.1文檔裏,使用空格來表示編碼的屬性.
0x30 06
02 01 20
01 01 FF
ASN.1可打印字符串和IA5String類型
可打印字符串(PrintableString)和IA5String類型定義了一種獨立於本地代碼頁和字符集定義,在任何平臺上都可以將ASCII字符串編碼爲可讀字符串的可移植方法.
可打印字符串對象是ASCII集合的一個有限子集,這個子集包括32,39,40~41,43~58,61,63以及65~122.
IA5String類型的編碼對象是ASCII集合中的大多數.包括NULL,BEL,TAB,NL,LF,CR以及32~126.
可打印字符串和IA5String的編碼和八位位組串相似.可打印字符串的頭字節是0x13, IA5String的是0x16. 例如:"Hello World"的編碼爲0x13 0B 48 65 6D6D 6F 20 57 6F 72 6D 64.
ASN.1世界協調時類型
世界協調時(UTCTIME)定義了一種相對GMT時間的標準時間(以日期)編碼.它使用"YYMMDDHHMMSSZ"的格式分別表示年,月,日,時,分,秒. 其中"Z"是遺留自初始的UTCTIME.如果沒有"Z",就允許兩種附加組"[+/-]hh 'mm'",其中"hh"和"mm"分別爲與GMT的時差和分差. 如果有"Z",則時間是以Zulu或GMT時間表示.
字符串的編碼按照IA5String編碼規則進行轉換(ASCII字符集),其頭字節爲0x17而不是0x16. 例如:
July 4,2003 at 11:33 and 28 seconds編碼爲"030704113328Z",再編碼0x17 0D 30 33 30 37 30 34 31 31 33 33 32 38 5A.