關係數據庫的規範化
文章分類:數據庫
一、函數依賴
在數據庫中,函數依賴是最基本、最重要的一種依賴。
在數據庫中,屬性值之間會發生聯繫,這類聯繫稱爲函數依賴。
設有屬性集U上的關係模式R(U),X,Y是U的子集,若對於任一個關係R中的任一元組在X中的屬性值確定後,則在Y中的屬性值必確定,則稱Y依賴於X。
二、範式和規範化方法。
1 第一範式(1NF)
在任何一個關係數據庫中,第一範式(1NF)是對關係模式的基本要求,不滿足第一範式(1NF)的數據庫就不是關係數據庫。 這體現了數據庫的原子性;是不可再分的
。
所
謂第一範式(1NF)是指數據庫表的每一列都是不可分割的基本數據項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。如果
出現重複的屬性,就可能需要定義一個新的實體,在第一範式(1NF)中表的每一行只包含一個實例的信息。例如,在學校的學生信息表中,每一行只表示一個學
生的信息,一個學生的信息在表中只出現一次。簡而言之,第一範式就是無重複的列。
2 第二範式(2NF) 完全依賴於主鍵。
第
二範式(2NF)是在第一範式(1NF)的基礎上建立起來的,即滿足第二範式(2NF)必須先滿足第一範式(1NF)。第二範式(2NF)要求數據庫表中
的每個實例或行必須可以被惟一地區分。爲實現區分通常需要爲表加上一個列,以存儲各個實例的惟一標識。如圖3-2
員工信息表中加上了員工編號(emp_id)列,因爲每個員工的員工編號是惟一的,因此每個員工可以被惟一區分。這個惟一屬性列被稱爲主關鍵字或主鍵、主
碼。
第二範式(2NF)要求每個非主屬性完全依賴於主關鍵字。
所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間 是一對多的關係。爲實現區分通常需要爲表加上一個列,以存儲各個實例的惟一標識。簡而言之,第二範式就是非主屬性部分必須完全依賴於主關鍵字。
例如,把所有這些信息放到一個表中(學號,課程,學生姓名、年齡、性別、、課程學分、系別、學科成績)下面存在如下的依賴關係。
關鍵字是:學號和課程
(學號)→ (姓名, 年齡,性別,系別)
(課程) → (學分)
(學號,課程)→ (學科成績)
其屬性之間的依賴關係如圖所示:
在圖中 ,雖然姓名, 年齡,性別,系別,成績都依賴於學號,學分依賴於課程,但是他們都不是完全依賴於學號和課程,所以不是第二範式。
滿足第二範式可以分解爲三個模型。
如圖: 圖1
:
圖2:
圖3 :
如上: 圖1 圖2 圖三 都滿足第二範式。
3 第三範式(3NF)
滿足第三範式(3NF)必須先滿足第二範式(2NF)。簡而言之,第三範式(3NF)要求一個數據庫表中不包含已在其它表中已包含的非主關鍵字信息。例
如,存在一個部門信息表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等信息。那麼在圖3-2的員工信息表中列出部門編號後就不能再將
部門名稱、部門簡介等與部門有關的信息再加入員工信息表中。如果不存在部門信息表,則根據第三範式(3NF)也應該構建它,否則就會有大量的數據冗餘。簡
而言之,第三範式就是屬性不依賴於其它非主屬性。