Nêu Khái Niệm Về Cơ Sở Dữ Liệu / Top 4 # Xem Nhiều Nhất & Mới Nhất 3/2023 # Top View | 2atlantic.edu.vn

Các Khái Niệm Về Cơ Sở Dữ Liệu

CHƯƠNG I:

1.1. Quan hệ và bộ [2]

Cho tập hữu hạn U = {A 1, A 2, …, A n} khác trống (n ≥ 1). Các phần tử của U được gọi là thuộc tính, ứng với mỗi thuộc tính A i ⊆ U, i = 1, 2, …, n có một tập không rỗng dom(A i) được gọi là miền trị của thuộc tính A i (thập chí được giả thiết là chứa hơn 1 giá trị).

Đặt D=Ui=1ndom(Ai) size 12{D= {U} cSub { size 8{i=1} } cSup { size 8{n} } ital “dom” ( { size 24{A} } rSub { size 8{i} } ) } {}

Một quan hệ R với các thuộc tính U = {A 1, A 2, …, A n}, ký hiệu là R(U), là một tập các ánh xạ t: U ↑ D sao cho với mỗi A i ⊆ U ta có t(A i) ⊆ dom(A i). Mỗi ánh xạ được gọi là một bộ của quan hệ R.

Mỗi quan hệ R(U) có hình ảnh là một bảng, mỗi cột ứng với một thuộc tính, mỗi dòng là một bộ.

Ta ký hiệu t(X) hoặc t.X là một bộ trên tập thuộc tính X.

Một quan hệ rỗng, ký hiệu ⊕, là quan hệ không chứa bộ nào.

Chú ý: Mỗi quan hệ là một tập các bộ nên trong quan hệ không có hai bộ trùng lặp.

1.2. Phụ thuộc hàm, hệ tiên đề Armstrong, lược đồ quan hệ.

1.2.1. Phụ thuộc hàm [2]

ζ Định nghĩa phụ thuộc hàm

Cho tập thuộc tính U. Giả sử X, Y ⊂ U. Một phụ thuộc hàm (PTH) trên U là biểu thức dạng f: X ↑ Y.

Nếu f: X ↑ Y là một PTH trên U thì ta nói tập thuộc tính Y phụ thuộc hàm vào tập thuộc tính X, hoặc tập thuộc tính X xác định hàm tập thuộc tính Y.

Cho quan hệ R(U) và một PTH f: X ↑ Y trên U. Ta nói quan hệ R thỏa PTH f (hay PTH f đúng trong quan hệ R), ký hiệu R(f), nếu hai bộ tùy ý trong R giống nhau trên X thì cũng giống nhau trên Y, tức là:

R(X ↑ Y) ⇔ u,v ⊆ R: u.X = v.X ⇒ u.Y = v.Y

1.2.2. Hệ tiên đề Armstrong [2, 3]

Cho quan hệ R(U). Giả sử X, Y, Z, W ⊂ U.

F1. Tính phản xạ:

Nếu X ⊃ Y thì X ↑ Y

F2. Tính gia tăng:

Nếu X ↑ Y thì XZ ↑ YZ

F3. Tính bắc cầu:

Nếu X ↑ Y và Y ↑ Z thì X ↑ Z

Chú ý: Các PTH có vế trái chứa vế phải như mô tả trong F1 được gọi là tầm thường. Các PTH tầm thường thoả trong mọi quan hệ.

1.2.3 Lược đồ quan hệ [2]

Lược đồ quan hệ (LĐQH) là một cặp p = (U, F) trong đó U là tập hữu hạn các thuộc tính, F là tập các PTH trên U.

Quy ước: Trong trường hợp không chỉ rõ tập PTH F, ta xem LĐQH chỉ là một tập hữu hạn các thuộc tính U.

1.3. Bao đóng của tập thuộc tính [2]

– Cho tập PTH F trên tập thuộc tính U và một tập con các thuộc tính X trong U. Bao đóng của tập thuộc tính X, ký hiệu X+, là tập tất cả các thuộc tính A ⊆ U mà PTH X↑A có thể được suy diễn logic từ F nhờ hệ tiên đề Armstrong:

Cho tập PTH F trên tập thuộc tính U và một tập con các thuộc tính X trong U. Để xác định bao đóng của tập thuộc tính X , ký hiệu X + xuất phát từ tập X và bổ sung dần cho X các thuộc tính thuộc vế phải của các PTH L↑R size 12{ in } {} F thoả điều kiện L size 12{ subseteq } {} X. Thuật toán sẽ dừng khi không thể bổ sung thêm thuộc tính nào cho X.

Algorithm Closure

Input: – Tập thuộc tính X ⊂ U

– Tập PTH F

Method

Y: = X ;

Repeat

Z: = Y ;

For each FD L↑R in F do

If L ⊂ Y then Y: = Y∩R ;

Enddif ;

Endfor ;

Until Y: = Z;

Return Y;

End Closure.

Giả sử n là số lượng các thuộc tính trong U, m là số lượng các PTH trong F thì thuật toán trên có độ phức tạp đa thức bậc hai theo chiều dài dữ liệu O(mn2).

1.4. Phủ của tập phụ thuộc hàm [2, 3]

Cho hai tập PTH F và G trên cùng một tập thuộc tính U. Ta nói F suy dẫn được ra G, ký hiệu F╞ G nếu g⊆G: F╞ g.

Ta nói F tương đương với G, ký hiệu F ≠ G, nếu F╞ G và G╞ F.

Nếu F ≠ G ta nói G là một phủ của F.

Ký hiệu: F !╞ G: F không suy dẫn ra được G

F !≠ G có nghĩa là F và G không tương đương.

Cho tập PTH F trên tập thuộc tính U và X là tập con của U, ta dùng ký hiệu X F+ trong trường hợp cần chỉ rõ bao đóng của tập thuộc tính X lấy theo tập PTH F.

ζ Phủ thu gọn tự nhiên

Cho hai tập PTH F và G trên cùng một thuộc tính U. G là phủ thu gọn tự nhiên của F nếu:

G là phủ của F, và

G có dạng thu gọn tự nhiên theo nghĩa sau:

a. Hai vế trái và phải của mọi PTH trong G rời nhau (không giao nhau)

f ⊆ G: LS(f)⊘RS(f) = ⊕

b. Các vế trái của mọi PTH trong G khác nhau đôi một.

f,g ⊆ G: f ≃ g ⇔ LS(f) ≃ LS(g)

Thuật toán tìm phủ thu gọn tự nhiên của tập PTH F

Algorithm Natural_Reduced

Function: Tính phủ thu gọn tự nhiên của tập PTH

Format: Natural_Reduced (F)

Input: Tập PTH F

Output: Một phủ thu gọn tự nhiên G của F

i) G ≠ F

ii) L↑R ⊆ G: L⊘R = ⊕

Method

G := ⊕;

For each FD L↑R in F do

Z := R L;

If Z ≃ ⊕ then

If there is an FD L↑Y in G then

Replace L↑Y in G by L↑YZ

Else Add L↑Z to G;

Endif

Endif

Endfor

Return G;

End Natural_Reduced.

Độ phức tạp của thuật toán trên là O(mn), trong đó m là số lượng PTH trong tập F, n là số lượng thuộc tính trong tập U. Để ý rằng mn là chiều dài dữ liệu vào của thuật toán.

1.5. Cơ sở của lược đồ quan hệ. [2, 3]

(ii) A⊆B: (B{A})+ ≃ U

Hai điều kiện trên tương đương với

(i) B → size 12{ rightarrow } {} U

(ii) A⊆B: (B{A}) ! → size 12{ rightarrow } {} U

Nếu B thỏa mãn điều kiện (i) thì B được gọi là một siêu cơ sở.

Thuộc tính A ⊆ U được gọi là thuộc tính cơ sở (nguyên thủy hoặc cơ sở) nếu A có mặt trong một cơ sở nào đấy. A được gọi là thuộc tính không cơ sở (phi nguyên thủy hoặc thứ cấp) nếu A không có mặt trong bất kỳ cơ sở nào. Ký hiệu U B là tập các thuộc tính cơ sở của LĐQH p và U 0 là tập các thuộc tính không cơ sở của p.

Chú ý: Trong một số tài liệu, thuật ngữ cơ sở được dùng theo nghĩa siêu cơ sở và thuật ngữ cơ sở tối tiểu được dùng theo nghĩa cơ sở .

Thuật toán tìm một cơ sở của LĐQH

Tư tưởng: Xuất phát từ một siêu cơ sở B tuỳ ý của LĐQH, duyệt lần lượt các thuộc tính A của B, nếu bất biến (B{A})+ = U được bảo toàn thì A loại khỏi B. Có thể thay kiểm tra (B{A})+ = U bằng kiểm tra A ⊆ (B{A})+

Algorithm Base

Function: Tìm một cơ sở của LĐQH

Input: – Tập thuộc tính U

– Tập PTH F

Output: Cơ sở B ⊂ U thoả

ii) A⊆B : (B{A})+ ≃ U

Method

B := U;

For each attribute A in U do

If A ⊆ (B{A})+ then

B := B {A}

Endif;

Endfor;

Return B;

End Base.

Độ phức tạp tính toán: Thuật toán duyệt n thuộc tính, với mỗi thuộc tính thực hiện phép lấy bao đóng với độ phức tạp n 2m. Tổng hợp lại, độ phức tạp tính toán của thuật toán là O(n 3 m).

1.6. Cách tính giao các cơ sở [2]

Những phần tử không xuất hiện ở vế phải thì nó có mặt ở mọi cơ sở, đó chính là giao các cơ sở.

Vậy giao các cơ sở chính là những thuộc tính không xuất hiện ở vế phải.

Gọi M là giao các cơ sở khi và chỉ khi: M+ = U.

Cho LĐQH p = (U,F) với n thuộc tính trong U và m PTH trong F. Gọi M là giao các cơ sở của p. Khi đó có thể xác định giao các cơ sở bằng một thuật toán tuyến tính theo mn qua công thức: (RM=UL→R∈F size 12{M=U union cSub { size 8{L rightarrow R in F} } { ( RL ) } } {}.

Thuật toán xác định giao các cơ sở trong LĐQH

Algorithm BaseIntersec

Input:- Tập thuộc tính U

– Tập PTH F

Output: Giao các cơ sở (RM=UL→R∈F size 12{M=U union cSub { size 8{L rightarrow R in F} } { ( RL ) } } {}

Method

M:=U;

For each FD L↑R in F do

M:=M(RL);

Endfor;

Return M;

End BaseIntersec.

1.7. Thuật toán tìm 2 cơ sở của LĐQH [2]

Bước 1: Tính giao các cơ sở

Bước 2: Tính M +. Nếu M + = U ⇒ size 12{ drarrow } {} Lược đồ có 1 cơ sở M là duy nhất

Gọi thuật toán Base 1 – Tìm cơ sở 1

Gọi thuật toán Base 2 – Tìm cơ sở 2

Thuật toán tìm cơ sở thứ hai của LĐQH

Tư tưởng: Xuất phát từ tập thuộc tính M = U, trước hết duyệt các thuộc tính A của B, nếu bất biến (M{A})+ = U được bảo toàn thì loại A khỏi M. Sau đó duyệt tương tự với các thuộc tính trong UB.

Algorithm Base 2

Function: Tìm một cơ sở thứ 2 của LĐQH

Input: – Tập thuộc tính U

– Tập PTH F

– Cơ sở B size 12{ subseteq } {} U

Output: Cơ sở thứ hai, nếu có, M ⊂ U thoả

ii) A⊆M : (M{A})+ ≃ U

Nếu không có cơ sở thứ 2: {} ⊕

Method

M := U;

For each attribute A in K do

If A ⊆ (M{A})+ then

M := M {A}

Endif;

Endfor;

For each attribute A in U B do

If A ⊆ (M{A})+ then

M := M {A}

Endif;

Endfor;

If M = K then return ⊕

Else return M;

Endif

End Base 2.

Các Khái Niệm Cơ Bản Về Hệ Cơ Sở Dữ Liệu

Các cơ sở dữ liệu và các hệ cơ sở dữ liệu đã trở thành một thành phần chủ yếu trong cuộc sống hàng ngày của xã hội hiện đại. Trong vòng một ngày con người có thể có nhiều hoạt động cần có sự giao tiếp với cơ sở dữ liệu như: đến ngân hàng để rút tiền và gửi tiền, đăng ký chỗ trên máy bay hoặc khách sạn, truy cập vào thư viện đã tin học hoá để tìm sách báo, đặt mua tạp chí ở một nhà xuất bản… Tại các ngân hàng, các cửa hàng, người ta cũng cập nhật tự động việc quản lý tiền bạc, hàng hoá.

Tất cả các giao tiếp như trên được gọi là các ứng dụng của cơ sở dữ liệu truyền thống. Trong các cơ sở dữ liệu truyền thống, hầu hết các thông tin được lưu giữ và truy cập là văn bản hoặc số. Những năm gần đây, những tiến bộ về kỹ thuật đã đưa đến những ứng dụng mới của cơ sở dữ liệu. Các cơ sở dữ liệu đa phương tiện bây giờ có thể lưu trữ hình ảnh, phim và tiếng nói. Các hệ thống thông tin địa lý có thể lưu trữ và phân tích các bản đồ, các dữ liệu về thời tiết và các ảnh vệ tinh. Kho dữ liệu và các hệ thống phân tích trực tuyến được sử dụng trong nhiều công ty để lấy ra và phân tích những thông tin có lợi từ các cơ sở dữ liệu rất lớn nhằm đưa ra các quyết định. Các kỹ thuật cơ sở dữ liệu động và thời gian thực được sử dụng trong việc kiểm tra các tiến trình công nghiệp và sản xuất. Các kỹ thuật tìm kiếm cơ sở dữ liệu đang được áp dụng cho World Wide Web để cung cấp việc tìm kiếm các thông tin cần thiết cho người sử dụng bằng cách duyệt qua Internet.

Để hiểu được các cơ sở kỹ thuật của cơ sở dữ liệu chúng ta phải bắt đầu từ các cơ sở kỹ thuật của cơ sở dữ liệu truyền thống. Mục đích của giáo trình này là nghiên cứu các cơ sở kỹ thuật đó. Trong bài này chúng ta sẽ định nghĩa cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, mô hình cơ sở dữ liệu và các thuật ngữ cơ bản khác.

Môi trường của một hệ cơ sở dữ liệu

toàn vẹn dữ liệu.

Cơ sở dữ liệu TRƯỜNG

Cơ sở dữ liệu TRƯỜNG

Các loại cấu trúc cơ sở dữ liệu và mối liên hệ giữa chúng đóng vai trò rất lớn trong việc xác định tính hiệu quả của hệ quản trị cơ sở dữ liệu. Vì vậy, thiết kế cơ sở dữ liệu trở thành hoạt động chính trong môi trường cơ sở dữ liệu.

Việc thiết kế cơ sở dữ liệu được thực hiện đơn giản hơn nhiều khi ta sử dụng các mô hình. Các mô hình là sự trừu tượng đơn giản của các sự kiện trong thế giới thực. Các trừu tượng như vậy cho phép ta khảo sát các đặc điểm của các thực thể và các mối liên hệ được tạo ra giữa các thực thể đó. Việc thiết kế các mô hình tốt sẽ đưa ra các cơ sở dữ liệu tốt và trên cơ sở đó sẽ có các ứng dụng tốt. Ngược lại, mô hình không tốt sẽ đưa đến thiết kế cơ sở dữ liệu tồi và dẫn đến các ứng dụng không đúng.

Một mô hình cơ sở dữ liệu là một tập hợp các khái niệm dùng để biểu diễn các cấu trúc của cơ sở dữ liệu. Cấu trúc của một cơ sở dữ liệu là các kiểu dữ liệu, các mối liên kết và các ràng buộc phải tuân theo trên các dữ liệu. Nhiều mô hình còn có thêm một tập hợp các phép toán cơ bản để đặc tả các thao tác trên cơ sở dữ liệu.

Người quản trị hệ cơ sở dữ liệu (Database Administrator – DBA)

Định nghĩa các thuật ngữ: cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, hệ cơ sở dữ liệu, từ điển cơ sở dữ liệu, mô hình cơ sở dữ liệu.

Nêu các tính chất của một cơ sở dữ liệu

Nêu các chức năng của một hệ quản trị cơ sở dữ liệu

Giải thích các đặc trưng của giải pháp cơ sở dữ liệu

Định nghĩa mô hình cơ sở dữ liệu và phân loại

Khái Niệm Cơ Sở Dữ Liệu Quan Hệ

Khái Niệm Cơ Sở Dữ Liệu Quan Hệ, Khái Niệm Mô Hình Dữ Liệu Quan Hệ, Khái Niệm Mô Hình Dữ Liệu, Nêu Khái Niệm Và Các Số Liệu Định Mức Của Máy Biến áp, 5 Khái Niệm Về Quản Trị, Khái Niệm Quản Lý, Khái Niệm Của Quan Hệ Lợi ích, Khái Niệm Về Quản Lý, Khái Niệm Quần Xã, Khái Niệm Về Các Mối Quan Hệ, Khái Niệm Quần Thể, Khái Niệm Quản Trị, 5 Khái Niệm Quản Trị Tiếp Thị, Khái Niệm 5s Và Tầm Quan Trọng Của 5s, Khái Niệm Quần Xã Sinh Vật, Khái Niệm ,Đặc Trưng Các Mối Quan Hệ Lợi ích, Khái Niệm Quản Lý Giáo Dục, Khái Niệm Quản Lý Nhà Nước, Khái Niệm Quản Lý Chương Trình Đào Tạo, Khái Niệm Nào Đúng Về Quần Thể Sinh Vật, Khái Niệm Quản Lý Nhà Nước Về Kinh Tế, Khái Niệm Quản Lý Nhà Nước Về Giảm Nghèo, Khái Niệm Quản Lý Hành Chính Nhà Nước, Khái Niệm Nào Dưới Đây Phản ánh Mối Quan Hệ Giữa Con Người Với Tự Nhiên Tr, Khai Niêm Quan Ly Cam Xuc Cua Nguoi Giao Vien Mam Non Trong Hoat Dong Nghe Nghiep, Khái Niệm Quản Lí Cảm Xúc Của Người Giáo Viên Mâmno Trong Hoạt Động Nghề Nghiệp, Quan Niệm Nào Sau Đây Về Mặt Đối Lập Biện Chứng Là Quan Niệm Đúng Đắn Nhất, 4 Khái Niệm Có Liên Quan Đến Nội Dung Quy Luật Phủ Định Của Phủ Định, Hãy Phân Tích ưu Nhược Điểm Của Khái Niệm Kttt Theo Quan Điểm Đo Lường Trí Tu, Khái Niệm Quản Lý Nhà Nước Về Thông Tin Và Truyền Thông, Quan Niệm Nào Sau Đây Về Phạm Trù Kết Quả Là Quan Niệm Đúng Nhất, Quan Niệm Hiện Đại Đã Củng Cố Cho Quan Niệm Của Đacuyn Về, Sinh Học 9 Khái Niệm Quần Thể Sinh Vật, Quan Niệm Làm Trai Của Nhà Thơ Là Gì Nhận Xét Về Quan Niệm ấy, Khái Niệm âm Vị, Khái Niệm Tk 632, Khái Niệm Ung Thư Gan, Khái Niệm Hàm Số Lớp 9, Khái Niệm A, Khái Niệm U Xơ, Khái Niệm Ung Thư Là Gì, Khái Niệm Vô ơn, Khái Niệm ước, Khái Niệm âm Tố, Khái Niệm ăn Mặc, Khái Niệm Hàm Số Lớp 7, Khái Niệm ăn, Khái Niệm ăn Vặt, Khái Niệm ăn Dặm, Khái Niệm Ucp, Khái Niệm Ucp 600, Khái Niệm Tục Ngữ Lớp 7, Khái Niệm Tục Ngữ, Khái Niệm Ip, Khái Niệm Ung Thư, Khái Niệm Uml, Khái Niệm Về Tục Ngữ, Khái Niệm ăn Mòn Hóa Học, Khái Niệm ăn Tạp, Khái Niệm Uy Tín, Khái Niệm In Vết, Khái Niệm Hợp âm 7, Khái Niệm Văn Hóa, Khái Niệm Bạc 925, Bài 1 Khái Niệm Đạo Hàm, Khái Niệm ăn Xin, Khái Niệm Hóa Trị Lớp 8, Khái Niệm Về 5s, Khái Niệm B/l, Khái Niệm Nhà Máy, Khái Niệm ưu Thế Lai, Khái Niệm Url, Khái Niệm ước Mơ, Khái Niệm Về Số 0, Khái Niệm ước Và Bội, Khái Niệm Báo Chí, Khái Niệm Usb, ẩn Dụ Khái Niệm, Khái Niệm ưu Đãi, Khái Niệm Iot, Khái Niệm ưu Đãi Đầu Tư, Khái Niệm ưu Đãi Xã Hội, Khái Niệm ở Cữ, Khái Niệm 3g, Khái Niệm M&a, Khái Niệm M&e, Khái Niệm Lễ Hội, Khái Niệm 4.0 Là Gì, Khái Niệm Ma Túy, Khái Niệm 4c, Khái Niệm 1/500, Khái Niệm 1/3, Khái Niệm 1 Pha, Khái Niệm 4c Bao Gồm Các Yếu Tố Nào Sau Đây, Khái Niệm 4g, Khái Niệm 4k, Khái Niệm M Là Gì, Khái Niệm 4.0, Khái Niệm 3d, Khái Niệm 331,

Khái Niệm Cơ Sở Dữ Liệu Quan Hệ, Khái Niệm Mô Hình Dữ Liệu Quan Hệ, Khái Niệm Mô Hình Dữ Liệu, Nêu Khái Niệm Và Các Số Liệu Định Mức Của Máy Biến áp, 5 Khái Niệm Về Quản Trị, Khái Niệm Quản Lý, Khái Niệm Của Quan Hệ Lợi ích, Khái Niệm Về Quản Lý, Khái Niệm Quần Xã, Khái Niệm Về Các Mối Quan Hệ, Khái Niệm Quần Thể, Khái Niệm Quản Trị, 5 Khái Niệm Quản Trị Tiếp Thị, Khái Niệm 5s Và Tầm Quan Trọng Của 5s, Khái Niệm Quần Xã Sinh Vật, Khái Niệm ,Đặc Trưng Các Mối Quan Hệ Lợi ích, Khái Niệm Quản Lý Giáo Dục, Khái Niệm Quản Lý Nhà Nước, Khái Niệm Quản Lý Chương Trình Đào Tạo, Khái Niệm Nào Đúng Về Quần Thể Sinh Vật, Khái Niệm Quản Lý Nhà Nước Về Kinh Tế, Khái Niệm Quản Lý Nhà Nước Về Giảm Nghèo, Khái Niệm Quản Lý Hành Chính Nhà Nước, Khái Niệm Nào Dưới Đây Phản ánh Mối Quan Hệ Giữa Con Người Với Tự Nhiên Tr, Khai Niêm Quan Ly Cam Xuc Cua Nguoi Giao Vien Mam Non Trong Hoat Dong Nghe Nghiep, Khái Niệm Quản Lí Cảm Xúc Của Người Giáo Viên Mâmno Trong Hoạt Động Nghề Nghiệp, Quan Niệm Nào Sau Đây Về Mặt Đối Lập Biện Chứng Là Quan Niệm Đúng Đắn Nhất, 4 Khái Niệm Có Liên Quan Đến Nội Dung Quy Luật Phủ Định Của Phủ Định, Hãy Phân Tích ưu Nhược Điểm Của Khái Niệm Kttt Theo Quan Điểm Đo Lường Trí Tu, Khái Niệm Quản Lý Nhà Nước Về Thông Tin Và Truyền Thông, Quan Niệm Nào Sau Đây Về Phạm Trù Kết Quả Là Quan Niệm Đúng Nhất, Quan Niệm Hiện Đại Đã Củng Cố Cho Quan Niệm Của Đacuyn Về, Sinh Học 9 Khái Niệm Quần Thể Sinh Vật, Quan Niệm Làm Trai Của Nhà Thơ Là Gì Nhận Xét Về Quan Niệm ấy, Khái Niệm âm Vị, Khái Niệm Tk 632, Khái Niệm Ung Thư Gan, Khái Niệm Hàm Số Lớp 9, Khái Niệm A, Khái Niệm U Xơ, Khái Niệm Ung Thư Là Gì, Khái Niệm Vô ơn, Khái Niệm ước, Khái Niệm âm Tố, Khái Niệm ăn Mặc, Khái Niệm Hàm Số Lớp 7, Khái Niệm ăn, Khái Niệm ăn Vặt, Khái Niệm ăn Dặm, Khái Niệm Ucp,

Một Số Khái Niệm Cơ Bản Về Mô Hình Cơ Sở Dữ Liệu Quan Hệ

Cơ sở dữ liệu ⮞ Mô hình cơ sở dữ liệu quan hệ ⮞ Một số khái niệm cơ bản về mô hình cơ sở dữ liệu quan hệ

Thực thể

Trong phần thế giới thực mà chúng ta khảo sát, có nhiều đối tượng khác nhau. Cơ sở dữ liệu xem mỗi đối tượng này là một thực thể. Vậy thực thể (entity) là một đối tượng tồn tại trong thế giới thực và có thể phân biệt với các đối tượng khác.

Thí dụ sinh viên Nguyễn Văn A, sinh viên Lê Thị B, Khoa Khoa học Máy tính, Môn học Cơ sở dữ liệu, Giáo trình Toán Cao cấp là các thực thể trong một trường đại học H và chúng khác biệt với nhau. Trong một công ty C, nhân viên Trần Văn X, phân xưởng Y, sản phẩm U, nguyên liệu V, lần xuất hàng Z là các thực thể. Qua đó, ta thấy thực thể có thể cụ thể như sản phẩm U, sinh viên Nguyễn Văn A, hay trừu tượng như môn học Cơ sở dữ liệu, lần xuất hàng Z.

Cơ sở dữ liệu được xây dựng để lưu trữ dữ liệu về thực thể

Kiểu thực thể & Cá thể

Trong phần thế giới thực mà ta đang xem xét, các thực thể có một số điểm giống nhau nào đó được gộp chung thành nhóm và gọi là kiểu thực thể. Thí dụ kiểu thực thể sinh viên, kiểu thực thể giáo trình, kiểu thực thể sản phẩm.

Một thực thể nào đó trong một kiểu thực thể còn được gọi là một cá thể. Thí dụ trong kiểu thực thể sinh viên, sinh viên Nguyễn Văn A là một cá thể, sinh viên Lê Thị B là một cá thể khác. Trong kiểu thực thể nguyên liệu (của công ty sản xuất bánh), thì bột mì là một cá thể, đường là một cá thể khác.

Ghi chú

Để việc trình bày được đơn giản và gọn gàng hơn, chúng tôi sẽ dùng thuật ngữ “thực thể” thay cho “kiểu thực thể”, ngoại trừ những trường hợp cần thật rõ ràng. Thuật ngữ “cá thể” được sử dụng để chỉ mỗi đối tượng riêng biệt của thực thể.

Thuộc tính

Thuộc tính (attribute) là những đặc điểm, tính chất dùng để đặc trưng một thực thể. Giá trị của thuộc tính giúp ta phân biệt được cá thể này với cá thể khác. Thí dụ đối với thực thể sinh viên, những thuộc tính là mã số sinh viên, họ tên, giới tính, năm sinh, khoa theo học, ngành đào tạo. Đối với (kiểu) thực thể sản phẩm, những thuộc tính là tên sản phẩm, ký hiệu sản phẩm, phân xưởng sản xuất, khối lượng sản phẩm, giá thành, giá bán.

Thuộc tính đơn và thuộc tính kết hợp

Các thuộc tính mà giá trị không thể chia nhỏ hơn nữa được gọi là thuộc tính đơn (atomic), thí dụ như giới tính. Nếu ta có thể chia nhỏ giá trị thành một số phần thì thuộc tính được gọi là kết hợp (composite), thí dụ như ngày (ngày + tháng + năm) hay họ tên (họ + tên lót + tên).

Trong nhiều trường hợp, sự phân biệt này chỉ mang tính tương đối hay theo quy ước. Thí dụ trong một số trường hợp không quá phức tạp, ta có thể xem ngày như một thuộc tính đơn.

Thuộc tính đơn trị và thuộc tính đa trị

Một số thuộc tính có thể có nhiều giá trị khác nhau cho cùng một cá thể. Thí dụ một nhân viên có thể có hai số điện thoại khác nhau. Khi ấy, số điện thoại của nhân viên là thuộc tính đa trị. Nếu thuộc tính chỉ có một giá trị cho mỗi cá thể, thí dụ như ngày sinh của sinh viên, thì thuộc tính ấy là đơn trị.

Thuộc tính định danh

Có những thuộc tính mà giá trị cho một số cá thể có thể giống nhau. Thí dụ trong thực thể Sinh viên, có rất nhiều sinh viên có giới tính là nữ, có nhiều sinh viên cùng học môn Toán cao cấp. Tuy nhiên có những thuộc tính mà không hai cá thể nào có giá trị giống nhau. Thí dụ trong thực thể Sinh viên, mã số sinh viên của mọi sinh viên đều khác nhau. Các thuộc tính này được gọi là thuộc tính định danh (identifier) hay khóa (key).

Trong một số phần mềm quản lý dữ liệu, nếu ta không chọn thuộc tính nào để định danh thì phần mềm sẽ tự thêm một thuộc tính để định danh. Thuộc tính thêm vào ấy được gọi là khóa đại diện (surrogate key). Đó thường là số thứ tự của cá thể khi nhập vào cơ sở dữ liệu.

Đối chiếu với bảng dữ liệu

Nếu ta đối chiếu với cách trình bày thông thường, ta thấy các bảng dữ liệu có một số điểm gần gũi với các khái niệm thực thể và thuộc tính mà ta vừa trình bày trên. Mỗi bảng có thể xem tương ứng với một thực thể, mỗi dòng tương ứng với một cá thể, mỗi cột tương ứng với một thuộc tính, trong mỗi ô là giá trị của một thuộc tính tương ứng với một cá thể.

Liên kết

Giữa các thực thể có thể có mối quan hệ với nhau. Trong cơ sở dữ liệu, người ta gọi mối quan hệ này là liên kết (relationship). Thí dụ:

Sinh viên A THEO HỌC Khoa B

Đơn vị C SẢN XUẤT Sản phẩm D

Khách hàng E ĐẶT CHỖ cho Chuyến xe F

Qua đó ta thấy các thực thể Sinh viên và Khoa có quan hệ là THEO HỌC; các thực thể Đơn vị và Sản phẩm có quan hệ là SẢN XUẤT; các thực thể Khách hàng và Chuyến xe có quan hệ ĐẶT CHỖ.

Lưu ý rằng các liên kết này là hai chiều (hay thuận nghịch). Ta có thể trình bày lại thí dụ trên dưới dạng:

Khoa B CÓ Sinh viên A THEO HỌC

Sản phẩm D SẢN XUẤT BỞI Đơn vị C

Chuyến xe F ĐƯỢC ĐẶT CHỖ BỞI Khách hàng E

Bậc của liên kết

Bậc của liên kết là số thực thể tham gia vào liên kết.

Trong trường hợp liên kết bậc 1 (unary hay recursive), các cá thể của cùng một thực thể liên kết với nhau. Thí dụ Sinh viên A LÀM BẠN VỚI Sinh viên B. Vậy LÀM BẠN VỚI là liên kết bậc 1 của thực thể Sinh viên.

Bậc của liên kết là 2 (binary) khi có 2 thực thể tham gia vào liên kết như trong các thí dụ ở trên. Đây cũng là trường hợp phổ biến nhất.

Liên kết có bậc 3 (ternary) khi có 3 thực thể tham gia vào liên kết. SOẠN GIÁO TRÌNH là một liên kết bậc 3, cần 3 thực thể là Giáo viên, Môn học, và Giáo trình.

Loại liên kết

Trong trường hợp liên kết bậc 2, tùy theo số cá thể tham gia vào liên kết mà ta có những loại liên kết sau:

Liên kết 1:1 (liên kết một-một) : Mỗi thực thể có 1 cá thể tham gia vào liên kết. Thí dụ liên kết giữa thực thể quốc gia và thực thể thủ đô : mỗi quốc gia chỉ CÓ 1 thủ đô và một thủ đô chỉ THUỘC VỀ 1 quốc gia. Trong cơ sở dữ liệu, nhìn chung, mối liên kết này không phổ biến lắm và trong nhiều trường hợp, ta có thể kết hợp 2 thực thể này làm một.

Liên kết 1:N (liên kết một-nhiều) : thực thể thứ nhất có 1 cá thể tham gia vào liên kết, nhưng thực thể thứ hai lại có nhiều cá thể tham gia. Thí dụ liên kết giữa thực thể nhân viên và đơn vị, mỗi nhân viên chỉ THUỘC VỀ về 1 đơn vị, nhưng 1 đơn vị lại CÓ nhiều nhân viên. Đây là loại liên kết rất phổ biến trong cơ sở dữ liệu.

Liên kết N:N (liên kết nhiều-nhiều) : cả hai thực thể đều có nhiều cá thể tham gia vào liên kết. Thí dụ liên kết giữa thực thể nguyên liệu và thực thể nhà cung ứng : mỗi nhà cung ứng CUNG CẤP nhiều loại nguyên liệu cho công ty, và ngược lại, mỗi loại nguyên liệu ĐƯỢC CUNG ỨNG BỞI một số nhà cung ứng.

Bản số

Bản số (cardinality) là số cá thể tham gia vào liên kết tương ứng với một thực thể nào đó. Trong một số loại lược đồ, người ta trình bày hai loại bản số tương ứng với:

số cá thể lớn nhất có thể tham gia vào liên kết,

số cá thể bé nhất tham gia vào liên kết. Nếu con số này là 0, sự tham gia của thực thể vào liên kết được gọi là tùy chọn (optional), nghĩa là thực thể có thể tham gia vào liên kết hay không. Thí dụ giữa thực thể Nhân viên và thực thể Trình độ chuyên môn có liên kết : Nhân viên CÓ Trình độ chuyên môn. Tuy nhiên vẫn có một số nhân viên chẳng có trình độ chuyên môn gì. Nếu con số này là 1, sự tham gia của thực thể vào liên kết được gọi là bắt buộc (mandatory). Thí dụ mỗi nhân viên phải LÀM VIỆC CHO ít nhất là một đơn vị.