Bạn đang xem bài viết Các Khái Niệm Cơ Bản Về Cơ Sở Dữ Liệu được cập nhật mới nhất trên website 2atlantic.edu.vn. Hy vọng những thông tin mà chúng tôi đã chia sẻ là hữu ích với bạn. Nếu nội dung hay, ý nghĩa bạn hãy chia sẻ với bạn bè của mình và luôn theo dõi, ủng hộ chúng tôi để cập nhật những thông tin mới nhất.
Những bài đầu tiên này có lẽ sẽ hơi nhàm chán với những bạn đã biết được các kiến thức cơ sở dữ liệu, nhưng những bạn mới vào nghề thì cũng nên đọc những bài này để có một cái nhìn tổng quát hơn, và sẽ không vướng mắc với những thuật ngữ về csdl trong quá trình học của mình. Trước tiên ta tìm hiểu các đối tượng sử dụng cơ sở dữ liệu.
1. Các đối tượng sử dụng Cơ sở dữ liệu
Người dùng cuối: Đây là đối tượng cuối cùng sử dụng hệ thống CSDL, đối tượng này không có kiến thức về quản trị hệ thống, nghĩa là không chuyên về lĩnh vực này nên họ cần một công cụ giúp quản trị, khai thác dữ liệu khi cần. Thông thường khi làm dự án thì khách hàng chính là đối tượng người dùng cuối.
Chuyên viên tin học: Chuyên xây dựng các công cụ, ứng dụng nhằm giúp người dùng cuối sử dụng khai thác cơ sở dữ liệu, đối tượng này ta gọi là Application User. Nếu bạn muốn sau này bạn sẽ là một coder chuyên xây dựng các ứng dụng website thì bạn chính là chuyên viên tin học.
Quản trị CSDL: Đối tượng này cần có kiến thức chuyên sâu về hệ quản trị cơ sở dữ liệu, biết ngôn ngữ cấu trúc truy vấn (T-SQL) ở mức rành rỏi. Công việc của đối tượng này là tổ chức hệ thống CSDL, bảo mật, phân quyền hay cấp quyền cho các đối tượng khác, backup phục hồi dữ liệu và bảo đảm an toàn dữ liệu. Nếu bạn muốn trở thành đối tượng này thì bạn phải nghiên cứu sâu các mô hình CSDL, các hệ quản trị CSDL và cần có kinh nghiệm thực tế rất cao.
2. Các mức biểu diễn cơ sở dữ liệu
Tới đây mới thấy sự rườm rà của cơ sở dữ liệu rồi nhỉ , tuy rườm rà nhưng những kiến thức này giúp ta có quy trình thiết kế phần mềm ( cơ sở dữ liệu) một cách nhanh và đầy đủ thông tin nhất, trong những bài sau ta sẽ tìm hiểu nó một cách đầy đủ hơn.
Mức trong (Mức vật lý – Physical): Ở mức này thông thường ta sẽ trả lời những câu hỏi ( CSDL cần giải quyết vấn đề gì? dữ liệu là gì? lưu trữ như thế nào? lưu trữ ở đâu? đánh chỉ mục như thế nào? truy vấn tuần tự hay ngẫu nhiên? ). Với mức này thì dành cho người chuyên môn về cơ sở dữ liệu (đối tượng quản trị CSDL).
Mức quan niệm (Conception hay Logical): trả lời các câu hỏi cần phải lưu trữ bao nhiêu loại dữ liệu, kiểu dữ liệu là gì và các mối liên hệ dữ liệu
Mức ngoài: đây là mức cao nhất dành cho người dùng cuối sử dụng và dành co các nhà phát triển phần mềm viết các chương trình ứng dụng nhằm quản ly CSDL.
3. Các ngôn ngữ giao tiếp cơ sở dữ liệu
Ngôn ngữ mô tả dữ liệu (DDL – Data Definition Language): Cho phép khai báo cấu trúc CSDL, các mối liên hệ dữ liệu, cấu trúc ràng buộc dữ liệu.
Ngôn ngữ thao tác dữ liệu (DML – Data Manipulation Language): cho phép thực hiện thao tác thêm, xóa, sửa dữ liệu.
Ngôn ngữ truy vấn có cấu trúc (SQL – Structured Query Language): cho phép người khai thác sử dụng để truy vấn thông tin cần thiết.
Ngôn ngữ quản lý dữ liệu (DCL – Data Control Language) cho phép thay đổi cấu trúc bảng, khai báo bảo mật, cấp quyền cho người sử dụng.
Tôi sẽ lấy một ví dụ nho nhỏ về ngôn ngữ SQL.
Ví dụ: Lấy danh sách sinh viên lớp K34 khoa CNTT trường DHSP chúng tôi
Với ngôn ngữ bình thường thì ta dễ dàng biểu diễn nhưng với ngôn ngữ SQL thì ta sẽ dùng cú pháp riêng của nó. Giả sử đối tượng DANHSACH chứa danh sách sinh viên, cú pháp SELECT dùng để chọn, dấu sao (*) dùng để biểu diễn tất cả thông tin, FROM dùng để chỉ nơi lưu trữ. Vậy ta có câu truy vấn như sau:
SELECT * FROM DANHSACH (lấy tất cả dữ liệu từ danh sách sinh viên)
Trong ví dụ này chỉ mang tính tham khảo vì những cú pháp đó bạn chưa biết, ở những bài sâu hơn ta sẽ tìm hiểu về những cú pháp này một cách chi tiết.
4. Các mô hình dữ liệu
Mô hình dữ liệu mạng
Mô hình dữ liệu phân cấp
Mô hình dữ liệu thực thể mối kết hợp
Mô hình dữ liệu quan hệ
Mô hình dữ liệu hướng đối tượng
5. Lời kết
Một Số Khái Niệm Cơ Bản Về Hệ Cơ Sở Dữ Liệu
– Bài toán quản lí là bài toán phổ biến trong mọi hoạt động kinh tế – xã hội. Một xã hội ngày càng văn minh thì trình độ quản lí các tổ chức hoạt động trong xã hội đó ngày càng cao. Công tác quản lí chiếm phần lớn trong các ứng dụng của tin học.
– Để quản lý học sinh trong nhà trường, người ta thường lập các biểu bảng gồm các cột, hàng để chứa thông tin cần quản lý.
– Một trong những biểu bảng được thiết lập để lưu trữ thông tin về điểm của học sinh như sau: (Hình 1 _SGK/4)
Chú ý:
– Hồ sơ quản lí học sinh của nhà trường là tập hợp các hồ sơ lớp.
– Trong quá trình quản lí, hồ sơ có thể có những bổ sung, thay đổi hay nhầm lẫn đòi hỏi phải sửa đổi lại.
– Việc tạo lập hồ sơ không chỉ đơn thuần là để lưu trữ mà chủ yếu là để khai thác, nhằm phục vụ các yêu cầu quản lí cảu nhà trường.
Công việc quản lí tại mỗi nơi, mỗi lĩnh vực có những đặc điểm riêng về đối tượng quản lí cũng như về phương thức khai thác thông tin. Công việc thường gặp khi xử lí thông tin bao gồm: tạo lập, cập nhật và khai thác hồ sơ.
Để tạo lập hồ sơ, cần thực hiện các công việc sau:
– Tùy thuộc nhu cầu của tổ chức mà xác định chủ thể cần quản lí VD: Chủ thể cần quản lí là học sinh, …
– Dựa vào yêu cầu quản lí thông tin của chủ thể để xác định cấu trúc hồ sơ. VD: ở hình 1, hồ sơ của mỗi học sinh là một hàng có 11 thuộc tính.
– Thu thập, tập hợp thông tin cần thiết cho hồ sơ từ nhiều nguồn khác nhau và lưu trữ chúng theo đúng cấu trúc đã xác định. VD; hồ sơ lớp dưới, kết quả điểm thi học kì các môn học, …
Thông tin lưu trữ trong hồ sơ cần được cập nhật để đảm bảo phản ánh kịp thời, đúng với thực tế.
Một số việc thường làm để cập nhật hồ sơ:
Việc tạo lập, lưu trữ và cập nhật hồ sơ là để khai thác chúng, phục vụ cho công việc quản lí.
Khai thác hồ sơ bao gồm các công việc chính sau:
– Sắp xếp hồ sơ theo một tiêu chí nào đó phù hợp với yêu cầu quản lí của tổ chức. VD: sắp xếp theo bảng chữ cái của tên học sinh, theo điểm của môn học nào đó, …
– Tìm kiếm là việc tra cứu các thông tin thỏa mãn một số yêu cầu nào đó. VD: tìm họ tên hs có điểm môn Tin cao nhất, …
– Thống kê là cách khai thác hồ sơ dựa trên tính toán để đưa ra các thông tin đặc trưng.. VD: Xác định điểm cao nhất, thấp nhất môn Tin, …
– Lập báo cáo là việc sử dụng các kết quả tìm kiếm, thống kê, sắp xếp các bộ hồ sơ để tạo lập một bộ hồ sơ mới có nội dung và cấu trúc khuôn dạng theo một yêu cầu nào đó. VD: danh sách HSG của lớp, …
Để đáp ứng các yêu cầu khai thác thông tin, phải tổ chức thông tin thành một hệ thống với sự trợ giúp của máy tính điện tử.
* Khái niệm hệ QTCSDL : Là phần mềm cung cấp mi trường thuận lợi và hiệu quả để tạo lập, lưu trữ và khai thác thông tin của CSDL được gọi là hệ quản trị CSDL (Database Management System).
– Người ta thường dùng thuật ngữ hệ cơ sở dữ liệu để chỉ một CSDL cùng với hệ QTCSDL và khai thác CSDL đó.
– Để lưu trữ và khai thác thông tin bằng máy tính cần phải có:
+ Các thiết bị vật lí (máy tính, đĩa cứng, mạng, …).
Nhóm người quản trị hệ CSDL hoặc phát triển các ứng dụng thường không cần hiểu chi tiết ở mức vật lí, nhưng họ cần phải biết: Những dữ liệu nào được lưu trữ trong hệ CSDl? Giữa các dữ liệu có các mối quan hệ nào?
Mức hiểu CSDL của người dùng thông qua khung nhìn được gọi là mức khung nhìn (còn được gọi là mức ngoài) của CSDL.
Tính cấu trúc được thể hiện ở các điểm sau:
– Dữ liệu ghi vào CSDL được lưu giữ dưới dạng các bản ghi.
– Hệ QTCSDL cần có các công cụ khai báo cấu trúc của CSDL(là các yếu tố để tổ chức dữ liệu: cột, hàng, kiểu của dữ liệu nhập vào cột, hàng…) xem, cập nhật, thay đổi cấu trúc.
: Các giá trị được lưu trữ trong CSDL phải thỏa mãn một số ràng buộc ( gọi là ràng buộc toàn vẹn dữ liệu), tùy thuộc vào hoạt động của tổ chức mà phản ánh.
* Tính an toàn và bảo mật thông tin: CSDL cần được bảo vệ an toàn, phải ngăn chặn được những truy xuất không được phép và phải khôi phục được CSDL khi có sự cố ở phần cứng hay phần mềm…
d) Một số ứng dụng:
– Cơ sở giáo dục và đào tạo cần quản lí thông tin người học, môn học, kết quả học tập,…
– Cơ sở kinh doanh cần có CSDL về thông tin khách hàng, sản phẩm, việc mua bán,…
– Cơ sở sản xuất cần quản lí dây chuyền thiết bị và theo dõi việc sản xuất các sản phẩm trong các nhà máy, hàng tồn trong kho hay trong cửa hàng và các đơn đặt hàng.
– Tổ chức tài chính cần lưu thông tin về cổ phần, tình hình kinh doanh mua bán tài chính như cổ phiếu, trái phiếu, …
– Các giao dịch qua thể tín dụng cần quản lí việc bán hàng bằng thẻ tín dụng và xuất ra báo cáo tài chính định kì.
– Hãng hàng không cần quản lí các chuyến bay, việc đăng kí vé và lịch bay,…
– Tổ chức viễn thông cần ghi nhận các cuộc gọi, hóa đơn hàng tháng, tính toán số dư cho các thể gọi trả trước,…
Tổng Quan Về Khái Niệm Cơ Sở Dữ Liệu, Phân Loại Cơ Sở Dữ Liệu Và Thảo Luận Về Cơ Sở Dữ Liệu Trong Cơ Quan Nhà Nước (Phần 1)
Cơ sở dữ liệu là gì
Định nghĩa cơ sở dữ liệu của từ điển Oxford: Một tập hợp có cấu trúc của dữ liệu được lưu trong máy tính, theo một cách đặc biệt nào đó có thể được tiếp cận theo những cách khác nhau.
Theo Wikipedia, cơ sở dữ liệu là một tập hợp thông tin có cấu trúc. Tuy nhiên, thuật ngữ này thường dùng trong công nghệ thông tin và nó thường được hiểu rõ hơn dưới dạng một tập hợp liên kết các dữ liệu, thường đủ lớn để lưu trên một thiết bị lưu trữ như đĩa hay băng từ. Dữ liệu này được duy trì dưới dạng một tập hợp các tập tin trong hệ điều hành hay được lưu trữ trong các hệ quản trị cơ sở dữ liệu.
Theo trang công nghệ chúng tôi Một cơ sở dữ liệu là một tập hợp các thông tin được tổ chức để nó có thể dễ dàng được truy cập, quản lý và cập nhật. Theo một vài quan điểm, cơ sở dữ liệu có thể được phân loại theo loại nội dung: thư mục, văn bản đầy đủ, số, và hình ảnh. Trong máy tính, cơ sở dữ liệu đôi khi được phân loại theo phương pháp tổ chức của nó. Phương pháp phổ biến nhất là các cơ sở dữ liệu quan hệ , cơ sở dữ liệu dạng bảng trong đó dữ liệu được định nghĩa để nó có thể được tổ chức lại và truy cập trong một số cách khác nhau.
Một định nghĩa được biết đến thông dụng khác: Cơ sở dữ liệu là một hệ thống các thông tin có cấu trúc, được lưu trữ trên các thiết bị lưu trữ nhằm thõa mãn yêu cầu khai thác thông tin đồng thời của nhiều người sử dụng hay nhiều chương trình ứng dụng chạy cùng một lúc với những mục đích khác nhau.
Hơn nữa, tham khảo qua trang công cụ tìm kiếm của google về thuật ngữ cơ sở dữ liệu, ta cũng sẽ thu thập được nhiều định nghĩa hoặc khái niệm khác nhau về cơ sở dữ liệu, nhiều website còn đánh đồng với thuật ngữ cơ sở dữ liệu với hệ thống quản trị cơ sở dữ liệu bởi việc triển khai các giải pháp công nghệ quản trị cơ sở dữ liệu hiện nay.
Tuy nhiên, qua các khái niệm, ta có thể tóm tắt một số điểm chung của cơ sở dữ liệu là:
– Tập hợp thông tin có cấu trúc.
– Được quản lý và duy trì phục vụ khai thác thông tin.
– Có thể phục vụ nhiều đối tượng khai thác với nhiều cách thức khác nhau.
– Có nhiều giải pháp khác nhau để xây dựng và quản lý cơ sở dữ liệu.
Vì vậy, khi nói về cơ sở dữ liệu, ta trọng tâm nói về thông tin, dữ liệu được quản lý, lưu trữ và khai thác mà không phải là vỏ bọc chứa thông tin, dữ liệu (ví dụ hệ thống quản lý cơ sở dữ liệu).
Tuy nhiên, theo một cách thông dụng nhất, phân loại về cơ sở dữ liệu trong máy tính thường được thực hiện theo một số hình thức của dữ liệu cơ bản sau:
Phân loại theo loại dữ liệu:
– Cơ sở dữ liệu có cấu trúc (structured database): có nghĩa là cơ sở dữ liệu dữ liệu được định hình theo một cấu trúc xác định từ trước. Chúng ta có thể hình dung như một văn bản đã được xác định tiêu đề, có các dòng và cột với tiêu đề xác định trước, các thông tin chi tiết được lấp đầy các bảng này và không thay đổi khi cập nhật. Một hình dung khác về cơ sở dữ liệu dữ liệu có cấu trúc là một thư viện với các tủ hồ sơ được đánh nhãn, trong mỗi tủ được phân ngăn rõ ràng. Cơ sở dữ liệu có cấu trúc được xây dựng sẽ dễ dàng quản lý và truy cập thông tin.
– Cơ sở dữ liệu phi cấu trúc (unstructured database): là cơ sở dữ liệu không được xác định cấu trúc thông tin từ trước. Thường là tập hợp các dữ liệu thô, hỗn tạp và không đồng nhất. Các thành phần của cơ sở dữ liệu không có đặc điểm chung. Chúng ta có thể hình dung cơ sở dữ liệu này là tập hợp các thông tin, dữ liệu bao gồm: thư điện tử, dữ liệu ảnh, video, âm thanh, các bài viết,…Dữ liệu phi cấu trúc có mặt ở khắp mọi nơi và được sản sinh ra từ các nguồn khác nhau. Để quản lý, dữ liệu phi cấu trúc cần được chuyển đổi thành dữ liệu có cấu trúc qua quá trình chuẩn hóa.
– Cơ sở dữ liệu bán cấu trúc (semi-structured database): thường là dữ liệu có cấu trúc nhưng không đồng nhất. Cấu trúc của dữ liệu phụ thuộc vào chính nội dung của dữ liệu ấy. Chúng ta có thể thấy được rằng trong thực tế dữ liệu được lưu dưới dạng XML tự do (không kèm theo lược đồ), với định dạng này thông tin mô tả về đối tượng thể hiện trong các thẻ. Đây là cơ sở dữ liệu có nhiều ưu điểm do lưu trữ được hầu hết các loại dữ liệu khác nhau nên cơ sở dữ liệu bán cấu trúc là hướng mới trong nghiên cứu và ứng dụng và được sử dụng thông dụng trên mạng Internet. Tuy nhiên cũng cần lưu ý rằng XML cũng có thể được mô tả dữ liệu có cấu trúc bằng cách kèm xây dựng và lưu trữ dữ liệu tuân thủ lược đồ.
Phân loại theo hình thức lưu trữ, mô hình tổ chức
– Cơ sở dữ liệu dạng tệp (file database) dữ liệu được lưu trữ dưới dạng các file có thể là văn bản, ảnh, thông tin nhị phân, hoặc phát triển hơn là tệp cơ sở dữ liệu nhỏ gọn của các phần mềm quản lý dữ liệu. Tiêu biểu cho cơ sở dữ liệu dạng tệp là*.mdb Foxpro, Microsoft Access…dạng cơ sở dữ liệu này thường phù hợp với phạm vi nhỏ hoặc theo cách thức tổ chức quản lý dạng cũ.
– Cơ sở dữ liệu quan hệ (relational database): dữ liệu được lưu trữ trong các bảng dữ liệu gọi là các thực thể, giữa các thực thể này có mối liên hệ với nhau gọi là các quan hệ, mỗi quan hệ có các thuộc tính, trong đó có một thuộc tính là khóa chính. Các hệ quản trị hỗ trợ cơ sở dữ liệu quan hệ như: MS SQL server, Oracle, MySQL… là đặc trưng thể hiện của các cơ sở dữ liệu này.
– Cơ sở dữ liệu phân cấp (herachical database): Một mô hình cơ sở dữ liệu phân cấp là một mô hình dữ liệu trong đó các dữ liệu được tổ chức thành một cây cấu trúc. Các dữ liệu được lưu trữ như các hồ sơ đó được kết nối với nhau thông qua các liên kết. Một thực thể là một tập hợp của các thực thể con, mỗi thực thể con cuối cùng (gọi là lá) chỉ chưa giá trị. Thể hiện thực tế của loại cơ sở dữ liệu này là cơ sở dữ liệu được lưu như hệ thống thư mục trên ổ đĩa. Mỗi thư mục cha chứa các thư mục con và tệp nằm trong các thư mục. Một thể hiện khác là các cơ sở dữ liệu quản lý tài khoản, người dùng như LDAP, AD trong đó có chứa các tài khoản tổ chức, cá nhân có cấu trúc lồng nhau.
Phân loại theo đặc tính sử dụng
– Cơ sở dữ liệu hoạt động (operational databases): Trong hoạt động của mỗi cơ quan, đơn vị hay doanh nghiệp luôn sản sinh ra một lượng lớn thông tin. Các thông tin này lại là đầu vào cho quá trình thực hiện một nghiệp vụ khác. Các thông tin này được đưa vào các cơ sở dữ liệu để quản lý và truy xuất bởi các đối tượng khác nhau. Đây chính là hình thức của các cơ sở dữ liệu hoạt động. Một cơ sở dữ liệu hoạt động thường là cực kỳ quan trọng đối với các tổ chức vì chúng bao gồm các cơ sở dữ liệu đối tác, khách hàng, cơ sở dữ liệu cá nhân và cơ sở dữ liệu sản phẩm hoạt động… Các dữ liệu được lưu trữ trong cơ sở dữ liệu hoạt động có thể được thay đổi và thao tác tùy thuộc vào những gì các tổ chức yêu cầu.
– Cơ sở dữ liệu ngữ nghĩa (semantic database): Đây là cơ sở dữ liệu mới thường được nhắc đến trong thời đại Internet. Là một cơ sở dữ liệu mềm dẻo và linh hoạt lưu trữ ngữ nghĩa của thông tin như như các sự kiện của các đối tượng. Cơ sở dữ liệu dữ liệu ngữ nghĩa được thiết kế để đại diện cho thế giới thực một cách chính xác nhất có thể trong tập hợp dữ liệu. Ký hiệu dữ liệu được tổ chức tuyến tính và phân cấp để cung cấp cho những ý nghĩa nhất định như một trong những mô tả ở trên. Bằng đại diện cho thế giới thực trong bộ dữ liệu, dữ liệu ngữ nghĩa cho phép các máy để tương tác với thông tin của thế gian mà không cần giải thích bởi con người.
Phân loại theo mô hình triển khai
– Cơ sở dữ liệu tập trung (centralized database): Một cơ sở dữ liệu tập trung là một cơ sở dữ liệu được đặt, lưu trữ, và duy trì trong một địa điểm duy nhất. Đây là vị trí thường xuyên nhất thiết đặt một hệ thống máy tính hoặc cơ sở dữ liệu hệ thống trung tâm, ví dụ một máy tính chủ, hoặc một hệ thống máy tính máy tính lớn (Wikipedia). Thông thường, một cơ sở dữ liệu tập trung sẽ được duy trì và quản lý bởi một đầu mối, một tổ chức hoặc một cơ quan. Người dùng truy cập vào một cơ sở dữ liệu tập trung thông qua hệ thống mạng nội bộ hoặc mạng diện rộng, internet để truy cập vào các cơ sở dữ liệu để cập nhật hoặc khai thác trung tâm CPU, do đó duy trì cơ sở dữ liệu riêng của mình
– Cơ sở dữ liệu phân tán (distributed database) là cơ sở dữ liệu không được lưu trữ và xử lý bởi nhiều máy tính, nhiều hệ thống thông tin và thường được đặt ở nhiều vị trí khác nhau. Các vị trí được kết nối với nhau bằng hệ thống mạng (có thể không thường xuyên trực tuyến). cơ sở dữ liệu phân tán có thể được quản lý bởi nhiều cơ quan, đơn vị và tổ chức khác nhau nhưng cần có một chính sách thống nhất để các cơ sở dữ liệu tương hợp và trao đổi thông tin với nhau.
– Cơ sở dữ liệu tập trung có bản sao: Các cơ sở dữ liệu tập trung và phân tán thường có những ưu điểm và nhược điểm của mình. Quyết định sử dụng loại nào còn phụ thuộc vào yếu tố quản lý và kỹ thuật như sự tham gia của các cơ quan, chính sách quản lý và khai thác dữ liệu, sự ổn định và tốc độ kết nối mạng, mức độ đáp ứng người sử dụng… cơ sở dữ liệu tập trung bản sao là cơ sở dữ liệu được lai giữa hai loại tập trung và phân tán trong đó một cơ sở dữ liệu tập trung lưu toàn bộ dữ liệu theo phạm vi quản lý, triển khai thêm các cơ sở dữ liệu thành phần bản sao theo từng phạm vi dữ liệu và kết nối đồng bộ đến cơ sở dữ liệu trung tâm. Các cơ sở dữ liệu bản sao thành phần này có thể phục vụ các mục đích khác nhau hoặc đặt ở các vị trí khác nhau để tối ưu và khắc phục các nhược điểm đã kể trên nhưng vẫn đảm bảo tính thống nhất như cơ sở dữ liệu tập trung.
https://vi.wikipedia.org/wiki/C%C6%A1_s%E1%BB%9F_d%E1%BB%AF_li%E1%BB%87u http://www.semagix.com/what-is-semantic-data.htm https://brightplanet.com/2012/06/structured-vs-unstructured-data/ http://ecomputernotes.com/fundamental/what-is-a-database/type-of-database-system
Nguyễn Trọng Khánh
Lần xem: 12626 Go top
Khái Niệm Về Cơ Sở Dữ Liệu Quan Hệ (Relational Database)
Nguồn gốc của mô hình cơ sở dữ liệu quan hệ đầu tiên là do tiến sĩ chúng tôi thiết kế đã được công bố rộng rãi vào tháng 7/1970 với bài “Mô hình dữ liệu cho các ngân hàng dữ liệu lớn”. Theo mô hình này, các dữ liệu sẽ được lưu vào máy tính dưới dạng các bảng hai chiều gọi là các quan hệ và giữa các bảng sẽ có các mối liên hệ được định nghĩa nhằm phản ảnh mối liên kết thực sự của các đối tượng dữ liệu ở bên ngoài thế giới thật. Trong mô hình này có một số khái niệm cơ bản sau :
1/- Bảng (Table) hay quan hệ :
Gồm có nhiều dòng và nhiều cột. Trong một bảng phải có ít nhất là một cột.
2/- Cột (Column) hay trường (Field) :
Nằm trong bảng, trong một bảng không thể có hai cột trùng tên nhau. Trên mỗi cột chỉ lưu một loại dữ liệu. Thứ tự trước sau của các cột trong bảng là không quan trọng. Các thuộc tính cơ sở của một trường là tên trường (Field name), kiểu dữ liệu (Data type), độ rộng (Field size).
Ví dụ : Bảng Môn học lưu trữ thông tin về các môn học.
Hình 1.1 : Bảng Môn học.
Trong bảng này có hai cột : mã môn học và tên môn học. Các thuộc tính cơ sở của các cột này là :
3/- Dòng (Row) :
Nằm trong bảng, trong một bảng không thể có hai dòng trùng lắp nhau về thông tin lưu trữ. Thứ tự trước sau của các dòng trong bảng cũng không quan trọng.
4/- Khóa chính (Primary key) :
Là một hoặc nhiều trường trong một bảng mà dữ liệu tại các cột này bắt buộc phải có (không được để trống) và đồng thời phải duy nhất không được phép trùng lắp (tính duy nhất của sữ liệu). Và giá trị dữ liệu của khóa chính xác định duy nhất các giá trị của các trường khác trong cùng một dòng.
5/- Khóa ngoại (Foreign key) :
Là một hoặc nhiều trường trong một bảng mà các trường này là khóa chính của một bảng khác. Do đó, dữ liệu tại các cột này bắt buộc phải tồn tại có trong một bảng khác. Tính tồn tại của dữ liệu.
Ví dụ : Để lưu trữ và quản lý thông tin của các sinh viên, bạn tổ chức các bảng đơn giản sau :
Bảng môn học : Lưu trữ thông tin các môn học.
Bảng sinh viên : Lưu trữ thông tin của các sinh viên (mã số, ngày sinh, họ tên, địa chỉ, nơi sinh, …).
Bảng kết quả thi : Lưu trữ điểm thi của từng môn học cho các sinh viên.
Hình 1.3 : Lưu trữ và quản lý thông tin của sinh viên.
Trong đó :
– Bảng Môn học có cột mã môn học là khóa chính. Thông thường, trong mô hình quan hệ để viết gọn, bạn có thể viết bằng bảng theo cú pháp sau :
Môn học (Mã môn học, Tên môn học)
Các cột được gạch dưới trong bảng chính là khóa chính của bảng. Để thể hiện một phụ thuộc hàm trong bảng môn học, bạn có thể viết :
Mã môn học Tên môn học.
– Bảng Sinh viên có cột mã số là khóa chính, được thể hiện như sau :
Sinh viên (Mã số, Họ tên, Ngày sinh, Địa chỉ, …)
Mã số Họ tên, Ngày sinh, Địa chỉ, …
– Bảng Kết quả thi có cột mã số và mã môn học (hai cột) là khóa chính.
Kết quả thi (Mã số, Mã môn học, Điểm)
Trong bảng Kết quả thi có cột mã môn học là một khóa ngoại và cột mã sinh viên cũng là một khóa ngoại. Bảng có thể thấy rằng trong bảng Kết quả thi tại cột mã sinh viên chỉ cho phép chứa các mã sinh viên có trong bảng Sinh viên và cột mã môn học chỉ cho phép chứa các môn học trong bảng Môn học. Điều này thì hiển nhiên vì chúng ta chỉ lưu trữ điểm thi của các sinh viên thật sự có có tồn tại trong bảng Sinh viên và môn học phải có trong bảng Môn học.
Theo ví dụ trên thì bạn có mã sinh viên trong bảng Kết quả thi là {A01} phải thuộc trong tập hợp các mã sinh viên trong bảng Sinh viên {A01, A02, …}. Thông thường sử dụng ký tự để mô tả một phụ thuộc hàm tồn tại.
Ví dụ : Trong bảng Kết quả thi tồn tại hai phụ thuộc hàm tồn tại là :
Kết quả thi [Mã số] Sinh viên [Mã số] và
Kết quả thi [Mã môn học] Môn học[Mã môn học]
Cập nhật thông tin chi tiết về Các Khái Niệm Cơ Bản Về Cơ Sở Dữ Liệu trên website 2atlantic.edu.vn. Hy vọng nội dung bài viết sẽ đáp ứng được nhu cầu của bạn, chúng tôi sẽ thường xuyên cập nhật mới nội dung để bạn nhận được thông tin nhanh chóng và chính xác nhất. Chúc bạn một ngày tốt lành!