Mô hình dữ liệu quan hệ

Mô hình dữ liệu quan hệ

Mô hình dữ liệu quan hệ (relational data model) do E. F. Codd đề xuất lần đầu tiên vào năm 1970.

Giới thiệu

Sau khi Codd đề xuất mô hình dữ liệu quan hệ, đã có 2 dự án lớn được thực hiện để chứng minh tính khả thi của mô hình dữ liệu quan hệ và chúng đã trở thành các hệ thống mẫu.

  • Dự án đầu tiên do San Jose Research Laboratory của IBM thực hiện và phát triển thành System R, đây là một bản mẫu của hệ quản trị CSDL quan hệ (RDBMS – Relational Database Management System).
  • Dự án thứ hai do University of California thực hiện và phát triển thành Ingres, đây là một RDBMS mang tính lý thuyết.

Ngày nay, các RDBMS được sử dụng rộng rãi để quản trị CSDL, chúng có thể chạy được cả trên các thiết bị di động, máy tính cá nhân và máy chủ.

Các định nghĩa cơ bản

Mô hình dữ liệu quan hệ được xây dựng dựa vào lý thuyết toán học. Do đó, mô hình này có nền tảng rất vững chắc về mặt toán học. Mô hình dữ liệu quan hệ dựa vào một khái niệm toán học được gọi là quan hệ (relation) mà biểu diễn vật lý là các bảng (table) dữ liệu. E. F. Codd đã sử dụng các thuật ngữ toán học, chủ yếu là lý thuyết tập hợp (set theory) và luận lý vị từ (predicate logic).

Mô hình dữ liệu bao gồm 3 thành phần sau đây:

  • Cấu trúc dữ liệu (Data Structure): Dữ liệu được tổ chức theo dạng các bảng bao gồm nhiều hàng và nhiều cột.
  • Thao tác dữ liệu (Data Manipulation): Sử dụng các tác vụ mạnh (thông qua ngôn ngữ SQL) để thao tác dữ liệu được chứa trong các bảng.
  • Toàn vẹn dữ liệu (Data Integrity): Các phương tiện được dùng để đặc tả các quy tắc nghiệp vụ, nhằm duy trình tính toàn vẹn của dữ liệu khi thao tác dữ liệu.