MVCC là gì?

20/11/2023 - 9 phút

Follow  on Google News

MVCC là gì?

Một trong những điểm quan trọng và hấp dẫn của hệ quản trị cơ sở dữ liệu PostgreSQL là cách nó xử lý tương tranh giữa các giao dịch (transaction). Trong PostgreSQL, việc đọc dữ liệu không bao giờ chặn việc ghi dữ liệu và ngược lại. Điều này được thực hiện thông qua một cơ chế gọi là “Multi Version Concurrency Control” (MVCC), hay Kiểm soát Tương tranh Đa Phiên Bản.

MVCC không phải là một đặc điểm duy nhất của PostgreSQL, mà nó cũng được triển khai trong một số hệ quản trị cơ sở dữ liệu khác như Oracle, Berkeley DB, CouchDB và nhiều hệ thống khác. Điều quan trọng là hiểu cách PostgreSQL thực hiện MVCC, vì điều này giúp các nhà phát triển phần mềm thiết kế ứng dụng có khả năng hoạt động đồng thời mà sử dụng PostgreSQL, và cũng giúp giải quyết một loạt vấn đề phức tạp có thể xảy ra trong tương lai.

MVCC hoạt động như thế nào?

sequenceDiagram
    participant Client as Client
    participant Database as Database
    participant Transaction1 as Transaction 1
    participant Transaction2 as Transaction 2

    Client->>Database: Bắt đầu giao dịch (Begin Transaction)
    alt Giao dịch 1
        Database->>Transaction1: Gán ID giao dịch
        Transaction1->>Database: Đọc dữ liệu (Read Data)
    else Giao dịch 2
        Database->>Transaction2: Gán ID giao dịch
        Transaction2->>Database: Đọc dữ liệu (Read Data)
    end
    Client->>Database: Thực hiện cập nhật (Perform Update)
    alt Giao dịch 1
        Database->>Transaction1: Tạo phiên bản mới
        Transaction1->>Database: Cập nhật dữ liệu (Update Data)
    else Giao dịch 2
        Database->>Transaction2: Tạo phiên bản mới
        Transaction2->>Database: Cập nhật dữ liệu (Update Data)
    end
    Client->>Database: Kết thúc giao dịch (Commit Transaction)
    alt Giao dịch 1
        Database->>Transaction1: Lưu phiên bản mới
    else Giao dịch 2
        Database->>Transaction2: Lưu phiên bản mới
    end

Trong sơ đồ tuần tự trên, chúng ta có hai giao dịch, Giao dịch 1 và Giao dịch 2, được thực hiện song song trên cơ sở dữ liệu.

  1. Mỗi giao dịch bắt đầu bằng việc Client gọi “Bắt đầu giao dịch (Begin Transaction)” với cơ sở dữ liệu.
  2. Sau đó, cơ sở dữ liệu gán một ID giao dịch duy nhất cho mỗi giao dịch để theo dõi chúng.
  3. Giao dịch 1 và Giao dịch 2 thực hiện đọc dữ liệu (Read Data) từ cơ sở dữ liệu.
  4. Sau khi đọc dữ liệu, cả hai giao dịch thực hiện cập nhật dữ liệu (Perform Update). Cơ sở dữ liệu tạo phiên bản mới của dữ liệu để đảm bảo tính nhất quán.
  5. Cuối cùng, cả hai giao dịch kết thúc bằng cách gọi “Kết thúc giao dịch (Commit Transaction)” và cơ sở dữ liệu lưu phiên bản mới của dữ liệu.

Quá trình thực hiện chèn (insert) một bản ghi chi tiết vào cơ sở dữ liệu

sequenceDiagram
    participant Client as "Client"
    participant MVCC as "MVCC"
    participant Database as "Cơ sở dữ liệu"

    Client->>+MVCC: Bắt đầu giao dịch (Chèn bản ghi)
    MVCC->>+Database: Bắt đầu giao dịch (Chèn bản ghi)
    Database-->>-MVCC: Phản hồi (Giao dịch đã bắt đầu)

    Client->>+MVCC: INSERT INTO ChiTiet (SinhVienID, KhoaHocID, DiemSo) VALUES (1, 101, 85)
    MVCC->>+Database: INSERT INTO ChiTiet (SinhVienID, KhoaHocID, DiemSo) VALUES (1, 101, 85)
    Database-->>-MVCC: Phản hồi (Bản ghi ChiTiet đã được thêm)

    Client->>+MVCC: Kết thúc giao dịch (Chèn bản ghi)
    MVCC->>+Database: Kết thúc giao dịch (Chèn bản ghi)
    Database-->>-MVCC: Phản hồi (Giao dịch đã kết thúc)
  1. Client bắt đầu giao dịch bằng cách gửi một yêu cầu chèn bản ghi vào MVCC.

  2. MVCC nhận được yêu cầu từ Client và tiếp tục bằng việc gửi một yêu cầu chèn bản ghi vào Database.

  3. Database nhận được yêu cầu từ MVCC và xác nhận rằng giao dịch đã được bắt đầu.

  4. Client thực hiện câu truy vấn INSERT INTO để chèn bản ghi vào cơ sở dữ liệu. Trong ví dụ này, bản ghi được chèn vào bảng ChiTiet với các giá trị SinhVienID, KhoaHocIDDiemSo1, 10185 tương ứng.

  5. MVCC nhận câu truy vấn INSERT INTO từ Client và tiếp tục gửi nó đến Database.

  6. Database thực hiện việc chèn bản ghi vào bảng ChiTiet và sau đó gửi phản hồi cho MVCC để thông báo rằng bản ghi ChiTiet đã được thêm thành công.

  7. Client kết thúc giao dịch bằng cách gửi một yêu cầu kết thúc giao dịch đến MVCC.

  8. MVCC tiếp tục bằng việc gửi yêu cầu kết thúc giao dịch đến Database.

  9. Database nhận yêu cầu kết thúc giao dịch từ MVCC và xác nhận rằng giao dịch đã kết thúc.

Như vậy, quá trình chèn một bản ghi vào Database qua MVCC bao gồm các bước bắt đầu giao dịch, thực hiện câu truy vấn INSERT INTO, và kết thúc giao dịch, đảm bảo tính đồng thời và không xảy ra xung đột giữa các giao dịch khác nhau.

Quá trình thực hiện xoá (delete) một bản ghi chi tiết vào cơ sở dữ liệu

sequenceDiagram
    participant Client as "Client"
    participant MVCC as "MVCC"
    participant Database as "Database"

    Client->>+MVCC: Bắt đầu giao dịch (Xoá bản ghi)
    MVCC->>+Database: Bắt đầu giao dịch (Xoá bản ghi)
    Database-->>-MVCC: Phản hồi (Giao dịch đã bắt đầu)

    Client->>+MVCC: DELETE FROM ChiTiet WHERE ID = 1
    MVCC->>+Database: DELETE FROM ChiTiet WHERE ID = 1
    Database-->>-MVCC: Phản hồi (Bản ghi ChiTiet đã được đánh dấu xóa)

    Client->>+MVCC: Kết thúc giao dịch (Xoá bản ghi)
    MVCC->>+Database: Kết thúc giao dịch (Xoá bản ghi)
    Database-->>-MVCC: Phản hồi (Giao dịch đã kết thúc)
  1. Client bắt đầu giao dịch bằng cách gửi một yêu cầu xoá bản ghi từ MVCC.

  2. MVCC nhận được yêu cầu từ Client và tiếp tục bằng việc gửi một yêu cầu xoá bản ghi đến Database.

  3. Database nhận được yêu cầu từ MVCC và xác nhận rằng giao dịch đã được bắt đầu.

  4. Client thực hiện câu truy vấn DELETE FROM để xoá bản ghi từ bảng ChiTiet dựa trên điều kiện WHERE ID = 1. Trong ví dụ này, bản ghi có ID là 1 sẽ bị xoá.

  5. MVCC nhận câu truy vấn DELETE FROM từ Client và tiếp tục gửi nó đến Database.

  6. Cơ sở dữ liệu thực hiện xoá bản ghi từ bảng ChiTiet dựa trên điều kiện đã cho và sau đó gửi phản hồi cho MVCC để thông báo rằng bản ghi đã được đánh dấu xóa.

  7. Client kết thúc giao dịch bằng cách gửi một yêu cầu kết thúc giao dịch đến MVCC.

  8. MVCC tiếp tục bằng việc gửi yêu cầu kết thúc giao dịch đến Database.

  9. Cơ sở dữ liệu nhận yêu cầu kết thúc giao dịch từ MVCC và xác nhận rằng giao dịch đã kết thúc.

Như vậy, quá trình thực hiện xoá (delete) một bản ghi từ cơ sở dữ liệu thông qua MVCC bao gồm các bước bắt đầu giao dịch, thực hiện câu truy vấn DELETE, và kết thúc giao dịch, đảm bảo tính đồng thời và không xảy ra xung đột giữa các giao dịch khác nhau.

Quá trình thực hiện cập nhật (update) một bản ghi chi tiết vào cơ sở dữ liệu

sequenceDiagram
    participant Client as "Client"
    participant MVCC as "MVCC"
    participant Database as "Database"

    Client->>+MVCC: Bắt đầu giao dịch (Cập nhật bản ghi)
    MVCC->>+Database: Bắt đầu giao dịch (Cập nhật bản ghi)
    Database-->>-MVCC: Phản hồi (Giao dịch đã bắt đầu)

    Client->>+MVCC: UPDATE ChiTiet SET DiemSo = 90 WHERE ID = 1
    MVCC->>+Database: UPDATE ChiTiet SET DiemSo = 90 WHERE ID = 1
    Database-->>-MVCC: Phản hồi (Bản ghi ChiTiet đã được cập nhật)

    Client->>+MVCC: Kết thúc giao dịch (Cập nhật bản ghi)
    MVCC->>+Database: Kết thúc giao dịch (Cập nhật bản ghi)
    Database-->>-MVCC: Phản hồi (Giao dịch đã kết thúc)
  1. Client bắt đầu giao dịch bằng cách gửi một yêu cầu cập nhật bản ghi từ MVCC.

  2. MVCC nhận được yêu cầu từ Client và tiếp tục bằng việc gửi một yêu cầu cập nhật bản ghi đến Database.

  3. Database nhận được yêu cầu từ MVCC và xác nhận rằng giao dịch đã được bắt đầu.

  4. Client thực hiện câu truy vấn UPDATE để cập nhật bản ghi trong bảng ChiTiet. Trong ví dụ này, bản ghi có ID là 1 sẽ được cập nhật với giá trị mới của trường DiemSo90.

  5. MVCC nhận câu truy vấn UPDATE từ Client và tiếp tục gửi nó đến Database.

  6. Database thực hiện cập nhật bản ghi trong bảng ChiTiet dựa trên câu truy vấn UPDATE đã cho và sau đó gửi phản hồi cho MVCC để thông báo rằng bản ghi đã được cập nhật.

  7. Client kết thúc giao dịch bằng cách gửi một yêu cầu kết thúc giao dịch đến MVCC.

  8. MVCC tiếp tục bằng việc gửi yêu cầu kết thúc giao dịch đến Database.

  9. Database nhận yêu cầu kết thúc giao dịch từ MVCC và xác nhận rằng giao dịch đã kết thúc.

Quá trình thực hiện cập nhật (update) một bản ghi trong cơ sở dữ liệu thông qua MVCC bao gồm các bước bắt đầu giao dịch, thực hiện câu truy vấn UPDATE và kết thúc giao dịch, đảm bảo tính đồng thời và không xảy ra xung đột giữa các giao dịch khác nhau.

Quá trình thực hiện đọc (read) dữ liệu từ cơ sở dữ liệu

sequenceDiagram
    participant Client as "Client"
    participant MVCC as "MVCC"
    participant Database as "Database"

    Client->>+MVCC: Bắt đầu giao dịch (Đọc dữ liệu)
    MVCC->>+Database: Bắt đầu giao dịch (Đọc dữ liệu)
    Database-->>-MVCC: Phản hồi (Giao dịch đọc đã bắt đầu)

    Client->>+MVCC: SELECT * FROM ChiTiet WHERE SinhVienID = 1
    MVCC->>+Database: SELECT * FROM ChiTiet WHERE SinhVienID = 1
    Database-->>-MVCC: Phản hồi (Kết quả truy vấn)

    Client->>+MVCC: Kết thúc giao dịch (Đọc dữ liệu)
    MVCC->>+Database: Kết thúc giao dịch (Đọc dữ liệu)
    Database-->>-MVCC: Phản hồi (Giao dịch đọc đã kết thúc)
  1. Client bắt đầu một giao dịch đọc dữ liệu và gửi yêu cầu đến MVCC.

  2. MVCC tiếp tục gửi yêu cầu đọc dữ liệu đến Database.

  3. Database xử lý yêu cầu và trả kết quả (dữ liệu) về MVCC.

  4. MVCC trả kết quả đọc dữ liệu cho Client.

  5. Cuối cùng, Client kết thúc giao dịch đọc dữ liệu.

Trong quá trình này, Client yêu cầu đọc dữ liệu từ cơ sở dữ liệu thông qua MVCC, và sau đó MVCC làm trung gian để gửi yêu cầu đến Database. Kết quả của truy vấn là dữ liệu được trả về từ cơ sở dữ liệu thông qua MVCC. Sau khi giao dịch đọc dữ liệu hoàn tất, Client kết thúc giao dịch.

Ưu điểm của MVCC

  1. Cung cấp khả năng đồng thời bằng cách cho phép nhiều giao dịch diễn ra cùng lúc.
  2. Mỗi giao dịch độc lập với các giao dịch khác.
  3. Tạo ra nhiều phiên bản của cơ sở dữ liệu, cung cấp khả năng khôi phục dữ liệu trong thời gian thực.

Nhược điểm của MVCC

  1. MVCC cần nhiều bộ nhớ hơn và có thể phức tạp hơn cơ sở dữ liệu thông thường.
  2. Chúng có thể chậm hơn do xử lý một số truy vấn cùng một lúc.
  3. Các phiên bản cũ của dữ liệu có thể không được xóa khỏi cơ sở dữ liệu, dẫn đến việc tăng kích thước cơ sở dữ liệu.