Backup là một phần thiết yếu trong hoạt động của tổ chức vì dữ liệu là vô giá và không ai muốn xảy ra việc mất dữ liệu do sự cố phần mềm/hệ thống, lỗi phần cứng hay bất kỳ lý do nào khác. Tuy nhiên, nhiệm vụ backups này không hề dễ dàng do khối lượng dữ liệu và chi phí thiết bị lưu trữ tăng vọt, đó là lý do tại sao có nhiều chiến lược sao lưu giúp tối ưu hóa việc lưu trữ dữ liệu mà không tốn nhiều chi phí.
Differential backup
Trong phương pháp differential backup, các thay đổi đã được thực hiện kể từ lần thực hiện backup full/backup toàn bộ cuối cùng sẽ được sao chép lại toàn bộ. Bản backup full là bản chính và mỗi lần backup, quá trình sẽ kiểm tra dữ liệu hiện có với bản backup full và cập nhật phần dữ liệu đã thay đổi.
Theo nhiều cách, differential backup được xem như là một bước phát triển trong thế giới sao lưu vì giải pháp cung cấp một phương pháp để loại bỏ việc phải thực hiện sao lưu backup full mỗi lần rất tốn kém và mất thời gian.
Cách thức hoạt động:
Cùng xem xét một ví dụ như sau: Giả sử đã thực hiện backup full vào Chủ nhật. Đến thứ Hai, thực hiện đối chiếu các file với bản backup vào Chủ nhật và tải lên các file đã thay đổi. Vào thứ Ba, tiếp tục check các file so với bản sao lưu vào Chủ nhật và tải lên các file đã sửa đổi, v.v. Như có thể thấy từ ví dụ, chúng ta chỉ so sánh các thay đổi với bản backup full.
Ưu điểm
- Chỉ cần bản differential backup mới nhất và bản backup full là đủ để khôi phục dữ liệu.
- Triển khai linh hoạt hơn so với bản backup full.
- Giảm nguy cơ mất dữ liệu vì luôn có thể kiểm tra, đối chiếu với phiên bản trước.
Nhược điểm
- Phương pháp sao lưu này có thể chiếm không gian lưu trữ vì dữ liệu được so sánh với bản backup full và do đó, số lượng thay đổi sẽ tiếp tục tăng theo từng ngày.
- Không lý tưởng cho các tổ chức có khoảng trống thời gian dài giữa các lần backup full.
- Hình thức này rất tốn thời gian, đặc biệt nếu backup full không được thực hiện thường xuyên, vì quá trình sao lưu sẽ kiểm tra bản backup full cuối cùng, xác định nội dung đã thay đổi và tải lên toàn bộ.
Cái tên nói lên tất cả, trong phương pháp backup gia tăng, người dùng chỉ sao lưu những tệp đã thay đổi kể từ lần sao lưu cuối cùng. Điều này có nghĩa là dữ liệu được backup mỗi lần có thay đổi: thêm vào hoặc sửa đổi.
Ví dụ: đã thực hiện backup full vào Chủ nhật, và vào thứ Hai đối chiêu các file so với bản sao lưu vào Chủ nhật và tải lên các file đã thay đổi. Vào thứ Ba, tiếp tục đối chiếu các file với bản sao lưu vào thứ Hai và tải lên những file đã thay đổi, v.v.
Và như vậy, chúng ta thực hiện so sánh dữ liệu hiện có với bản incremental backup cuối cùng và tải lên nội dung đã thay đổi. Vì vậy, dữ liệu được sao lưu cuối cùng là tiêu chuẩn để so sánh. Với phương thức hoạt động như vậy, cách backup này cũng xuất hiện những ưu và nhược điểm nhất định.
Ưu điểm
- Chỉ nội dung đã thay đổi mới được sao lưu, do đó, cửa sổ sao lưu ngắn.
- Giải pháp lý tưởng cho xử lý dữ liệu nhạy cảm và nhu cầu sao lưu liên tục theo giờ.
Nhược điểm
- Khi cần khôi phục dữ liệu, phải khôi phục bản backup full và tất cả các bản sao tăng lên, việc này có thể tốn nhiều thời gian.
- Tăng nguy cơ mất dữ liệu từ các nguyên nhân hỏng hoặc mất disk lưu trữ bởi vì dữ liệu của một phiên bản cụ thể không có trong bất kỳ tệp sao lưu nào khác.
So sánh Incremental backup và Differential backup
Cả hai phương thức sao lưu đều dựa trên nguyên tắc là không phải tất cả dữ liệu đều thay đổi giữa các lần sao lưu, vì vậy việc chỉ tải lên dữ liệu đã thay đổi mỗi khi thực hiện sao lưu thay vì sao lưu toàn phần là lựa chọn hợp lý. Có thể thấy rõ ràng cách thức sao lưu này giúp tiết kiệm thời gian và dung lượng.
Một yếu tố quan trọng từ góc độ triển khai cần xem xét là bit lưu trữ. Khi thực hiện backup full, quá trình sẽ reset bit lưu trữ.
Tương tự như vậy, một incremental backup cũng sẽ reset bit lưu trữ mỗi lần, do đó chỉ các thay đổi được lưu, nhưng một bản differential backup sẽ không reset bit lưu trữ, vì vậy tất cả các khác biệt dữ liệu giữa bản backup full và dữ liệu hiện tại đều được sao chép.
Những khác biệt này được tóm tắt trong bảng dưới đây.
Incremental backup
|
Differential backup
|
Đối chiếu với lần incremental backup cuối cùng.
|
Đối chiếu với lần backup full cuối cùng
|
Backup nhanh chóng vì so sánh với bản incremental backup cuối cùng.
|
Chậm hơn vì phải so sánh với bản backup full cuối cùng rồi xác định tất cả các thay đổi.
|
Yêu cầu ít băng thông hơn khi upload vì phần dữ liệu đã thay đổi sẽ tương đối ít hơn.
|
Yêu cầu nhiều băng thông hơn incremental backup vì so sánh được thực hiện với dữ liệu backup full mỗi khi thực hiện.
|
Khôi phục dữ liệu sẽ cần backup toàn bộ dữ liệu và tất cả bản sao incremental.
|
Việc khôi phục dữ liệu chỉ cần bản backup full và bản sao differential cuối cùng.
|
Việc khôi phục chậm hơn, vì tất cả các bản sao phải được đối chiếu.
|
Việc khôi phục diễn ra nhanh hơn vì chỉ bản sao mới nhất phải được đối chiếu.
|
Reset lại bit lưu trữ.
|
Không phải reset lại bit lưu trữ.
|
Nguy cơ mất dữ liệu cao hơn.
|
Nguy cơ mất dữ liệu tương đối thấp hơn.
|
Bây giờ là vấn đề quyết định – phương thức nào tốt hơn? Incremental hay differential backup?
Câu trả lời sẽ phụ thuộc vào chiến lược sao lưu đặt ra, tần suất sao lưu, khả năng thay đổi dữ liệu, các điều khoản của thỏa thuận mức dịch vụ, tài nguyên có sẵn và tần suất khôi phục.
Chọn Incremental backup nếu:
- Khoảng thời gian giữa các lần backup full dài.
- Dung lượng bộ nhớ sắp hết.
- Muốn các cửa sổ sao lưu ngắn.
- Bạn đang xử lý dữ liệu nhạy cảm và muốn sao lưu từng giờ.
Mặt khác, hãy chọn Differential backup nếu:
- Không gian lưu trữ không phải là vấn đề.
- Việc sao lưu thường kéo dài cả đêm và không cản trở bất kỳ quá trình nào khác.
- Thời gian giữa các lần backup full ít hơn.
- Khôi phục dữ liệu nhanh chóng là một yêu cầu quan trọng.
Có thể thấy cả hai phương thức backup đều có những ưu điểm và nhược điểm riêng, việc lựa chọn chiến lược phù hợp sẽ tùy thuộc vào nhu cầu cụ thể của người dùng.