Tìm hiểu về RAID server - Redundant Arrays of Inexpensive Disks

Bài viết liên quan

Raid là gì?
– RAID server là viết tắt của Redundant Arrays of Inexpensive Disks, là hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng có chức năng gia tăng tốc độ đọc/ghi dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên.

– Cách thức hoạt động của RAID server là sao chép dữ liệu lên hai hoặc nhiều ổ cứng vật lý được liên kết với nhau bằng 1 RAID Controller. RAID Controller có thể dựa trên một trong 2 nền tảng phần cứng hoặc phần mềm. Hầu hết các loại RAID khác nhau đều sử dụng kỹ thuật hạn chế lỗi gọi là dữ liệu ‘chẵn lẻ’ cho phép khả năng chịu lỗi (fault tolerance) khi dữ liệu được nhân đôi Nhờ vậy mà có thể giảm tác động của việc mất dữ liệu khi gặp phải lỗi phần cứng.

– RAID có thể được sử dụng cho các ổ đĩa SATA, SAS và SSD.
– Có nhiều cách cài đặt RAID server khác nhau. Mỗi một loại RAID lại phục vụ một mục tiêu khác nhau dựa trên những nhu cầu cụ thể để giải quyết các yêu cầu nhất định như:

Độ tin cậy của dữ liệu/ Data Reliability  – đảm bảo dữ liệu không có lỗi.
Tính sẵn sàng của dữ liệu/ Data Availability – đảm bảo dữ liệu khả dụng ngay cả trong trường hợp lỗi phần cứng.
Hiệu suất dữ liệu/ Data Performance – đảm bảo truy cập dữ liệu nhanh chóng cho cả hoạt động đọc và ghi.
Dung lượng dữ liệu/ Data Capacity – đảm bảo khả năng lưu trữ lượng dữ liệu lớn

Phân biệt raid mềm và raid cứng:
– RAID phần mềm có hiệu suất thấp, vì tiêu tốn tài nguyên từ máy chủ. Phần mềm RAID cần tải để đọc dữ liệu từ các disk. Trước khi tải dữ liệu, hệ điều hành cần khởi động để tải phần mềm RAID.

– RAID phần cứng có hiệu suất cao. Chúng là bộ điều khiển RAID chuyên dụng được xây dựng vật lý bằng cách sử dụng thẻ PCI express. Nó sẽ không sử dụng tài nguyên máy chủ. Nó có NVRAM cho bộ nhớ cache để đọc và ghi. Lưu trữ bộ nhớ cache trong khi xây dựng lại ngay cả khi mất điện, nó sẽ lưu trữ bộ nhớ cache bằng cách sử dụng các bản sao lưu nguồn pin.Thẻ RAID phần cứng sẽ giống như bên dưới:

Các raid thường dùng phổ biến hiện nay cho máy chủ:
RAID có nhiều Cấp độ khác nhau. Ở đây chúng ta sẽ chỉ thấy các Mức RAID được sử dụng chủ yếu trong môi trường thực.
RAID0 = Striping
RAID1 = Mirroring
RAID5 = Single Disk Distributed Parity
RAID6 = Double Disk Distributed Parity
RAID10 = Combine of Mirror & Stripe (RAID lồng nhau)

RAID 0:
– Raid 0 cần tối thiểu hai đĩa cứng, RAID 0 cho phép máy tính ghi dữ liệu theo phương thức đặc biệt được gọi là Striping. Ví dụ bạn có 8 đoạn dữ liệu được đánh số từ 1 đến 8, các đoạn đánh số lẻ (1,3,5,7) sẽ được ghi lên đĩa cứng đầu tiên và các đoạn đánh số chẵn (2,4,6,8) sẽ được ghi lên đĩa thứ hai, giúp giảm một nửa thời gian làm việc theo lý thuyết
Tổng quát là với n đĩa cứng thì mỗi đĩa chỉ cần phải đọc/ghi 1/n lượng dữ liệu được yêu cầu. Lý thuyết thì tốc độ sẽ tăng n lần..

Tuy vậy RAID 0 lại có nguy cơ mất dữ liệu cao, nguyên nhân chính nằm ở cách ghi thông tin xé lẻ vì như vậy dữ liệu không nằm hoàn toàn ở một đĩa cứng nào và mỗi khi cần truy xuất thông tin (ví dụ một file nào đó), máy tính sẽ phải tổng hợp từ các đĩa cứng. Chỉ cần một đĩa cứng gặp trục trặc thì thông tin (file) đó coi như không thể đọc được và hư hoàn toàn dữ liệu.

– Dung lượng cuối cùng của hệ thống RAID 0 bằng tổng dung lượng của các ổ đơn (hai ổ 80GB chạy RAID 0 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 160GB).
– Có thể thấy RAID 0 thực sự thích hợp cho những người dùng cần truy cập nhanh khối lượng dữ liệu lớn, ví dụ các game thủ hoặc những người chuyên làm đồ hoạ, video số.

RAID 1:
– Đây là dạng RAID server cơ bản nhất có khả năng đảm bảo an toàn dữ liệu. Cũng giống như RAID 0, RAID 1 đòi hỏi ít nhất hai đĩa cứng để làm việc. Dữ liệu được ghi vào 2 ổ giống hệt nhau (Mirroring). Trong trường hợp một ổ bị trục trặc, ổ còn lại sẽ tiếp tục hoạt động bình thường.

– Người dùng có thể thay thế ổ đĩa bị hỏng mà không phải lo lắng đến vấn đề thông tin thất lạc. Đối với RAID 1, hiệu năng không phải là yếu tố hàng đầu nên chẳng có gì ngạc nhiên nếu nó không phải là lựa chọn số một cho những người say mê tốc độ. Tuy nhiên đối với những nhà quản trị mạng hoặc những ai phải quản lý nhiều thông tin quan trọng thì hệ thống RAID 1 là thứ không thể thiếu. Dung lượng cuối cùng của hệ thống RAID 1 bằng dung lượng của ổ đơn (hai ổ 80GB chạy RAID 1 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 80GB).

RAID 5:
– Raid 5 cũng là một loại Raid được phổ biến khá rộng rãi. Nguyên tắc cơ bản của Raid 5 cũng gần giống với 2 loại raid lưu trữ truyền thống là Raid 1 và Raid 0. Tức là cũng có tách ra lưu trữ các ổ cứng riêng biệt và vẫn có phương án dự phòng khi có sự cố phát sinh đối với 1 ổ cứng bất kì trong cụm.

– Để setup Raid 5 ta cần tối thiểu 3 ổ cứng. Theo như hình minh họa phương án lưu trữ của Raid 5 như sau. Giả sử có 1 file A thì khi lưu trữ sẽ tách ra 3 phần A1, A2, A3. Ba phần nãy sẽ tương ứng lưu trên ổ đĩa Disk 0, Disk 1, Disk 2, còn ổ đĩa Disk 3 sẽ giữ bản sao lưu backup của 3 phần này. Tương tự các file sau cũng vậy và tùy theo tiến trình thực hiện mà bản sao lưu có thể được lưu ở bất kì 1 trong những ổ trong cụm Raid. Raid server có hiệu suất cao, an toàn dữ liệu, tiết kiệm chi phí. Chi phí phát sinh thêm 1 ổ so với hình thức lưu trữ thông thường. (tổng dung lượng ổ cứng sau cùng sẽ bằng tổng dung lượng đĩa sử dụng trừ đi 1 ổ. Giả sử bạn có 4 ổ 500GB thì dung lượng sử dụng sau cùng khi triển khai Raid 5 bạn chỉ còn 1500GB).

RAID 6:
– RAID 6 giống như RAID 5 với hệ thống phân tán hai chẵn lẻ. Chủ yếu được sử dụng trong một số lượng lớn các mảng. Chúng ta cần tối thiểu 4 disk, ngay cả khi 2 disk bị lỗi chúng ta vẫn có thể xây dựng lại dữ liệu trong khi thay thế các ổ mới.

– RAID 6 chậm hơn RAID 5, vì nó ghi dữ liệu vào cả 4 trình điều khiển cùng một lúc. Nếu chúng ta có 6 số ổ cứng 1TB, 4 ổ sẽ được sử dụng cho dữ liệu và 2 ổ sẽ được sử dụng cho Parity. Raid 6 có hiệu suất thấp. Hiệu suất ghi sẽ kém nếu không sử dụng RAID Phần cứng. Tuy nhiên khả năng chịu lỗi của raid 6 rất cao. Có thể được sử dụng trong mục đích sao lưu, phát trực tuyến video, được sử dụng trên quy mô lớn.

RAID 10:
– Raid 10 là sự kết hợp giữa 2 loại raid phổ biến và Raid 1 và Raid 0. Để setup Raid 10 khách hàng cần sử dụng tối thiểu 4 ổ cứng (Disk 0, Disk 1, Disk 2, Disk 3). Đối với Raid 10 dữ liệu sẽ được lưu đồng thời vào 4 ổ cứng. 2 ổ dạng Striping (Raid 0) và 2 ổ (Mirroring) Raid 1.

– Đây là 1 hình thức lưu trữ nhanh và an toàn, vừa nâng cao hiệu suất mà lại đảm bảo dữ liệu không bị thất thoát khi 1 trong số 4 ổ cứng bị hỏng. Tuy nhiên chi phí cao. Đối với Raid 10 dung lượng sẵn sàng sử dụng chỉ bằng ½ dung lượng của 4 ổ. (giống như raid 1).

RAID 50:
– Là sự kết hợp hoàn hảo giữa Raid 5 và Raid 0, dữ liệu được ghi lần đầu theo cơ chế Raid 0 nhưng lại được chia theo cơ chế Raid 5 ở lần ghi thứ hai. Nhờ vậy loại Raid server này vẫn đảm bảo tốc độ truy vấn rất tốt tương tự như RAID 10 nhưng lại tận dụng dung lượng ổ cứng tốt hơn Raid 10 rất nhiều.


Chia sẻ bài viết

Author:

Mong rằng những bài viết được viết và tổng hợp trên blog này sẽ cung cấp những thông tin hữu ích đến bạn. Chúc một ngày vui vẻ !

0 comments: