LỰA CHỌN CÔNG NGHỆ LƯU TRỮ TRONG TRUYỀN HÌNH
TỔNG QUAN VỀ THỊ TRƯỜNG LƯU TRỮ
Trong những năm gần đây nội dung số đã chuyển biến mạnh mẽ theo mọi
phương diện, do vậy nó đòi hỏi những hệ thống lưu trữ mạnh mẽ để có thể
đáp ứng được yêu cầu nở rộ về nội dung số. Hãng nghiên cứu và phân tích
thị trường nổi tiếng thế giới Frost-Sullivan đã nhận thấy thị trường lưu
trữ sẽ tăng trưởng mạnh mẽ trong những năm tới. Trong năm 2007 tổng
doanh thu toàn thị trường là gần 26 tỷ đô la Mỹ và sẽ có mức tăng trưởng
hàng năm ít nhất là hai con số và doanh thu đạt mức 50 tỷ Đô là Mỹ đến
năm 2013.
Động lực dẫn đến sự tăng trưởng mạnh mẽ này là do yêu cầu của ngành
công nghệ giải trí đang trong giai đoạn chuyển đổi sang số. Sự tăng
trưởng này dẫn đến việc các nhà sản xuất sẽ đẩy mạnh việc phát triển và
thiết kế ra các hệ thống lưu trữ chuyên nghiệp để đáp ứng được các yêu
cầu tăng trưởng này. Mặc dù lợi nhuận và sự sôi động trong trong lĩnh
vực cung cấp các giải pháp lưu trữ, khách hàng vẫn còn phải chịu đựng
những thách thức lớn.
THÁCH THỨC CỦA THỊ TRƯỜNG VÀ NHỮNG BẤT CẬP TỪ PHÍA KHÁCH HÀNG
Do xu hướng số hóa nội dung đang diễn ra mạnh mẽ trên toàn cầu, các
định dạng phong phú về âm thanh, hình ảnh, hoạt hình và các ảnh độ phân
giải cao đang được giao dịch mạnh mẽ trên mọi phương diện, do vậy hệ
thống lưu trữ hiện tại đang trở nên hạn chế về mặt kiến trúc. Điều nàu
sẽ tạo ra độ phức tạo gây nhiều trở ngại đối với khách hàng. Khách hàng
thường xuyên phải quan tâm đến yêu cầu trang bị hệ thống lưu trữ để
tăng cường về mặt dung lượng, độ ổn định, tính tương thích và danh sách
dài các yêu cầu về hoạt động.
Yêu cầu lưu trữ và bảo quản nội dung số là cấp bách do hai lý do sau:
yêu cầu tính pháp lý và vận hành. Về phía các doanh nghiệp thì sự đồng
thuận và quy trình kinh doanh là lý do hiển nhiên là lý do hiển nhiên để
dịch chuyển sang thị trương truyền thông giải trí.
Luật pháp quy định những Đài truyền hình phải bảo vệ và chịu trách
nhiệm đối với tất cả nội dung. Nội dung được tạo ra trong quá khứ có thể
được phát lại và vì vậy cần phải bảo vệ. Vai trò của việc nạp tín hiệu,
lưu trữ và phát sóng các nội dung có thể gặp trở ngại. Các thách thức
này bao gồm việc hoạch định về cơ sở hạ tầng cho các thiết bị và lựa
chọn giải pháp lưu trữ để tích hợp với cơ sở hạ tầng thiết bị đó. Điều
này sẽ bảo đảm quy trình sẽ trở nên trôi chảy và tích hợp với các thành
phần trong quy trình một cách trơn tru, vì thế hệ thống lưu trữ bây giờ
đã trở thành trung tâm của bất kỳ quy trình nào.
MÔ HÌNH GIÁ TRỊ CỦA TƯ LIỆU SỐ
Các cơ quan, tổ chức đều có nhu cầu về lưu trữ do 02 đặc điểm sau:
- Trong các tổ chức và nhóm làm việc luôn có truy nhập dữ liệu theo yêu
cầu tới dữ liệu theo mọi loại hình cạnh tranh và hiệu quả.
- Việc bảo vệ dữ liệu dựa trên nền tảng IP trong doanh nghiệp do vậy việc để mất dữ liệu sẽ là thảm họa.
Để nhận biết được hai yêu cầu trên, người dùng thường sử dụng các hệ
thống sử dụng công nghệ virtualization và RAID. Virtualization sẽ giúp
cho công tác quản lý và hệ thống lưu trữ dữ liệu trong khi công nghệ
RAID giúp bảo vệ độ an toàn cho dữ liệu. Tuy nhiên cả hai phương án trên
đều có những hạn chế sẽ liệt kê như sau:
Hạn chế với công nghệ Virtualization
Khi nhu cầu về lưu trữ lớn thì khả năng mở rộng hệ thống lưu trữ là yêu
cầu quan trọng. Tuy nhiên việc tăng cường lưu trữ đồng nghĩa với việc
tăng độ phức tạp của hệ thống trong hầu hết mọi trường hợp do vậy khả
năng quản lý hệ thống sẽ hạn chế hơn. Để nhận biết được quá trình quản
lý hệ thống cồng kềnh phức tạp nhiều người dùng chỉ xem việc công nghệ
quản lý ảo virtualization như là lựa chọn.
Virtualization giúp người quản lý hệ thống nhận biết, dự trữ và quản lý
các hệ thống lưu trữ riêng biệt như là một tài nguyên thống nhất, do
vậy nó cũng sẽ phát sinh việc chia sẻ các vấn đề nghiêm trọng. Các lớp
ảo thêm vào sẽ làm tăng độ phức tạp của hệ thống có sẵn và không nhận
biết được tính tương thích và tương tác. Dựa trên công nghệ này giúp cho
nhà quản lý lưu trữ có khả năng quản lý các tài nguyên lưu trữ từ một
điểm đơn, khi bất kỳ một phần nào của hệ thống bị sự cố thì nó cần được
can thiệp thủ công. Vì vậy khi hệ thống được quản lý dựa trên công nghệ
ảo hóa virtualized thì sẽ rất khó để hủy bỏ một quá trình.
Thêm vào đó trong môi trương thông tin về dữ liệu Metadata được quản lý
ảo hóa thì metadata mô tả dữ liệu lưu trữ, khi bị mất metadata thì
không thể khắc phục được. Cách quản lý metadata hiệu quả sẽ bị ảnh hưởng
đến toàn bộ hoạt động của hệ thống trong môi trường ảo hóa. Khi thị
trường truyền thông giải trí đang chuyển mạnh mẽ sang hướng theo theo
yêu cầu on-demand thì yêu cầu về metadata và khả năng cập nhật metadata
nhanh là điều rất quan trọng để giảm thiểu thời gian xử lý. Điều này sẽ
gây ảnh hưởng đến hoạt động của do yêu cầu về băng thông và khi hệ thống
trở nên phức tạp hơn.
Hạn chế của công nghệ RAID
Hệ thống sử dụng công nghệ RAID có đặc điểm là độ phức tạp cao và càng
trở lên phức tạp hơn khi người dùng muốn mở rộng hệ thống của họ để lưu
trữ nhiều dữ liệu và nhiều file lớn hơn. Để đặt được độ tin cậy, tính
sẵn sàng, độ an toàn không bị lỗi trong khi vẫn bảo đảm hoạt động của hệ
thống là nhiệm vụ khó thực hiện.
Trong hệ thống RAID, các ổ cứng có cùng dung lượng và sẽ càn thời gian
dài để khôi phục lại tư liệu khi ổ cứng gặp sự cố. Điều này làm ảnh
hưởng nghiêm trọng đến hệ thống trong suốt quá trình khôi phục lại tư
liệu do hoàn toàn có khả năng các ổ cứng khác cũng sẽ bị sự cố trong quá
trình khôi phục đó. Hoạt động của toàn bộ hệ thống lưu trữ luôn là một
vấn đề lớn và phải cân nhắc đánh đổi giữa việc bảo vệ khôi phục tư liệu
khả năng ghi, đọc khi các ổ cứng bị sự cố. Khi ổ cứng gặp sự cố hoạt
động của toàn bộ hệ thống sẽ bị ảnh hưởng do các tài nguyên trong hệ
thống phải phân chia cho quá trình khôi phục lại tư liệu. Trong suốt quá
trình này khả năng ghi/đọc vào trong hệ thống RAID sẽ bị gián đoạn.
Khả năng mở rộng của hệ thống như đề cập ở bên trên sẽ làm tăng độ phức
tạp và ảnh hưởng đến độ tin cậy. Khi hệ thống mở rộng, các ổ cứng và bộ
điều khiển RAID sẽ thêm vào, thì thời gian xảy ra giữa các sự cố trở
thành mối lo ngại lớn hơn đối với việc quản lý lưu trữ. Mối lo ngại dựa
trên thực tế là thời gian xảy ra sự cố của toàn bộ hệ thống nhỏ hơn thời
gian xảy ra các sự cố của các thành phần trong hệ thống có độ ổn định
thấp hơn như ổ cứng và bộ điều khiển.
Mặc dù các hệ thống lưu trữ sử dụng công nghệ RAID hay Virtualization
vẫn mang đến các lợi ích ở điểm nào đó, nhưng độ phức tạp sẽ gây nên
nhiều thách thức đối với công tác quản lý, độ mở rộng hệ thống, hoạt
động của hệ thống, tính tương tác và sự cố của hệ thống.
Như đã phân tích ở phần trên, yêu cầu người dùng luôn đòi hỏi và các
nhà sản xuất tiếp tục cải tiến hệ thống lưu trữ để vượt qua các thách
thức trên. Omneon là một trong số các nhà sản xuất hệ thống lưu trữ như
vậy. Công ty tiếp tục phát triển các sản phẩm về hệ thống server lưu trữ
trong ngành truyền hình. Phần tiếp theo sẽ trình bày giải pháp của
Omneon nhằm vượt qua các thách thức do các công nghệ RAID và
virtualization tạo ra.
PHẢN HỒI TỪ PHÍA NHÀ CUNG CẤP
Tóm lược giải pháp: Hệ thống lưu trữ MediaGrid.
Mô hình hệ thống lưu trữ Nearline - Omneon MediaGrid.
Hệ thống lưu trữ MediaGrid được thiết kế dựa trên cấu trúc file hệ
thống phân tán làm tăng cường khả năng tương tác giữa các node trong hệ
thống mạng lưới. Mỗi nút đều tham gia trong quá trình lưu và phục hồi tư
liệu lưu trữ và mỗi cá nhân lấy dữ liệu yêu cầu ra khỏi hệ thống từ vài
nút. Hệ thống được xấy dựng để xử lý các file video, media với kích
thước lớn do Omneon đã có kinh nghiệm làm việc với tư liệu Video trong
nhiều thập kỷ qua.
Trong hệ thống MediaGrid các file sẽ được dàn trải đều trên các nút
trong hệ thống do vậy cho phép cac file được nhiều ứng dụng truy cập. Do
kiến trúc phân tán lên mối máy trạm có thể truy nhập vào các file hay
dữ liệu mà không gây ảnh hưởng đến băng thông của các máy trạm khác.
Điều này thường gặp phải trong các hệ thống NAS và SAN thông thường, khi
nhiều máy trạm truy nhập vào hệ thống thì băng thông khả dụng của hệ
thống sẽ bị giảm.
Hệ thống MediaGrid hoạt động như thế nào?
Hệ thống MediaGrid bao gồm hai thành phần chính sau đây:
- Máy chủ quản lý Content Director - Hoạt động như là bộ quản lý file hệ thống.
- Máy chủ lưu trữ tư liệu ContentServer - cho phép truy nhập vào nội dung trên hệ thống lưu trữ.
Máy chủ quản lý - Content Director
Để truy nhập vào các file, thì yêu cầu sẽ gửi đến máy chủ Content Director, máy chủ sẽ tham chiếu tới một hay vài máy chủ lưu trữ
nội dung Content Server. Máy chủ Content Director quản lý toàn bộ hoạt
động của hệ thống MediaGrid và làm cho hệ thống lưu trữ như là một hệ
thống file ảo đồng nhất.
Như đã đề cập bên trên, máy chủ Content Director sử dụng thuật toán
quản lý việc ghi/đọc dữ liệu từ các máy trạm đến các máy chủ lưu trữ nội
dung Content Servers. thuật toán này sẽ làm cân bằng giữa dung lượng và
lưu lượng của hệ thống nhằm loại bỏ hiện tượng nghẽn cổ chai thường thấy
trong các hệ thống lưu trữ NAS hay NAS clustered.
Để bảo đảm độ ổn định tin cậy của hệ thống, trong mỗi hệ thống
MediaGrid đều sử dụng hai hay nhiều hơn các máy chủ quản lý
Content Directors. Các máy chủ Content Directors trong mỗi hệ thống
MediaGrid sẽ liên lạc đồng bộ thường xuyên với các máy chủ
Content Director khác. Trong trường hợp một bộ bị sự cố các máy chủ còn
lại tiếp tục hoạt động để xử lý yêu cầu của các máy trạm mà không làm
ảnh hưởng gián đoạn yêu cầu truy nhập.
Máy chủ lưu trữ nội dung - Content Server
Máy chủ lưu trữ nội dung Content Server là thiết bị lưu trữ thông minh
nhằm cung cấp dung lượng lưu trữ và băng thông cho hệ thống. Có nhiều
loại máy chủ nội dung Content Server khác nhau: Loại băng thông lớn, loại
dung lượng lưu trữ lớn, loại cấu hình hoạt động cao, liên kết trong một
hệ thống sẽ tạo ra một hệ thống lưu trữ phân tầng có thiết kế.
Các thành phần khác trong hệ thống
GridPass: là driver hệ thống cài trong mỗi máy trạm làm việc và để các
máy trạm có thể truy nhập xuyên suốt và trong hệ thống MediaGrid thông
qua hoạt động của các file hệ thống tiêu chuẩn. GridPass hỗ trợ hệ điều
hành Windows Server, Windows XP, Vista, Windows 7 (mới), MAC, LINUX... Khi người dung lưu hay lấy file từ MediaGrid thì thao tác tương tự
như đối với các hệ thống lưu trữ kết nối mạng. Các ứng dụng của người
dung chạy trên các máy trạm đều truy nhập vào trong hệ thống MediaGrid
màn không cần sửa đổi.
Máy chủ quản lý giao tiếp - Content Bridge: Theo thời gian khi việc sử dụng GridPass không thực hiện được thì các
máy trạm có thể kết nối với giao thức file hệ thống trên mạng như: FTP,
CIFS, AFP và NFS thông qua máy chủ quản lý giao tiếp Content Bridge. Mỗi
Content Bridge có thể hỗ trợ nhiều máy trạm truy nhập dữ liệu cùng lúc và
nhiều Content Bridge trong hệ thống sẽ làm tăng cường băng thông, số
lượng máy trạm truy nhập vào hệ thống và làm tăng tính dự phòng giữa các
Content Bridge.
Bộ quản lý hệ thống - System Manager: Như tên mô tả thì System Manager xử lý chức năng quản trị hệ thống
MediaGrid, bao gồm cấu hình, kết nối, bảo mật, quản lý lỗi, hoạt động.
Quản lý nội dung - Content Manager: Là ứng dụng chạy trên nền Windows để thiết lập, xem lại,
thay đổi các thuộc tính của file, đường dẫn hay quyền hạn người dùng
trong hệ thống MediaGrid. Content Manager cung cấp đặc tính Logging để
giải quyết các vấn đề hệ thống. Mức độ ghi nhật ký Log sẽ được thiết lập
trong mỗi sự kiện lớn hay nhỏ trong file hệ thống đẻ có thể nhanh chóng
nhận biết được các lỗi và vấn đề.
Hệ thống MediaGrid giải quyết được các vấn đề trong các hệ thống lưu trữ truyền thống
Sử dụng công nghệ nhân bản dữ liệu động Dynamic Data Replication (DDR)
là yếu tố chính. Hệ thống lưu trữ của Omneon được thiết kế để hoạt động
trong môi trường truyền hình chuyên nghiệp với những đáp ứng cho các nội
dung đòi hỏi về thời gian truy cập. Công nghệ DDR tự động lưu giữ nhiều
bản copies của dữ liệu phân bố trên nhiều nút.
Khi dữ liệu ghi vào trong hệ thống MediaGrid, nội dung sẽ được phân
mảnh thành nhiều đoạn segments. Để tăng tốc quá trình xử lý các phân
mảnh dữ liệu này thì các phân mảnh được phân bố thông minh lên các máy
chủ lưu trữ nội dung Content Servers và sau đó được nhân bản lên trên
nhiều Content Server để bảo vệ dữ liệu. Nhờ công nghệ DDR việc nhân bản
có thể được thực hiện một cách linh động trên mỗi đường dẫn thư mục hay
trên các file. Điều này cho phép đảm bảo băng thông truy nhập, tính linh
hoạt của hệ thống lưu trữ đáp ứng tuyệt vời cho các nội dung số về mặt
thời gian và yêu cầu truy nhập.
Công nghệ DDT mang đến khả năng bảo đảm an toàn dữ liệu toàn diện vì hệ
thống không tính đến việc một file lưu trữ thành công trên hệ thống cho
đến khi nó có ít nhất một bản sao. Số lượng các bản sao có thể thay đổi
được dựa trên yêu cầu về số lượng đặt trên nhiều vị trí. Điều này cho
phép việc phục hồi dữ liệu nhanh hơn khi một ổ cứng hay thành phần nào
xảy ra sự cố.
Khi lỗi xuất hiện thì bản sao của dữ liệu bị mất sẽ tự động tìm kiếm và
sao chép trong khi đó đối với các hệ thống ảo hóa thì cần phải can
thiệp thủ công để sao chép. Cửa sổ cảnh báo nguy hiểm sẽ đóng lại ngay
sao khi hoàn thành sao chép các bản sao.
Quản lý mở rộng hệ thống là vấn đề phức tạo như đã nêu ra ở phân trên.
Hệ thống MediaGird là hệ thống Modular dựa trên cấu trúc mạng lưới do đó
hỗ trợ khả năng mở rộng. Nó tổng hợp dung lượng từ nhiều Content Server
được kết nối trên môi trường mạng. Do vậy theo lý thuyết hệ thống không
có hạn chế về mặt dung lượng. Hệ thống MediaGrid đã được mở rộng từ vài
Terabyte lên tới 300 Terabyte trong một hệ thống đơn. Dung lượng lưu
trữ và băng thông của hệ thống có thể được mở rộng màn không mất thời
gian tắt hệ thống. Điều này đã được chúng minh khi nâng cấp phần mềm
được thực hiện online. Quá trình phục hồi tư liệu từ các ổ cứng hay các
nút bị lỗi là hoàn toàn tự động và xuyên suốt.
MediaGrid cho phép mở rộng hệ thống lưu trữ mà không ảnh hưởng đến quy
trình. Phần cứng bị sự cố không ảnh hưởng đến hoạt động và gây mất dữ
liệu vì nội dung được lưu trữ trên nhiều vị trí khác nhau. Trong trường
hợp một ổ cứng hỏng, hệ thống MediaGrid sẽ tự động khôi phục dữ liệu mất
bằng cách nhân bản lại từ các bản sao mà không làm mất thời gian thay
thế ổ cứng.
Hơn thế nữa do sử dụng kiến trúc mạng lưới nên hệ thống hỗ trợ khả năng
xử lý theo kiến trúc mạng lưới, mỗi nút trong hệ thống đều chứa dung
lượng nhất định và khả năng xử lý nhất định. Sản phẩm này đã đáp ứng
với các ứng dụng chạy trên nhiều bộ xử lý cho phép quá trình xử lý như
chuyển đổi mã hóa chạy ngay trong mạng lưới. Hệ thống Mediagrid đáp ứng
chức năng này bằng việc sử dụng giao diện phần mềm để tận dụng các quá
trình xử lý dự phòng ngay trong các máy chủ Content Servers.
Hệ thống lưu trữ MediaGrid đã ra đời từ năm 2006 và đã nhận được nhiều
phản hồi tích cực từ các Đài truyền hình và công ty sản xuất do áp ứng
dụng xu hướng thiết kế mới trong sản phẩm.
TỔNG HỢP VÀ KẾT LUẬN
Dựa trên các vấn đề phân tích nêu trên, các sản phẩm lưu trữ ngày nay
không chỉ là các thiết bị đóng vai trò như là kho lưu trữ tư liệu số mà
còn là giải pháp bảo đảm các quá trình xử lý an toàn và phân phối tư
liệu. Yêu cầu về hệ thống lưu trữ dựa trên nhiều nhiều yếu tố, chủng
loại dữ liệu lưu trữ, khoảng thời gian cần lưu trữ, số lượng người truy
nhập và dữ liệu. Mặc dù đã đưa ra nhiều phân tích như trên tuy nhiên
trong thực tế vẫn cồn nhiều yêu cầu mà vẫn chưa có câu trả lời.
Yêu cầu này đặt ra nhằm thúc đẩy các nhà cung cấp tiếp tục nghiên cứu để cung cấp giải pháp lưu trữ đáp ứng được các thách thức hiện tại.
Bản báo cáo này đề cập đến công nghệ RAID và Virtualization mang đến các
lợi ích nhất định nhưng cũng có những hạn chế. Những vấn đề phức tạp
trong hệ thống lưu trữ luôn là thách thức đối với các nhà cung cấp và
người dùng. Các nhà sản xuất tiên phong như Omneon MediaGrid đang thiết
lập giai đoạn mới để đưa công nghệ lưu trữ tiến lên các bước phát triển
tiếp theo và giảm bớt được các vấn đề bất cập từ phía khách hàng.
Kỹ sư Phạm Vinh Hiển
Phòng Kỹ thuật Dự án - Tekcast