image banner
Thống kê truy cập
  • Đang online: 1
  • Hôm nay: 1
  • Trong tuần: 1
  • Tất cả: 1
Đề xuất các giải pháp bảo quản tài liệu lưu trữ số tại các cơ quan lưu trữ
Quá trình lưu trữ có thể được thực hiện theo nhiều cách: sử dụng các ổ đĩa gắn trực tiếp vào server cần lưu trữ, dùng các thiết bị lưu trữ ngoài hoặc xây dựng mạng dùng riêng cho việc lưu trữ dữ liệu. Phương pháp lưu trữ dùng các ổ đĩa gắn trực tiếp đã xuất hiện và được sử dụng từ rất lâu do tính dễ sử dụng của chúng. Cùng với sự phát triển của công nghệ, đặc biệt là yêu cầu của người dùng về dữ liệu lưu trữ (dung lượng, tốc độ, khả năng khôi phục dữ liệu, ảnh hưởng của lưu trữ đến hiệu năng của toàn hệ thống), nhiều phương pháp lưu trữ mới được phát triển. Mỗi phương pháp có những ưu nhược điểm riêng và được dùng cho những mục đích nhất định.

​ Quá trình lưu trữ có thể được thực hiện theo nhiều cách: sử dụng các ổ đĩa gắn trực tiếp vào server cần lưu trữ, dùng các thiết bị lưu trữ ngoài hoặc xây dựng mạng dùng riêng cho việc lưu trữ dữ liệu. Phương pháp lưu trữ dùng các ổ đĩa gắn trực tiếp đã xuất hiện và được sử dụng từ rất lâu do tính dễ sử dụng của chúng. Cùng với sự phát triển của công nghệ, đặc biệt là yêu cầu của người dùng về dữ liệu lưu trữ (dung lượng, tốc độ, khả năng khôi phục dữ liệu, ảnh hưởng của lưu trữ đến hiệu năng của toàn hệ thống), nhiều phương pháp lưu trữ mới được phát triển. Mỗi phương pháp có những ưu nhược điểm riêng và được dùng cho những mục đích nhất định.

I. MỘT SỐ THIẾT BỊ LƯU TRỮ CHUYÊN DỤNG

1DAS

DAS (Direct Attached Storage) dùng để chỉ các thiết bị lưu trữ gắn trực tiếp vào hệ thống cần lưu trữ (server, workstation). Ví dụ đơn giản nhất của DAS là ổ đĩa cứng lắp trong hoặc các ổ lắp ngoài của máy tính. Tính đến thời điểm này, DAS vẫn là phương pháp lưu trữ phổ biến nhất cho các hệ thống máy tính.

DAS được sử dụng phần lớn cho các người dùng đơn lẻ, hoặc những nơi mà yêu cầu về khả năng sẵn sàng của dữ liệu không quá cao.  Khả năng mở rộng của các thiết bị DAS không cao so với các phương pháp khác.

2. NAS

NAS (Network Attached Storage) là phương pháp lưu trữ dữ liệu sử dụng các thiết bị lưu trữ đặc biệt gắn trực tiếp vào trong mạng như một thiết bị mạng bình thường (tương tự máy tính, switch hay router). Các thiết bị NAS cũng được gắn các địa chỉ IP cố định và được client truy nhập thông qua sự điều khiển của server. Trong một số trường hợp, NAS có thể được truy cập trực tiếp không cần có sự quản lý của server. NAS có các ưu điểm sau:

Trong môi trường đa hệ điều hành với nhiều máy chủ khác nhau, việc lưu trữ dữ liệu, backup, quản lý hay áp dụng các chính sách security đều được thực hiện tập trung.

Khả năng mở rộng: khi người dùng cần thêm dung lượng lưu trữ, các thiết bị lưu trữ NAS mới có thể được bổ sung và lắp đặt vào mạng.

NAS tăng cường khả năng chống lại sự cố cho mạng. Trong môi trường DAS, khi một máy chủ chứa dữ liệu không hoạt động thì toàn bộ dữ liệu đó không thể sử dụng được. Trong môi trường NAS, dữ liệu vẫn hoàn toàn có thể được truy nhập bởi người dùng. Các biện pháp chống lỗi và dự phòng tiên tiến được áp dụng để bảo đảm NAS luôn sẵn sàng cung cấp dữ liệu cho người dùng.

Tuy có những điểm nổi trội so với các thiết bị DAS nhưng NAS vẫn có những hạn chế nhất định. Với việc sử dụng chung hạ tầng mạng với các ứng dụng khác, việc lưu trữ dữ liệu có thể ảnh hưởng đến hiệu năng của toàn hệ thống (làm chậm tốc độ của LAN), điều này đặc biết đáng quan tâm khi cần lưu trữ thường xuyên một lượng lớn dữ liệu.

3. SAN 

SAN (Storage Area Network) là một mạng riêng gồm các thiết bị lưu trữ được liên kết với nhau và liên kết với máy chủ (hoặc một nhóm các máy chủ) đóng vai trò như các điểm truy nhập trong SAN. Trong một số trường hợp, SAN cũng được kết nối với mạng LAN. SAN sử dụng các switch đặc biệt để kết nối các thiết bị với nhau.

Hệ thống SAN thường được chia làm hai mức: mức vật lý và logic. Mức vật lý mô tả sự liên kết các thành phần của mạng (edge switch, core switch, Host Bus Adapter - HBA, cable, firmware) tạo ra một hệ thống lưu trữ đồng nhất và có thể sử dụng đồng thời cho nhiều ứng dụng và người dùng. Mức logic bao gồm các ứng dụng, các công cụ quản lý và dịch vụ được xây dựng trên nền tảng của các thiết bị lớp vật lý, cung cấp khả năng quản lý hệ thống SAN.

Việc sử dụng một mạng riêng để kết nối các thiết bị lưu trữ với nhau có những ưu điểm nhất định so với các phương pháp khác. Cụ thể là:

Có khả năng backup dữ liệu với dung lượng lớn và thường xuyên mà không làm ảnh hưởng đến lưu lượng thông tin trên mạng.

Dữ liệu luôn ở mức độ sẵn sàng cao, không giống như DAS sử dụng các thiết bị lưu trữ trực tiếp gắn với server.

Dữ liệu được lưu trữ thống nhất, tập trung và có khả năng quản lý cao. Có khả năng khôi phục dữ liệu nếu có xảy ra sự cố.

Một số đặc điểm khác của hệ thống SAN:

Hỗ trợ nhiều giao thức, chuẩn lưu trữ khác nhau iSCSI, FCIP, DWDM.

Có khả năng mở rộng tốt trên cả phương diện số lượng thiết bị, dung lượng hệ thống cũng như khoảng cách vật lý.

Mức độ security cao do thực hiện quản lý tập trung cũng như sử dụng các công cụ hỗ trợ quản lý SAN.

II. CÁC GIẢI PHÁP SAO LƯU

Hệ thống CSDL dùng chung bảo đảm an toàn dữ liệu theo 3 phương thức cơ bản: sao lưu đầy đủ, sao lưu gia tăng và sao lưu khác biệt.

1. Sao lưu đầy đủ

Dùng để sao lưu tất cả các thông tin được chọn, không quan tâm đến việc thông tin đó được lưu trữ vào thời điểm nào và các lần sao lưu trước đó. Phương pháp này cho phép sao lưu đầy đủ nhất, nhưng tốn kém về thời gian và phương tiện sao lưu. Sao lưu đầy đủ chỉ thực hiện được khi ngừng toàn bộ hoạt động của hệ thống

2. Sao lưu gia tăng

Dùng để sao lưu tất cả các thông tin được chọn mà có sự thay đổi hoặc cập nhật so với lần sao lưu gần nhất trước đó. Phương thức này cho phép tiết kiệm tối đa thời gian, đồng thời cho phép thực hiện sao lưu trực tuyến trong khi hệ thống vẫn đang hoạt động, tuy nhiên khá phức tạp và sẽ tốn nhiều dung lượng lưu trữ trong trường hợp dùng cơ chế Logs của hệ thống.

3. Sao lưu khác biệt

Dùng để sao lưu tất cả các thông tin được chọn mà có sự thay đổi hoặc cập nhật so với lần sao lưu khác biệt hoặc đầy đủ gần nhất trước đó.

III. CHIẾN LƯỢC SAO LƯU

Chiến lược sao lưu là lựa chọn phương thức sao lưu, tần suất sao lưu dữ liệu của hệ thống. Việc hoạch định chiến lược sao lưu tối ưu phải phụ thuộc vào qui mô, tầm cỡ của hệ thống, độ quan trọng của dữ liệu và tính chất nghiệp vụ của hệ thống. Các yếu tố ảnh hưởng trực tiếp đến chiến lược sao lưu:

Quy mô, tầm cỡ của hệ thống: Hệ thống càng lớn, việc phục hồi dữ liệu càng khó khăn và hầu như không thể thực hiện được nếu không có sao lưu. Chi phí và thời gian dành cho việc sao lưu cũng sẽ tỷ lệ với độ lớn dữ liệu.

Độ quan trọng của dữ liệu: Dữ liệu càng quan trọng thì việc sao lưu càng phải được thực hiện nghiêm túc, tuân thủ chặt chẽ các quy định và quy trình sao lưu dữ liệu.

Tính trực tuyến của hệ thống: Thời gian làm việc của hệ thống, số giờ trong 1 ngày, số ngày trong 1 tuần. Tính trực tuyến của hệ thống ảnh hưởng trực tiếp đến việc quyết định thời gian và tần suất sao lưu dữ liệu.

Tính trực tuyến của dữ liệu: Tính trực tuyến của dữ liệu ảnh hưởng đến việc quyết định tần suất và phương thức sao lưu dữ liệu. Đối với những dữ liệu có tính trực tuyến cao, luôn luôn thay đổi, tần suất sao lưu dữ liệu cũng phải cao và việc sao lưu dữ liệu cũng phải hoạt động trực tuyến (có khả năng sao lưu dữ liệu mà không làm ngừng hoạt động của hệ thống).

Khả năng phục hồi dữ liệu: Là khả năng phục hồi lại dữ liệu khi không có sao lưu. Khả năng này phụ thuộc vào tính sẵn có của dữ liệu đầu vào, và phương thức cũng như thời gian nhận/nhập dữ liệu vào hệ thống.

1. Theo ngày

Chúng ta sử dụng backup on-line, cho phép thực hiện việc backup dữ liệu của hệ thống trong khi hệ thống vẫn đang hoạt động (người sử dụng vẫn có thể truy nhập bình thường trong quá trình backup).

Dữ liệu sẽ được lưu trữ ở file backup. Thông tin được lưu trữ bao gồm tất cả các object (bảng dữ liệu, cấu trúc dữ liệu, triggers, packages,...) của CSDL. Phương án này backup phần dữ liệu thay đổi trong ngày của CSDL.

Phương pháp backup này sử dụng công cụ Backup/Restore sẵn có của các hệ quản trị CSDL.

- Chu kỳ

Đối với dữ liệu hệ thống CSDL dùng chung thì: Mỗi ngày định kỳ một lần vào cuối ngày.

- Lưu trữ file backup

Chúng ta sử dụng 7 files khác nhau được gán tên có đánh số từ 1 đến 7, như vậy chúng ta sẽ có số liệu của 7 ngày làm việc gần nhất của hệ thống.

2. Theo tuần

Chúng ta cũng lựa chọn giải pháp backup on-line. Backup toàn bộ hệ thống CSDL dùng chung. Dùng phương án này chúng ta có được số liệu của toàn bộ cơ sở dữ liệu hàng tuần.

Phương pháp backup này sử dụng công cụ Backup/Restore sẵn có của các hệ quản trị CSDL.

- Chu kỳ

Mỗi tuần một lần vào cuối giờ làm việc của ngày thứ sáu, chúng ta thực hiện phương án backup này.

- Lưu trữ file backup

Chúng ta cũng sử dụng 4 files khác nhau được gán tên có đánh số từ 1 đến 4 để backup các datafiles.

3. Theo tháng

Đây là phương án backup toàn bộ hệ điều hành, chương trình ứng dụng và các CSDL dùng chung. Đây là giải pháp backup off-line, đòi hỏi hệ thống không còn các giao dịch kết nối, các CSDL dùng chung phải được shutdown.

Phương pháp backup này sử dụng công cụ System Tools/Backup của Windows Server.

- Chu kỳ

Mỗi tháng một lần vào cuối giờ làm việc của ngày thứ sáu tuần cuối cùng của tháng, chúng ta thực hiện phương án backup này.

- Lưu trữ file backup

Chúng ta cũng sử dụng 12 files khác nhau được gán tên có đánh số từ 01 đến 12 để backup toàn bộ thông số của hệ điều hành.

4. Sao lưu để lưu trữ

Mô hình này để giải quyết khả năng đọc về lâu dài của tài liệu lưu trữ điện tử (khả năng truy cập) bằng cách sử dụng giải pháp kỹ thuật cụ thể để chuyển đổi khuôn thức của tài liệu được hình thành bởi các phần cứng và phần mềm khác nhau thành các tài liệu có cùng khuôn thức.

5. Sao dữ liệu từ vật mang tin cũ sang vật mang tin mới

Đây là phương án sao toàn bộ dữ liệu trên các vật mang tin có nguy cơ lỗi thời hoặc hỏng sang các vật mang tin mới. Đây là giải pháp backup off-line.

VI. PHỤC HỒI DỮ LIỆU KHI GẶP SỰ CỐ

1. Trường hợp sự cố dữ liệu ứng dụng

Đối với sự cố khi toàn bộ các file và cơ sở dữ liệu hệ thống của hệ quản trị CSDL vẫn an toàn, chỉ có số liệu của CSDL dùng chung vì lý do gì đó bị hỏng, chúng sử dụng dữ liệu được backup ở các file lưu trữ số liệu hàng tuần và hàng ngày để thực hiện khôi phục. Các bước khôi phục cụ thể như sau:

Khôi phục lại cơ sở dữ liệu sử dụng các file backup dữ liệu tuần (dùng công cụ Backup/Restore của hệ quản trị CSDL).

Sử dụng file backup dữ liệu ngày mới nhất để khôi phục phần dữ liệu mới nhất đến trước khi xảy ra sự cố.

2. Trường hợp sự cố CSDL

Trong trường hợp này có thể sẽ phải cài lại hệ quản trị CSDL. Trước khi cài lại hệ quản trị CSDL, cần lưu lại các file database của CSDL dùng chung để cố gắng sử dụng lại do các file này đang chứa dữ liệu mới nhất. Trong trường hợp không thể dùng được các file database chúng ta sẽ sử dụng các files lưu trữ số liệu hàng tuần và hàng ngày để khôi phục tuỳ thuộc dữ liệu nào được backup gần đây nhất. Các bước khôi phục dữ liệu như sau:

Lưu lại các file cơ sở dữ liệu của ứng dụng và tiến hành cài đặt lại hệ quản trị CSDL (nếu cần thiết).

Dùng lệnh attach database của hệ quản trị CSDL để dùng lại các file cơ sở dữ liệu đã lưu lại ở bước trên.

Sử dụng các file backup số liệu tuần và ngày để khôi phục lại cơ sở dữ liệu trong trường hợp không dùng lại được các file cơ sở dữ liệu.

3. Trường hợp sự cố hệ điều hành

Trong trường hợp máy chủ bị sự cố do một lý do bất khả kháng (hỏng hóc thiết bị, động đất, hoả hoạn, v.v...) không có thể tiếp tục hoạt động ngay được, cần có một quy trình phục hồi hoạt động của điểm này trong thời gian ngắn nhất. Quy trình phục hồi hoạt động như sau:

- Dùng hệ thống máy chủ cluster

Một Cluster là một tập hợp tổng thể các máy tính được kết nối về mặt vật lý với nhau, mỗi máy có bộ xử lý, bộ nhớ động, hệ thống I/O và địa chỉ mạng riêng. những máy tính này có thể chia sẻ một tập hợp các tài nguyên như đĩa, ứng dụng, dữ liệu, địa chỉ mạng logic, password bảo vệ và tất cả được quản lý bởi một tầng quản lý riêng. Tầng quản lý này được gọi là Cluster Manager, chuyên monitor and reacts các sự kiện hệ thống tập chung hoặc là về mặt phần cứng, hệ điều hành hoặc ứng dụng được phát ra và thực hiện các hoạt động để giữ các ứng dụng và dữ liệu sẵn sàng cho việc liên kết với người dùng. Đó là các server mạnh, có khả năng đáp ứng nhiều loại ứng dụng khác nhau liên kết với nhau thông qua đường Ethernet, cùng sử dụng chung một hệ thống lưu trữ thông tin (shared storage) và hoạt động nhờ vào một software cho phép cluster (Cluster-enable software).

Một hệ thống máy nối cluster với nhau cho phép:

Tăng tính sẵn sàng và độ tin cậy của hệ thống.

Tăng hiệu năng của hệ thống.

- Dùng máy chủ dự phòng

Nguyên tắc chung: Dùng hệ thống máy chủ dự phòng tiếp tục thực hiện các giao dịch. Sau khi máy chủ được phục hồi xong, các giao dịch này sẽ được tự động cập nhật vào CSDL chính bằng cơ chế đồng bộ hóa. Quá trình phục hồi máy chủ sẽ được thực hiện qua các bước:

Bước 1: Khắc phục sự cố

Khắc phục sự cố phần cứng (nếu có)

Dựng lại máy chủ hệ thống CSDL dùng chung 

Bước 2: Khôi phục lại toàn bộ hệ thống đến thời điểm bị hỏng hóc theo quy trình được nêu ở phần trên

Bước 3: Kiểm tra hệ thống đã hoạt động trở lại

Bước 4: Thực hiện đồng bộ hóa hai cơ sở dữ liệu qua cơ chế của hệ quản trị cơ sở dữ liệu.

Như vậy, đối với trường hợp sự cố trên 1 máy chủ Cluster, hệ thống sẽ được vận hành trên máy chủ Custer còn lại, thực hiện khắc phục sự cố trên máy chủ bị hỏng.

Trường hợp toàn bộ máy chủ Cluster gặp sự cố, chuyển hướng sử dụng của toàn bộ hệ thống lên máy chủ dự phòng, khắc phục sự cố trên máy chủ chính.

Trường hợp toàn bộ máy chủ Cluster và máy chủ dự phòng gặp sự cố, sử dụng các file backup dữ liệu của tháng gần nhất với tháng xảy ra sự cố để phục hồi lại toàn bộ hệ thống. Sau đó sử dụng các files lưu trữ số liệu hàng tuần và hàng ngày để phục hồi lại cơ sở dữ liệu.

IV. LỰA CHỌN GIẢI PHÁP LƯU TRỮ

Với các phân tích ưu nhược điểm của các công nghệ lưu trữ phổ dụng hiện nay, kết hợp với tính chất công việc, yêu cầu sử dụng và kinh phí đầu tư của hệ thống cơ sở dữ liệu dùng chung, chúng tôi đề xuất giải pháp sử dụng công nghệ NAS kết hợp với DAS dùng cho thiết bị lưu trữ.

NAS bảo đảm tính sẵn sàng cũng như khả năng an toàn dữ liệu, không phụ thuộc các server. NAS phù hợp với các hệ thống lưu trữ với dung lượng lớn. Chúng tôi chọn giải pháp NAS dùng cho hệ thống lưu trữ tại Trung tâm Lưu trữ tỉnh. Chi tiết về hệ thống NAS được đề xuất sẽ được chúng tôi trình bày trong phần "Hệ thống lưu trữ".

Với nhu cầu lưu trữ tại các đơn vị, chúng tôi sử dụng giải pháp lưu trữ DAS với thiết bị lưu trữ dung lượng lớn gắn trực tiếp với máy chủ database. Mỗi máy chủ database tại các trung tâm lưu trữ được gắn trực tiếp với thiết bị lưu trữ DAS.

1. Lưu trữ dùng NAS (lưu trữ trực tuyến)

Để đáp ứng cho nhu cầu lưu trữ tại các Trung tâm Lưu trữ quốc gia, chúng tôi đề xuất sử dụng thiết bị lưu trữ NAS server.

Máy chủ NAS thực hiện lưu trữ các dữ liệu của các server trên mạng, góp phần loại trừ và giảm yêu cầu về các thiết bị lưu trữ gắn trực tiếp vào các server đó. Khả năng này giúp tăng cường tính sẵn sàng của dữ liệu - dữ liệu có thể được truy xuất bởi nhiều client khác nhau mà không bị ảnh hưởng bởi tình trạng của server. Ngay cả khi server có sự cố không hoạt động được, dữ liệu vẫn sẵn sàng cho các nhu cầu sử dụng của người dùng.

NAS thực chất là một máy chủ với khả năng lưu trữ và khả năng mở rộng lớn theo yêu cầu. Ngoài ra, các thiết bị NAS có khả năng kết hợp với nhiều thiết bị và giải pháp lưu trữ khác khi có nhu cầu mở rộng.

2. Lưu trữ dùng tủ đĩa lưu trữ (lưu trữ trực tuyến)

Với thiết bị lưu trữ tại các Trung tâm lưu trữ quốc gia, chúng tôi sử dụng tủ đĩa lưu trữ gắn trực tiếp với máy chủ cơ sở dữ liệu. Với khả năng lưu trữ dung lượng lớn, độ sẵn sàng và hiệu năng cao, tủ đĩa lưu trữ là giải pháp lý tưởng cho công tác lưu trữ tại các trung tâm lưu trữ quốc gia.

Hệ thống tủ đĩa lưu trữ cần đáp ứng được một số tiêu chuẩn sau:

- Gọn nhẹ, không chiếm nhiều không gian lưu trữ;

- Hỗ trợ các chuẩn lưu trữ tiên tiến, cho phép trao đổi dữ liệu tốc độ cao;

- Có khả năng mở rộng, bảo đảm người dùng có thể bảo toàn đầu tư khi nâng cấp trong tương lai;

- Ổ cứng, nguồn, quạt có khả năng thay thế nóng. Quạt, nguồn và I/O module đều có khả năng dự phòng;

- Hỗ trợ nhiều ổ cứng với dung lượng lớn;

3. Lưu trữ dùng băng từ (Tape) (lưu trữ ngoại tuyến)

Như trên đã trình bày, với việc lưu trữ tại trung tâm tích hợp dữ liệu của Cục Văn thư và Lưu trữ nhà nước, bên cạnh việc dùng SAN server làm thiết bị lưu trữ chính, chúng tôi sử dụng tape storage để backup các dữ liệu với dung lượng lớn.

Trong đề xuất kỹ thuật này, chúng tôi đề xuất sử dụng thiết bị autoloader để backup dữ liệu từ server ra hệ thống băng từ. Hệ thống autoloader có một đầu đọc ghi và chứa được một số tape nhất định.

Autoloader có thể chứa đồng thời nhiều tape.

Khi đọc ghi dữ liệu, hệ thống chỉ có thể truy cập một tape tại một thời điểm.

Với số lượng tape lớn hơn khả năng lưu trữ của autoloader, một số tape có thể được lưu trữ ngoài và sẽ được đưa vào autoloader khi có nhu cầu sử dụng.

Các dữ liệu lưu trên tape có nhược điểm là tốc độ truy cập chậm hơn so với trên ổ đĩa cứng nhưng bù lại, chúng ta có thể lưu trữ được dung lượng lớn dữ liệu trên tape với chi phí rẻ, cho phép thực hiện bảo quản lâu dài.

4. Lưu trữ dùng CD (lưu trữ ngoại tuyến)

Trong giải pháp này, chúng tôi vẫn đề xuất một giải pháp lưu trữ khác phổ biến ở Việt Nam là thực hiện lưu trữ trên các đĩa CD. Để thực hiện được điều này, Cục Văn thư và Lưu trữ nhà nước và các Trung tâm lưu trữ Quốc gia được trang bị các đầu ghi CD dùng cho mục đích lưu trữ các dữ liệu đã được số hóa trên CD.

5. Sao lưu dữ liệu

- Đối với dữ liệu lưu trữ trực tuyến phục vụ nhu cầu quản lý và khai thác, sử dụng chúng tôi đề xuất sử dụng:

+ Giải pháp sao lưu gia tăng;

+ Chiến lược và chu kỳ sao lưu theo tuần;

- Đối với dữ liệu lưu trữ ngoại tuyến phục vụ yêu cầu bảo quản lâu dài, chúng tôi đề xuất sử dụng:

+ Giải pháp sao lưu đầy đủ;

+ Chiến lược sao lưu từ vật mang tin cũ sang vật mang tin mới, chu kỳ sao lưu từ 5 đến 15 năm;

6. Định dạng dữ liệu lưu trữ

Ngoài bản thân nội dung đối tượng cần lưu trữ, các thông tin mô tả có vai trò quan trọng phục vụ cho quá trình thu thập, bảo quản, lưu trữ cũng như khai thác sử dụng tài liệu lưu trữ. Có nhiều tiêu chuẩn mô tả khác nhau được sử dụng trong các tổ chức liên quan đến lưu trữ, chúng tôi đề xuất sử dụng tiêu chuẩn Duplin Core để mô tả dữ liệu lưu trữ và sử dụng ngôn ngữ XML để trao đổi CSDL trong lưu trữ với các lý do sau:

Cơ sở pháp lý: Quyết định 20/2008/QĐ-BTTTT ngày 09 tháng 4 năm 2008 của Bộ Thông tin và Truyền thông về việc ban hành Danh mục tiêu chuẩn về ứng dụng công nghệ thông tin trong cơ quan nhà nước tại Phần 5.1 đã quy định Tiêu chuẩn dữ liệu đặc tả bắt buộc áp dụng là Dublin Core.

Các yếu tố siêu dữ liệu Dublin Core có những ưu điểm sau:

+ Tạo lập và sử dụng dễ dàng: cho phép những người không chuyên nghiệp có thể tạo các bản ghi mô tả đơn giản cho các tài nguyên thông tin và truy xuất chúng trên môi trường mạng một cách dễ dàng.

+ Ngữ nghĩa dễ hiểu, sử dụng đơn giản: Việc khai thác thông tin trên mạng internet diện rộng thường gặp trở ngại bởi những sự khác nhau về thuật ngữ và sự mô tả thực tế. Dublin Core Metadata giúp những người dò tìm thông tin không chuyên có thể tìm thấy vấn đề mình quan tâm bằng cách hỗ trợ một tập hợp các phần tử thông dụng mà ngữ nghĩa của chúng được hiểu phổ biến.

+ Phạm vi phổ biến: Tập hợp các phần tử Dublin Core Metadata lúc đầu được phát triển bằng tiếng Anh, nhưng hiện nay nó được câp nhật thêm với khoảng 25 ngôn ngữ khác nhau (phiên bản v1.1)

+ Tính mở rộng: Những nhà phát triển Dublin Core đã cung cấp một cơ chế cho việc mở rộng tập các phần tử Dublin Core, phục vụ nhu cầu khai thác các tài nguyên bổ sung. Các phần từ Metadat từ những tập các phần tử khác nhau có thể liên kết với metadata của Dublin Core. Điều này cho phép các tổ chức khác nhau có thể dùng các phần tử Dublin Core để mô tả thông tin thích hợp cho việc sử dụng tài nguyên trên Internet.

+ Giúp nâng cao độ chính xác của định chỉ số

+ Có khả năng liên tác (Interoperability), sử dụng lẫn nhau

+ Mở rộng thuận lợi

Mỗi yếu tố Dublin Core được đặt tên (Element Name) và quy định nhãn (label) để sử dụng ghi vào trong thẻ meta. Mỗi yếu tố được định nghĩa cụ thể để mô tả đối tượng và có chú thích rõ ràng./.

(Nguồn archives.gov.vn)

SỞ NÔNG NGHIỆP VÀ MÔI TRƯỜNG TỈNH LONG AN 
 
Chịu trách nhiệm chính: Ông Võ Minh Thành, Giám đốc Sở Nông nghiệp và Môi trường Tỉnh Long An 
Địa chỉ: Khối nhà Cơ quan 3 – Khu Trung tâm Chính trị Hành chính tỉnh Long An, số 04 Đường Song Hành, Phường 6, Thành phố Tân An, tỉnh Long An.
Điện thoại:
(0272) 3826 260 * Fax: (0272) 3823 264 * Email: snnmt@longan.gov.vn
image banner