Thời gian gần đây, chúng ta được nghe nhắc đến những khái niệm số hóa tài liệu, doanh nghiệp số, văn phòng điện tử, thành phố thông minh. Vì vậy trong bài viết này chúng tôi sẽ hướng dẫn số hóa tài liệu trong cơ quan doanh nghiệp cho các bạn đọc có thể hiểu rõ hơn.
Vậy dịch vụ số hóa tài liệu là gì? Số hóa tài liệu là quá trình chuyển đổi các dạng tài liệu truyền thống như chữ viết tay, bản in, âm thanh, hình ảnh,… sang chuẩn tài liệu mà máy tính có thể nhận biết được, đọc được. Thông thường, tài liệu số bao gồm các dữ liệu dạng chữ, video, âm thanh, hình ảnh,… được sử dụng trên máy tính và được định dạng mà máy tính có thể đọc được.
Các công ty nhập dữ liệu thuê online sẽ giúp doanh nghiệp thực hiện các công việc này một cách nhanh chóng và thành công.
Hiện nay số hóa lưu trữ tài liệu được tiến hành thực hiện theo tiêu chuẩn của Thông tư số 02/2019/TT – BNV quy định tiêu chuẩn dữ liệu thông tin đầu vào và yêu cầu bảo quản tài liệu dữ liệu điện tử.
1. Tiêu chuẩn dữ liệu thông tin đầu vào của cơ sở dữ liệu tài liệu lưu trữ.
Tài liệu lưu trữ điện tử được số hóa từ tài liệu lưu trữ nền giấy, định dạng Portable Document Format (.pdf), phiên bản 1.4 trở lên; ảnh màu; độ phân giải tối thiểu 200 dpi; tỷ lệ số hóa 100% và hình thức chữ ký số của cơ quan, tổ chức quản lý tài liệu lưu trữ số hóa: vị trí góc trên, bên phải, trang đầu tài liệu; hình ảnh dấu cơ quan, tổ chức, màu đỏ, kích thước bằng kích thước thực tế của dấu, định dạng Portable Network Graphic (.png); thông tin gồm tên cơ quan, tổ chức, thời gian ký (ngày, tháng, năm; giờ, phút, giây; múi giờ Việt Nam theo Tiêu chuẩn ISO 8601); tên file gồm mã hồ sơ và số thứ tự văn bản trong hồ sơ, cách nhau bởi dấu chấm.
Đối với tài liệu ảnh, định dạng JPG, độ phân giải tối thiểu 200 dpi; đối với tài liệu phim ảnh, định dạng MPEG-4, .avi, .wmv; Bit rate tối thiểu là 1500 kbps; đối với tài liệu âm thanh, định dạng MP3, .wma và Bitrate tối thiểu 128 kbps.
Dữ liệu thông tin đầu vào của cơ sở dữ liệu tài liệu lưu trữ hình thành từ Hệ thống quản lý tài liệu điện tử của các cơ quan, tổ chức nộp lưu vào Lưu trữ lịch sử được đóng gói theo tiêu chuẩn kỹ thuật về ứng dụng công nghệ thông tin trong cơ quan nhà nước quy định tại Thông tư số 39/2017/TT-BTTTT ngày 15/12/2017 của Bộ trưởng Bộ Thông tin và Truyền thông; dữ liệu đặc tả của tài liệu lưu trữ quy định tại Phụ lục I Thông tư này; biên mục, cập nhật nội dung dữ liệu đặc tả của tài liệu lưu trữ quy định tại Phụ lục II Thông tư này.
2. Nguyên tắc và yêu cầu bảo quản cơ sở dữ liệu tài liệu lưu trữ
Bảo đảm cơ sở dữ liệu tài liệu lưu trữ được bảo quản an toàn, xác thực, bảo mật trên các phương tiện lưu trữ; đảm bảo khả năng truy cập, quản lý, tìm kiếm, cập nhật cơ sở dữ liệu tài liệu lưu trữ.
Không lưu cơ sở dữ liệu tài liệu lưu trữ có chứa thông tin thuộc phạm vi bí mật nhà nước trên các thiết bị kết nối với mạng Internet, mạng máy tính, mạng viễn thông; không chuyển mục đích sử dụng các thiết bị đã lưu cơ sở dữ liệu tài liệu lưu trữ có chứa thông tin thuộc phạm vi bí mật nhà nước khi chưa loại bỏ triệt để cơ sở dữ liệu tài liệu lưu trữ; cơ sở dữ liệu tài liệu lưu trữ phải được sao lưu ít nhất 02 bộ, mỗi bộ trên 01 phương tiện lưu trữ độc lập; việc sao lưu phải đảm bảo đầy đủ, chính xác, kịp thời, an toàn; bảo đảm thống nhất quy trình kiểm tra, sao lưu, phục hồi dữ liệu và người được giao quản lý cơ sở dữ liệu tài liệu lưu trữ của cơ quan, tổ chức có trách nhiệm kiểm tra, bảo quản, sao lưu, phục hồi. Ngoài ra, Thông tư cũng quy định chi tiết việc kiểm tra cơ sở dữ liệu tài liệu lưu trữ; sao lưu phần mềm và cơ sở dữ liệu tài liệu lưu trữ; phục hồi cơ sở dữ liệu tài liệu lưu trữ và bảo đảm an toàn cơ sở dữ liệu tài liệu lưu trữ…
Do mục tiêu số hóa tài liệu khác nhau, mà có thể đặt ra các bước số hóa tài liệu khác nhau phù hợp với từng cơ quan, tổ chức. Cục văn thư Lưu trữ Nhà nước đặt ra quy trình số hóa tài liệu lưu trữ gồm 12 bước theo Quyết định số 176/QĐ-VTLTNN ngày 21/10/2011 với yêu cầu phân loại ảnh và sao lưu ảnh. Nhưng nếu với yêu cầu phổ thông, quá trình thực hiện số hóa tài liệu chỉ đơn giản có 5 bước như sau:
– Bước 1: Nhận tài liệu lưu trữ đã được lựa chọn để thực hiện số hóa
Việc lựa chọn này là cần thiết, vì không có một cơ quan, tổ chức nào lại có thể số hóa một lần cả kho lưu trữ của mình. Tiêu chuẩn để số hóa tùy thuộc vào mục tiêu của chủ sở hữu tài liệu lưu trữ mà các dịch vụ scan tài liệu ngoài sẽ thay đổi theo. Ví dụ, số hóa để bảo hiểm tài liệu lưu trữ, tài liệu được chọn phải là tài liệu thuộc diện quý, hiếm theo quy định của Pháp luật.
– Bước 2: Chuẩn bị tài liệu
Công việc bao gồm:
-Lấy ra các bìa cứng, ghim kẹp; làm phẳng các trang tài liệu;
-Phân loại tài liệu, tách riêng những tài liệu rách, hư hỏng, nếu việc số hóa áp dụng cho các hồ sơ lưu trữ và dùng kỹ thuật scan từng tờ tài liệu. Nếu việc số hóa tài liệu lưu trữ dạng đóng quyển, thì có thể áp dụng công nghệ mới tiến hơn như Bookscan cho việc số hóa lưu trữ tài liệu.
– Bước 3: Thiết lập hệ thống
Scan và thiết lập hệ thống ảnh, đặt tên file, đặt định dạng, đóng, ghim lại theo trật tự tổ chức tài liệu ban đầu, tạo siêu siêu dữ liệu ( Metadata).
Đây là bước quyết định nhất để chuyển đổi tài liệu truyền thống sang tài liệu số hóa. Danh mục tài liệu số hóa được lập và gắn và tài liệu được thông qua một phần mềm ứng dụng và tạo ra metadata. Đồng thời, tài liệu được đặt định dạng theo sự lựa chọn được định trước.
– Bước 4: Kiểm tra tài liệu
Kiểm tra chất lượng tài liệu đã được số hóa và làm lại những ảnh hưởng không đạt yêu cầu.
– Bước 5: Nghiệm thu, bàn giao tài liệu lưu trữ
Công việc bao gồm bàn giao lại tài liệu số hóa và bàn giao tài liệu gốc. Nếu tài liệu số hóa là tài liệu lưu trữ của một lưu trữ lịch sử thì với những văn bản không đóng quyển trong một hồ sơ, việc bàn giao phải được kiểm tra chặt chẽ từng trang tài liệu để đảm bảo đầy đủ như tài liệu ban đầu đã nhận ở bước 1.
Một số lưu ý phải thực hiện đồng thời khi thực hiện số hóa tài liệu lưu trữ:
a. Chọn định dạng các file ảnh.
Định dạng file là những phần mở rộng ở cuối một tên file (đuôi file), biểu thị file đó thuộc định dạng nào.Thông tin đuôi file được hệ điều hành sử dụng để mở ra chương trình phù hợp. Ví dụ: *.txt là loại file chữ viết và được xử lý bằng một chương trình văn bản tương ứng.Các định dạng file ảnh khác nhau mang lại dung lượng ổ đĩa, cũng như chất lượng ảnh khác nhau.Các định dạng phổ biến được áp dụng cho file dữ liệu ảnh là: JPG, TIFF, GIF, PNG, RAW… Mỗi định dạng này đều có những ưu thế và những hạn chế riêng. Tính năng và cách lựa chọn một định dạng cho một khối tài liệu số hóa, đề nghị độc giả tự nghiên cứu, vì lý do hạn chế trang viết của một bài báo, nên chúng tôi xin không viết ra ở đây.
b. Chọn vật mang tin để quản lý tài liệu số hóa.
Vật mang tin là các phương tiện lưu giữ và truyền đạt thông tin trên mọi chất liệu từ khi có chữ viết đến nay như đất nung, đá, vỏ, lá cây, lụa, mai rùa, tre, giấy… Với sự tiến bộ của khoa học và công nghệ, đã xuất hiện thêm tài liệu công nghệ mới, tài liệu nghe nhìn hiện đại, như đĩa CD, CD-ROM, DVD, băng từ, video, vi phim, vi phiếu, ổ cứng máy tính, v.v…thì điều quan tâm nhất của công tác lưu trữ tài liệu là độ bền của từng loại vật mang tin.
Với khả của cơ quan là chủ sở hữu tài liệu, mỗi một dự án số hóa tài liệu đều chọn vật mang tin thích hợp để quản lý các dữ liệu số của mình.
c. Thiết lập hệ thống siêu dữ liệu
Siêu dữ liệu (Metadata) là thông tin mô tả nội dung của tài liệu số hóa, mà người làm lưu trữ vẫn quen gọi là thông tin cấp II tài liệu lưu trữ. Siêu dữ liệu là dữ liệu để mô tả dữ liệu, hoặc dữ liệu về dữ liệu. Khi dữ liệu được cung cấp cho người dùng cuối, Siêu dữ liệu sẽ cung cấp những thông tin cho phép người quản lý tin và dùng tin hiểu rõ hơn bản chất của dữ liệu mà họ đang có. Cụ thể, những thông tin này giúp cho người dùng tin tìm ra được tài liệu mà họ đang cần và giúp họ hiểu những thông tin khác có liên quan. Với sự tối ưu của Siêu dữ liệu, nên có độc giả còn nói là “bể chứa thông tin về dữ liệu”. Thông qua Siêu dữ liệu, độc giả có thể nhận biết từng chi tiết kỹ thuật như: kích thước cơ bản của cơ sở dữ liệu, danh mục nghiệp vụ của những loại dữ liệu khác nhau. Những mô tả này hướng dẫn người dùng tin tìm đúng loại dữ liệu, qua đó, giúp họ hiểu được ý nghĩa của dữ liệu và phương pháp tiếp cận chúng.
Nhìn chung, Siêu dữ liệu bao gồm một số loại thông tin cơ bản như: thông tin mô tả về bản thân dữ liệu của Siêu dữ liệu; thông tin về dữ liệu mà Siêu dữ liệu mô tả và thông tin về cơ quan, tổ chức và cá nhân liên quan đến dữ liệu mà Siêu dữ liệu đã mô tả.
Nhưng đặc điểm chính và sự tối ưu của Siêu dữ liệu không phải chỉ dừng lại ở đó. Vì nếu chỉ có như thế (như mô tả trên), thì với công cụ truyền thống, chúng ta cũng có thể làm được, thông qua việc biên mục chi tiết các Bộ thẻ thư viện, Mục lục hồ sơ lưu trữ, Sách hướng dẫn các phông lưu trữ…
Giá trị mà chúng tôi coi là quan trọng nhất của việc số hóa tài liệu lưu trữ có thể là tìm tin tự động thông qua kỹ thuật nhúng (gắn) thông tin của Siêu dữ liệu vào dữ liệu số hóa nhờ một phần mềm số hóa chuyên dụng. Chính một trong những phức tạp cần giải quyết của một Dự án số hóa tài liệu lưu trữ cũng nằm đây.
Mối liên hệ, vị trí giữa Siêu dữ liệu và tài nguyên thông tin mà nó mô tả được thể hiện ở một trong hai cách sau:
Với công cụ tra cứu truyền thống, phần tử của thông tin cấp II được chứa trong một biểu ghi, hoặc ở công cụ tra cứu khác nằm tách biệt bên ngoài đối tượng mô tả. Như vậy, thông tin mô tả để quan lý và tra tìm tài liệu được lưu trữ bên ngoài bên ngoài đối tượng mô tả.
Với cơ sở dữ liệu được số hóa thành tài liệu điện tử, các phần tử Siêu dữ liệu có khả năng nhúng (gắn) vào bên trong tài nguyên mà nó mô tả, để quản lý và tra tìm tài liệu tự động hóa. Chính sự tối ưu này tạo ra độ phức tạp cho lao động số hóa. Từ đó chúng ta, người làm lưu trữ không thể hiểu số hóa tài liệu lưu trữ một cách giản đơn chỉ là scan, hoặc chụp tài liệu để lưu vào máy tính, vì đó chỉ là lao động kỹ thuật của các nhân viên.
Việc nhúng (gắn) vào bên trong tài nguyên mà nó mô tả cần một chuẩn mô tả thông dụng hiện nay là “Dublin Core Metadata”, “MARC21/UNIMARC, ISO-2709”… mà chúng ta không cần viết ra ở đây, vì tốn khá nhiều giấy, mực và để dành cho các bài viết chuyên đề khác.
Hiện nay với phần mềm quản lý hồ sơ lưu trữ DocEye việc quản lý số lượng hồ sơ của doanh nghiệp bạn sẽ trở lên nhanh chóng, tiện lợi.
Quản lý tài liệu lưu trữ sao cho hiệu quả, tránh lãng phí
Quản lý tài liệu, hồ sơ, sổ sách luôn là việc làm khó khăn và tốn nhiều thời gian nhất ở trong các cơ quan, tổ chức. Có nhiều phương pháp quản lý tài liệu, hồ sơ đang được áp dụng, tuy nhiên không phải phương pháp nào cũng thực sự tạo ra được tính chuyên nghiệp cũng như tính hiệu quả trong phục vụ công việc.
Bằng phương pháp truyền thống, quản lý tài liệu thường được tiến hành theo cách thủ công là phân loại, bố trí, sắp xếp lại giấy tờ, sổ sách theo dõi… sau đó lưu lại trong thư viện hoặc kho lưu trữ, đánh dấu mã số, ghi chép thông tin vào các kẹp hồ sơ để có thể tìm kiếm lại khi cần. Số lượng các giấy tờ, tài liệu, hồ sơ, công văn trong quá trình hoạt động tăng lên rất nhiều theo thời gian.
Do đó, việc chúng ta lưu thành các tủ tài liệu, các kho tài liệu hay lưu trữ thông tin trên máy tính cũng cần được mở rộng liên tục, chưa kể đến cần có thêm các biện pháp xử lý yếu tố khách quan như nhiệt độ và độ ẩm, côn trùng, nấm mốc… Tài liệu lưu trữ lâu ngày thường khó tránh khỏi tình trạng bị hỏng, không nhìn rõ thông tin ban đầu cũng như việc tìm kiếm, tra cứu mất nhiều thời gian làm giảm hiệu quả công việc.
Đã có nhiều đơn vị, cơ quan, tổ chức áp dụng giải pháp số hóa công tác quản lý tài liệu hồ sơ cho đơn vị mình. Tuy nhiên không ít đơn vị đã triển khai không thành công hoặc hiệu quả không cao vì một phần lý do là bản thân hệ thống phần mềm quản lý tài liệu lưu trữ được tính toán, thiết kế không hoặc chưa đáp ứng được yêu cầu số lượng văn bản tăng lên sau vài năm vận hành. Nhiều người nghĩ rằng chúng ta chỉ cần trang bị hạ tầng máy tính tốt, hệ thống lưu trữ dữ liệu dung lượng lớn là đáp ứng được nhu cầu mà quên mất rằng việc lựa chọn một phần mềm quản lý hồ sơ văn bản, được thiết kế dựa trên nghiên cứu quản lý hiện đại, tính toán thiết kế sao cho đáp ứng nhu cầu quản lý tài liệu của đơn vị và có thể vận hành ổn định trong nhiều năm về sau cũng là một vấn đề rất quan trọng.
Phần mềm quản lý tài liệu DocEye do Công ty Cổ phần đầu tư thương mại và phát triển công nghệ FSI nghiên cứu phát triển dựa trên các công nghệ quản trị tài liệu tiên tiến trên thế giới, gắn với nhu cầu thực tế của các đơn vị tổ chức, doanh nghiệp. Vậy phần mềm quản lý tài liệu DocEye là gì?
– Doceye là một phần mềm giúp thu nhận, quản lý, lưu trữ và phân phối toàn bộ thông tin phi cấu trúc của tổ chức tới người dùng, tới các ứng dụng khác và tới các quy trình nghiệp vụ của tổ chức.
– Thông tin phi cấu trúc (bao gồm các dạng văn bản, video, audio, email, báo cáo kết quả từ các ứng dụng nghiệp vụ,…) chiếm tới 80% tổng lượng thông tin của tổ chức.
– Tính năng của phần mềm quản lý tài liệu, hồ sơ DocEye:
a. Thu nhận dữ liệu thông tin:
– Nhập và phân loại thông tin
– Bóc tách và nhận dạng tài liệu thủ công, tự động hoặc theo mẫu có sẵn
– Người dùng có thể tự kiểm tra thông tin sau khi đã bóc tách
– Thông tin được bóc tách và nhận dạng được đưa vào kho chứa trung tâm hoặc các kho chứa khác
b. Quản lý tài liệu lưu trữ :
– Dễ dàng tìm kiếm tài liệu bằng các thao tác đơn giản
– Chia sẻ tài liệu được lưu trữ cho một hoặc nhiều người
– Tạo luồng xử lý công việc, theo dõi và phân tích việc thực hiện các luồng xử lý.
– Báo cáo thống kê tài liệu và thống kê người dùng
– Sao lưu – phục hồi dữ liệu thủ công hoặc tự động theo lịch trình
– Thông tin của người dùng, tài liệu và hệ thống được bảo mật cao
>> Xem thêm bài viết: Số hóa tài liệu trong thư viện – Lợi ích không tưởng
= > Tại sao nên sử dụng phần mềm quản lý tài liệu DocEye?
– Tự động hóa tối đa việc thu thập thông tin và phân loại tài liệu
– Giải pháp quản lý tài liệu, văn bản bằng công nghệ nhận dạng tiếng Việt và bóc tách thông tin tự động giúp cho việc sử dụng trở nên dễ dàng và thuận tiện hơn
– Nâng cao hiệu quả công việc, tiết kiệm chi phí vận hành
– Hoạt động trên Internet cũng như trong mạng nội bộ tuỳ theo nhu cầu của người dùng, giúp chúng ta có thể truy cập dữ liệu tại bất cứ đâu.
– Khả năng tùy chỉnh linh hoạt với mọi nhu cầu của người dùng, giao diện thân thiện, dễ sử dụng, tính bảo mật cao.
Hiện nay, nhằm giúp các doanh nghiệp khởi nghiệp dễ dàng hơn trong việc quản lý và lưu trữ các tài liệu, FSI cùng sở KHĐT thành phố Hà Nội và Hồ Chí Minh thực hiện chương trình khuyến mãi “Miễn phí phần mềm DocEye cho các doanh nghiệp khởi nghiệp”.
Để tham khảo và trải nghiệm các tính năng của phần mềm quản lý tài liệu văn bản điện tử DocEye, các cá nhân, doanh nghiệp, tổ chức có thể đăng ký dùng thử tại: https://doceye.vn/dang-ky.html