BẢO HIỂM
XÃ HỘI VIỆT NAM |
CỘNG HÒA
XÃ HỘI CHỦ NGHĨA VIỆT NAM |
Số: 1773/QĐ-BHXH |
Hà Nội, ngày 07 tháng 12 năm 2023 |
TỔNG GIÁM ĐỐC BẢO HIỂM XÃ HỘI VIỆT NAM
Căn cứ Nghị định số 89/2020/NĐ-CP ngày 04/8/2020 của Chính phủ quy định chức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức của Bảo hiểm xã hội Việt Nam;
Căn cứ Nghị định số 101/2017/NĐ-CP ngày 01/9/2017 của Chính phủ về đào tạo, bồi dưỡng cán bộ, công chức, viên chức và Nghị định số 89/2021/NĐ-CP ngày 18/10/2021 của Chính phủ sửa đổi, bổ sung một số điều của Nghị định số 101/2017/NĐ-CP ngày 01/9/2017 của Chính phủ về đào tạo, bồi dưỡng cán bộ, công chức, viên chức;
Căn cứ Quyết định số 3033/QĐ-BHXH ngày 01/11/2022 của Tổng Giám đốc Bảo hiểm xã hội Việt Nam ban hành quy chế đào tạo, bồi dưỡng, công chức, viên chức ngành Bảo hiểm xã hội Việt Nam;
Căn cứ Quyết định số 980/QĐ-BHXH ngày 12/6/2023 của Tổng Giám đốc Bảo hiểm xã hội Việt Nam ban hành Chương trình bồi dưỡng nghiệp vụ cho viên chức quản lý, khai thác, kết nối, chia sẻ Cơ sở dữ liệu quốc gia về bảo hiểm;
Theo đề nghị của Hiệu trưởng Trường Đào tạo nghiệp vụ Bảo hiểm xã hội.
QUYẾT ĐỊNH:
Điều 1. Phê duyệt Tài liệu bồi dưỡng của khóa học “Bồi dưỡng nghiệp vụ cho viên chức quản lý, khai thác, kết nối, chia sẻ Cơ sở dữ liệu quốc gia về bảo hiểm (Tài liệu kèm theo).
Điều 2. Giao Hiệu trưởng Trường Đào tạo nghiệp vụ Bảo hiểm xã hội ký ban hành tài liệu bồi dưỡng, tổ chức giảng dạy theo quy định.
Điều 3. Quyết định này có hiệu lực từ ngày ký. Vụ trưởng Vụ Tổ chức cán bộ, Chánh Văn phòng Bảo hiểm xã hội Việt Nam, Hiệu trưởng Trường Đào tạo nghiệp vụ Bảo hiểm xã hội, Thủ trưởng các đơn vị trực thuộc Bảo hiểm xã hội Việt Nam, Giám đốc Bảo hiểm xã hội các tỉnh, thành phố trực thuộc Trung ương chịu trách nhiệm thi hành Quyết định này./.
Nơi nhận: |
KT. TỔNG
GIÁM ĐỐC |
KHÓA HỌC “ BỒI DƯỠNG NGHIỆP VỤ CHO
VIÊN CHỨC QUẢN LÝ, KHAI THÁC, KẾT NỐI, CHIA SẺ CƠ SỞ DỮ LIỆU QUỐC GIA VỀ BẢO
HIỂM”
Ban hành kèm theo Quyết định số ngày của Tổng Giám đốc
Bảo hiểm xã hội Việt Nam
MỤC LỤC
CHUYÊN ĐỀ 1:TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU
1. Tổng quan về quản lý dữ liệu
1.1. Các khái niệm nền tảng
1.2. So sánh khác biệt giữa dữ liệu và thông tin; cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu
1.3. Phương pháp tổng hợp thông tin từ dữ liệu
1.4. Tầm quan trọng của dữ liệu trong tổ chức
1.5. Những thách thức khác nhau trong quản lý dữ liệu
1.6. Các chiến lược quản lý dữ liệu
2. Quản lý dữ liệu
2.1. Các nhân tố thúc đẩy quá trình quản lý dữ liệu
2.2. Mục tiêu và nguyên tắc về quản lý dữ liệu
2.3. Quản lý dữ liệu
2.4. Công cụ và kỹ thuật trong quản lý dữ liệu
CHUYÊN ĐỀ 2: HỆ THỐNG DATA WAREHOUSE CỦA BHXH VIỆT NAM
1. Các sơ sở dữ liệu chuyên ngành của BHXH Việt Nam
1.1. CSDL hộ gia đình tham gia BHYT
1.2. CSDL giám định BHYT
1.3. CSDL tài chính kế toán
1.4. CSDL Thu – Sổ Thẻ (TST)
1.5. CSDL xét duyệt chính sách (TCS)
1.6. CSDL quản lý đầu tư quỹ
1.7. CSDL quản lý đấu thầu thuốc tập trung
1.8. CSDL thu - chi điện tử SMS
1.9. CSDL tổng hợp và phân tích dữ liệu tập trung ngành Bảo hiểm xã hội:
2. Tổng quan về hệ thống Data Warhouse (DWH) của Bảo hiểm xã hội Việt Nam
2.1. Hiện trạng và những khó khăn trước khi triển khai xây dựng hệ thống DWH
2.2. Đặc điểm, mục tiêu xây dựng DWH
2.3. Giá trị DWH đem lại lợi ích sử dụng
3. Thực hành hệ thống Data Warehouse (DWH) của Bảo hiểm xã hội Việt Nam
3.1. Chức năng, giao diện hệ thống và các khái niệm
3.2. Tổ chức thư mục hệ thống báo cáo trong kho dữ liệu
3.3. Báo cáo tĩnh trong DWH
3.4. Báo cáo động trong DWH (Package Phân tích động)
CHUYÊN ĐỀ 3: CƠ SỞ DỮ LIỆU QUỐC GIA VỀ BẢO HIỂM
1. Các quy định chung về quản lý, kết nối, khai thác, vận hành và chia sẻ CSDL quốc gia
1.1. Nghị định 47/2020/NĐ-CP ngày 9/4/2020 của Chính phủ về quản lý, kết nối và chia sẻ dữ liệu của cơ quan nhà nước
1.2. Nghị định số 43/2021/NĐ-CP ngày 31/3/2021 của Chính phủ quy định Cơ sở dữ liệu quốc gia về Bảo hiểm
1.3. Thông tư 13/2017/TT-BTTTT ngày 23/9/2017 của Bộ thông tin và truyền thông về quy định các yêu cầu kỹ thuật về kết nối các hệ thống thông tin, cơ sở dữ liệu với cơ sở dữ liệu quốc gia
2. Tổng quan về nền tảng tích hợp, chia sẻ dữ liệu quốc gia.
2.1. Hướng dẫn kết nối và chia sẻ dữ liệu thông qua nền tảng tích hợp, chia sẻ dữ liệu quốc gia
2.2. Hướng dẫn kết nối nền tảng phân tán (DXL)
3. Quyết định số 3680/QĐ-BHXH ngày 23/12/2022 của Bảo hiểm xã hội Việt Nam về ban hành Quy định kỹ thuật về cấu trúc thông điệp dữ liệu trao đổi với Cơ sở dữ liệu quốc gia về Bảo hiểm
4. Quy trình khai thác chia sẻ dữ liệu
5. Các quy định khác của Bảo hiểm xã hội Việt Nam
6. Cơ sở dữ liệu quốc gia về bảo hiểm
6.1. Quá trình hình thành
6.2. Tình hình triển khai xây dựng CSDL quốc gia về Bảo hiểm
6.3. Bảo hiểm xã hội Việt Nam và các kết nối chia sẻ dữ liệu với Bộ/ Ngành
GIẢI THÍCH TỪ NGỮ
BHXH: Bảo hiểm xã hội
BHYT: Bảo hiểm y tế
CNTT: Công nghệ thông tin
CSDL: Cơ sở dữ liệu
CSDLQG: Cơ sở dữ liệu quốc gia
HTTT: Hệ thống thông tin
TSLCD: Mạng truyền số liệu chuyên dùng của các cơ quan Đảng, Nhà nước
NDXP (National Data Exchange Platform): Nền tảng tích hợp, chia sẻ dữ liệu quốc gia
NGSP (National Government Service Platform): Liên thông các hệ thống thông tin ở Trung ương và địa phương
LGSP (Local Government Service Platform):
DXL (Data Exchange Layer): Chia sẻ dữ liệu phân tán
TCVN 11930:2017: Tiêu chuẩn quốc gia về Công nghệ thông tin – Các kỹ thuật an toàn – Yêu cầu cơ bản về an toàn hệ thống thông tin theo cấp độ
1. Tổng quan về quản lý dữ liệu
Dữ liệu (Data): là các số liệu, các tài liệu thu thập được chưa qua xử lý, chưa được biến đổi (dạng thô) cho bất cứ mục đích nào. Dữ liệu có thể được biểu diễn dưới nhiều dạng khác nhau bao gồm: âm thanh, văn bản, hình ảnh…
Ví dụ: Với bảo hiểm xã hội, trong quá trình hoạt động một loạt dữ liệu sẽ được hình thành và tạo ra như hồ sơ bảo hiểm xã hội của mỗi cá nhân, quá trình tham gia bảo hiểm xã hội, lịch sử khám chữa bệnh, dữ liệu về việc chi trả bảo hiểm thất nghiệp,… Những dữ liệu này sẽ được lưu trữ trên máy tính và quản lý bởi chương trình cụ thể để người dùng có thể sử dụng với các mục đích khác nhau.
Phân loại dữ liệu.
Dữ liệu định tính và Dữ liệu định lượng
Sơ đồ 1: Các kiểu Dữ liệu
Việc hiểu và xác định được đúng loại dữ liệu của từng thuộc tính rất quan trọng. Tùy thuộc và từng loại dữ liệu định tính hay định lượng mà các phương pháp xử lý, phân tích thống kê sẽ rất khác nhau với từng loại dữ liệu này.
Dữ liệu định tính (Qualitative data): Dữ liệu không thể đo lường được bởi các con số: Tên người, Giới tính, Dân tộc, Mùi vị, Màu sắc…Bao gồm:
- Dữ liệu định danh (Nominal data): tập hợp các nhãn dùng để mô tả, phân loại các đối tượng. Sử dụng phép toán = hoặc != . Ví dụ: Màu sắc
{Xanh, Đỏ, Tím, Vàng, Đen, Trắng}.
- Dữ liệu trật tự (Ordinal data): tập hợp các nhãn chỉ định một thứ tự sắp xếp các đối tượng. Có thêm các phép toán >, <, >=, <=. Ví dụ: Phân loại chiều cao {Thấp, Trung bình, Cao}, Hạnh kiểm {Kém, Trung bình, Khá, Giỏi}.
Dữ liệu định lượng (Quantitative data): Dữ liệu có thể đo lường bởi các con số và thực hiện các tính toán số học được: Chiều cao, cân nặng, điểm số, nhiệt độ môi trường, vận tốc gió…Bao gồm:
- Dữ liệu rời rạc (Discrete data): Chỉ có thể đo lường được một số lượng giá trị hữu hạn (đại diện bởi số nguyên): Số bàn thắng, số con vật, số học sinh giỏi…
- Dữ liệu liên tục (Continuous data): Có thể đo lường được giá trị vô hạn (đại diện bởi số thực): Chiều cao, cân nặng, vận tốc gió…
Thông tin (Information): là dữ liệu đã qua xử lý có dạng như sản phẩm hoàn chỉnh có ý nghĩa đối với người sử dụng. Nói cách khác, thông tin chính là dữ liệu chính xác, hệ thống hóa, dễ hiểu, có liên quan và kịp thời. Không giống như dữ liệu, thông tin là một giá trị có ý nghĩa, thực tế và con số có thể mang lại kết quả gì đó hữu ích.
Ví dụ: Dựa trên các dữ liệu về quá trình tham gia bảo hiểm xã hội, để tính mức chi trả trợ cấp thất nghiệp, rút bảo hiểm xã hội một lần, tính lương hưu; thống kê việc nợ bảo hiểm, nộp sai, nộp thiếu; …những số liệu này được gọi chung là thông tin, các thông tin đầy đủ, chính xác này sẽ giúp cho việc quản lý, giám sát được hiệu quả, nhanh chóng; phát hiện ra các bất thường…
Sơ đồ 2: Chuyển hóa dữ liệu và thông tin
Cơ sở dữ liệu (DB - Database): là hệ thống các dữ liệu có liên quan mật thiết với nhau. Những dữ liệu này chứa thông tin của một đối tượng nào đó (Bảo hiểm, ngân hàng, y tế…) chúng được lưu trữ trên bộ nhớ máy tính nhằm đáp ứng nhu cầu khai thác thông tin của nhiều người dùng với các mục đích khác nhau.
Sự khác biệt lớn nhất của Cơ sở dữ liệu và Dữ liệu là tính cấu trúc sắp xếp có hệ thống. Nếu chỉ là dữ liệu thì chúng có thể là bất cứ dạng nào có thể là chưa được sắp xếp hay được cấu trúc theo một trật tự nhất định. Ví dụ, văn bản trên một file, dữ liệu trên một tập tin, dữ liệu trong một Audio, Video đều được coi là dữ liệu.
Hệ quản trị cơ sở dữ liệu (DBMS - Database Management System): là phần mềm tương tác với người dùng cuối, sử dụng Cơ sở dữ liệu để thu thập và phân tích. Đây là một phần mềm máy tính cung cấp một môi trường thuận lợi và hiệu quả để tạo lập, lưu trữ và tìm kiếm CSDL.
Nhờ có hệ quản trị cơ sở dữ liệu, việc truy cập bởi nhiều người dùng trong cùng một lúc trở nên dễ dàng hơn. Hệ quản trị CSDL bao gồm các tiện ích cốt lõi được sử dụng để quản trị CSDL. CSDL, hệ quản trị CSDL và các ứng dụng liên quan đến chúng có thể coi là “Hệ thống cơ sở dữ liệu”.
1.2. So sánh khác biệt giữa dữ liệu, thông tin; cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu
Sự khác biệt giữa dữ liệu & thông tin:
- Dữ liệu là một đơn vị duy nhất chứa các dữ liệu và số liệu thô. Ngược lại, thông tin là tập hợp các dữ liệu hữu ích, có thể cung cấp kiến thức hoặc hiểu biết sâu sắc về cách thức cụ thể.
- Thông tin được lấy từ dữ liệu và do đó, dữ liệu không phụ thuộc vào thông tin, nhưng thông tin thì có.
- Dữ liệu được sử dụng làm đầu vào, cần được xử lý và sắp xếp theo kiểu cụ thể để tạo đầu ra, tức là thông tin.
- Dữ liệu không thể chỉ định bất cứ điều gì; không có mối quan hệ nào tồn tại giữa các khối dữ liệu trong khi thông tin là cụ thể và tồn tại mối tương quan.
- Dữ liệu không có ý nghĩa thực sự trong khi thông tin mang ý nghĩa nhất định.
Sự khác biệt giữa cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu:
Cơ sở dữ liệu chính là tập hợp các dữ liệu khác nhau được lưu vào máy tính theo một cấu trúc và logic nhất định. Còn hệ quản trị CSDL chính là phần mềm dùng để tạo lập, tìm kiếm và lưu trữ …CSDL. Để phân biệt hai khái niệm này, có thể dựa vào các đặc điểm cơ bản sau:
- Lưu trữ: CSDL có thể được lưu trữ trên giấy hoặc máy tính. Còn hệ quản trị CSDL thì các bản ghi chỉ được lưu trữ trên máy tính.
- Truy xuất dữ liệu: CDL có thể truy xuất thông tin bằng cách thực hiện thủ công, hoặc thông qua các chương trình…Còn hệ quản trị CSDL sẽ truy xuất dữ liệu thông qua các truy vấn được viết bằng ngôn ngữ SQL.
- Tốc độ: CSDL xử lý dữ liệu thủ công hoặc bằng máy, không dùng SQL nên rất chậm. Hệ quản trị CSDL dùng SQL nên tốc độ nhanh hơn.
- Thao tác: Với CSDL chúng ta khó sửa đổi nhiều thông tin tại một thời điểm còn hệ quản trị CSDL có thể làm được điều này.
- Sao lưu và phục hồi: CSDL không đảm bảo việc này còn hệ quản trị CSDL sẽ đảm bảo dữ liệu luôn sẵn sàng ngay cả khi hệ thống lỗi.
1.3. Phương pháp tổng hợp thông tin từ dữ liệu
Tổng hợp thông tin từ dữ liệu là một loại quy trình khai thác dữ liệu và thông tin trong đó dữ liệu được tìm kiếm, thu thập và trình bày theo định dạng tóm tắt dựa trên báo cáo để đạt được các mục tiêu hoặc quy trình kinh doanh cụ thể hoặc tiến hành phân tích con người.
Tổng hợp thông tin từ dữ liệu có thể được thực hiện thủ công hoặc thông qua phần mềm chuyên dụng. Với phương pháp thủ công đòi hỏi người phân tích, tổng hợp thông tin phải có các kiến thức chuyên môn và kiến thức về toán học, xác xuất – thống kê tốt. Tuy nhiên, ngày nay với việc phát triển nhanh chóng của công nghệ, việc tổng hợp thông tin thủ công đã được thay thế bởi các phần mềm chuyên dụng, giúp cho việc tổng hợp được nhanh chóng và chính xác hơn.
Tổng hợp thông tin từ dữ liệu là một thành phần của giải pháp kinh doanh thông minh (BI – Business intelligence), ra quyết định dựa trên dữ liệu (Data- driven decision making). Nhân viên tổng hợp thông tin từ dữ liệu hoặc cơ sở dữ liệu có liên quan và trình bày các kết quả dữ liệu theo định dạng tóm tắt có ý nghĩa và hữu ích cho người dùng cuối hoặc ứng dụng. Có rất nhiều phần mềm chuyên dụng hỗ trợ phân tích, trích xuất thông tin có ích từ dữ liệu như: RapidMiner, Microsoft Excel, Microsoft Power BI, Tableau, SPSS, Stata, Orange, QlikView…hoặc sử dụng các ngôn ngữ lập trình mạnh mẽ như: Python, R.
1.4. Tầm quan trọng của dữ liệu trong tổ chức
Trong những năm gần đây, cùng với sự phát triển như vũ bão của khoa học và công nghệ, đặc biệt là công nghệ thông tin và các hệ thống thông minh, đã đưa con người tiến tới một cuộc cách mạng mới, cuộc cách mạng khoa học và công nghệ lần thứ 4.
Sơ đồ 3: Quá trình phát triển của các cuộc cách mạng công nghiệp
Trong cuộc cách mạng này, dữ liệu được ví như một loại “vàng mới”. Khi có trong tay dữ liệu và biết cách phân tích các tổ chức xã hội, các công ty, doanh nghiệp... sẽ có những lợi thế cạnh tranh, tạo động lực và sự bứt phá. Dữ liệu ngày càng trở nên quan trọng và đặc biệt hữu ích cho dù ở lĩnh vực, hay bất kỳ ngành nghề nào. Khai thác dữ liệu tốt sẽ đóng vai trò quyết định giúp cho các tổ chức, tập đoàn đưa ra các giải pháp ngắn hạn nhanh chóng và kịp thời, cũng như dễ dàng triển khai các chiến lược phát triển trong tương lai.
Việt Nam được định vị là quốc gia số, tiến tới quốc gia thông minh; có thứ hạng quốc tế cao về dữ liệu: hạ tầng dữ liệu quốc gia bền vững, bao phủ các ngành, các lĩnh vực trọng điểm; chính phủ hoạt động dựa trên dữ liệu; dữ liệu đóng vai trò không thể thiếu trong quyết định chỉ đạo điều hành, quản trị quốc gia; kinh tế dữ liệu phát triển đã đi sâu vào hoạt động của xã hội chiếm tỉ trọng đáng kể trong nền kinh tế.
Việt Nam đang từng bước hội nhập sâu rộng, cũng đã nhận thức được tầm quan trọng của dữ liệu, chính phủ đang xây dựng “Chiến lược dữ liệu quốc gia” giai đoạn 2021-2025, định hướng đến 2030, nhằm xây dựng, phát triển dữ liệu số trong thời kỳ chuyển đổi số nhằm:
Xây dựng và khai thác hiệu quả giá trị từ dữ liệu nhằm thúc đẩy, phát huy trí tuệ, nguồn lực và sức mạnh quốc gia. Dữ liệu gắn kết với năng lực quản trị nhà nước, mang lại tiềm năng bứt phá của nền kinh tế, phản ánh giá trị văn hóa, lịch sử và trí tuệ toàn dân trong đời sống xã hội.
Dữ liệu là yếu tố cốt lõi, không thể tách rời của chuyển đổi số. Việc triển khai các giải pháp Chính phủ điện tử, Chính phủ số luôn phải gắn với mục tiêu làm giàu dữ liệu, tạo nền tảng cho hoạt động thực hiện chuyển đổi số trong xã hội.
Giá trị của dữ liệu chỉ có được qua thu thập, xử lý và khai thác theo phương thức phù hợp. Sử dụng dữ liệu để thúc đẩy hiệu quả, cải thiện các dịch vụ công, đơn giản hóa thủ tục hành chính, cải thiện sự phục vụ của cơ quan nhà nước cho người dân, doanh nghiệp, cộng đồng và toàn xã hội.
Kinh tế về dữ liệu là động lực mới cho phát triển kinh tế, xã hội trong giai đoạn chuyển đổi số.
- Huy động, khuyến khích mọi nguồn lực xã hội để xây dựng, phát triển hạ tầng dữ liệu quốc gia.
- Quản trị dữ liệu là yếu tố tiên quyết, nhiệm vụ trọng tâm trong quá trình phát triển. Dữ liệu các ngành, lĩnh vực của cơ quan nhà nước phải được kết nối, lưu trữ tập trung để chia sẻ, phân tích và sử dụng lại nhằm tạo ra các giá trị mới.
Để thực hiện được những điều đó, trong thời gian tới các Bộ, Ban, ngành sẽ đẩy mạnh rà soát, củng cố, tái tạo, chuẩn hóa dữ liệu hiện có, nâng cao chất lượng dữ liệu; phân loại dữ liệu theo cấp độ chất lượng phù hợp; cấu trúc hóa dữ liệu nửa cấu trúc và phi cấu trúc; tạo lập dữ liệu đặc tả cho dữ liệu. Tăng cường xây dựng tạo lập dữ liệu mới bằng việc triển khai các chiến dịch số hóa để chuyển đổi các đối tượng quản lý, hoạt động, sự kiện lên môi trường số, tập trung vào một số lĩnh vực sau:
- Dữ liệu về hoạt động hành chính trong cơ quan nhà nước: văn bản, tài liệu hình thành trong quá trình hoạt động của cơ quan nhà nước, hồ sơ thủ tục hành chính của tổ chức, cá nhân, dữ liệu phục vụ cải cách hành chính, hiện đại hóa hành chính công vụ.
- Dữ liệu về người dân và các hoạt động xã hội: bảo hiểm, hộ tịch, giáo dục (giáo viên, học sinh, sinh viên), lao động (lao động tay nghề cao, lao động làm việc ở nước ngoài).
- Dữ liệu về tổ chức: các tổ chức chính trị, chính trị-xã hội, xã hội, hội, hiệp hội; doanh nghiệp; hộ gia đình kinh doanh.
- Dữ liệu về hoạt động sản xuất và phát triển kinh tế, dữ liệu về thị trường, các quy trình sản xuất chuẩn, điển hình làm cơ sở tham chiếu, sử dụng cho các doanh nghiệp.
- Dữ liệu về tài nguyên: đất đai, địa chính, địa chất, khoáng sản, nông nghiệp, khai khoáng, du lịch và dịch vụ...
- Dữ liệu về cơ sở hạ tầng công cộng: thực hiện số hóa thực thể dữ liệu số về hạ tầng công cộng: hạ tầng cung cấp, truyền tải điện; cấp thoát nước; vệ sinh môi trường đô thị; chiếu sáng; cây xanh... và các hoạt động liên quan đến quản lý, vận hành hạ tầng công cộng.
Dữ liệu là tài sản chiến lược của cơ quan, tổ chức; là nguồn tài nguyên mới để phát triển kinh tế; do đó phải tăng cường khám phá, trích xuất tìm ra được những giá trị mới có ích; Giá trị của dữ liệu nằm ở cách sử dụng dữ liệu; bất kỳ dữ liệu nào đều sẽ có giá trị nếu được phân tích, khai phá và chắt lọc.
Các công ty, doanh nghiệp hàng đầu trên thế giới ngày nay đều là các công ty đang nắm giữ trong tay một lượng dữ liệu khổng lồ và biết khai thác các dữ liệu một cách hiệu quả. Đây là minh chứng rõ nét nhất cho tầm quan trọng của dữ liệu trong kỷ nguyên số hiện nay.
“Dữ liệu là nguồn tài nguyên quý của Quốc gia, là động lực, nguồn lực cho sự phát triển trong kỷ nguyên số” (Thủ tướng Phạm Minh Chính - Hội nghị toàn quốc Chuyển đổi số quốc gia - ngày 25/02/2023).
1.5. Những thách thức khác nhau trong quản lý dữ liệu
Quản lý dữ liệu là quá trình thu thập, lưu trữ, bảo mật và sử dụng dữ liệu của một tổ chức. Ngày nay, mặc dù sở hữu nhiều nguồn dữ liệu khác nhau, tuy nhiên các tổ chức phải phân tích và tích hợp dữ liệu để khai thác nghiệp vụ thông minh cho việc hoạch định chiến lược. Quá trình quản lý dữ liệu bao gồm: tất cả các chính sách, công cụ và quy trình nhằm cải thiện khả năng sử dụng dữ liệu trong khuôn khổ luật pháp và quy định.
Tuy nhiên, các nhà quản lý, tổ chức, doanh nghiệp cũng phải đối mặt với nhiều thách thức khác nhau trong quá trình thu thập, lưu trữ và khai thác dữ liệu như:
- Chất lượng dữ liệu kém: Dữ liệu được lưu trữ trong các CSDL có cấu trúc hoặc kho lưu trữ thường không đầy đủ, không nhất quán hoặc lỗi thời.
- Dữ liệu tồn tại ở nhiều nơi, nhiều định dạng khác nhau và tăng trưởng rất nhanh: Dữ liệu có ở khắp mọi nơi và ngày càng nhiều. Tốc độ sinh dữ liệu ngành một tăng, hầu hết dữ liệu mới ở dạng không có cấu trúc, nên việc tổ chức, lưu trữ và truy xuất chúng khó khăn và phức tạp hơn rất nhiều so với các dữ liệu có cấu trúc. Nếu việc truy cập dữ liệu không dễ dàng, dữ liệu bị trùng lặp, không thống nhất…thì sẽ không thể tận dụng cho mục đích khai thác thông tin từ chúng.
- Chi phí duy trì, nâng cấp và quản lý dữ liệu: Mặc dù dung lượng lưu trữ đang tăng lên nhanh chóng, nhưng không vì thế mà giá thành cho các dịch vụ dữ liệu giảm đi và cạnh tranh hơn, ngược lại chi phí lại có phần tăng cao. Việc triển khai và duy trì cơ sở hạ tầng lưu trữ, bao gồm phần cứng, phần mềm, và chi phí vận hành liên tục, sẽ là một thách thức tài chính, đặc biệt là với các tổ chức, doanh nghiệp vừa và nhỏ.
- Bảo mật dữ liệu: Bảo mật dữ liệu luôn là mối quan tâm hàng đầu của các tổ chức và doanh nghiệp. Việc lưu trữ dữ liệu ở nhiều vị trí khác nhau, như tại chỗ (on premise), trên đám mây (cloud) hoặc thiết bị di động sẽ làm tăng nguy cơ vi phạm dữ liệu, truy cập trái phép và đánh mất dữ liệu. Các mối đe dọa an ninh mạng, bao gồm hacker, phần mềm độc hại…đặt ra những thách thức đáng kể trong việc bảo vệ các dữ liệu nhạy cảm được lưu trữ trong các môi trường lưu trữ khác nhau.
Ý kiến bạn đọc
Nhấp vào nút tại mỗi ô tìm kiếm.
Màn hình hiện lên như thế này thì bạn bắt đầu nói, hệ thống giới hạn tối đa 10 giây.
Bạn cũng có thể dừng bất kỳ lúc nào để gửi kết quả tìm kiếm ngay bằng cách nhấp vào nút micro đang xoay bên dưới
Để tăng độ chính xác bạn hãy nói không quá nhanh, rõ ràng.