TIÊU CHUẨN QUỐC GIA
TCVN 14159-2:2024
ISO 19005-2:2005
QUẢN LÝ TÀI LIỆU - ĐỊNH DẠNG TỆP TÀI LIỆU ĐIỆN TỬ CHO BẢO QUẢN LÂU DÀI – PHẦN 2: SỬ DỤNG ISO 32000-1 (PDF/A-2)
Document management- Electronic document file format for long-term preservation - Part 2: Use of ISO 32000-1 (PDF/A-2)
Lời nói đầu
TCVN 14159-2:2024 hoàn toàn tương đương với ISO 19005-2:2011.
TCVN 14159-2:2024 do Thư viện Quốc gia Việt Nam biên soạn, Bộ Văn hóa, Thể thao và Du lịch đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.
Bộ TCVN 14159 (ISO 19005) Quản lý tài liệu - Định dạng tệp tài liệu cho bảo quản lâu dài gồm 2 phần:
TCVN 14159-1:2024 (ISO 19005-1:2005), Phần 1: Sử dụng PDF 1.4 (PDF/A-1);
- TCVN 14159-2:2024 (ISO 19005-2:2011), Phần 2: Sử dụng ISO 32000-1 (PDF/A-2);
Bộ ISO 19005 Document management còn các phần sau:
- ISO 19005-3:2012, Part 3: Use of ISO 32000-1 with support for embedded files (PDF/A-3) (Sử dụng ISO 32000-1 với hỗ trợ cho tệp nhúng (PDF/A-3);
- ISO 19005-4:2020, Part 4: Use of ISO 32000-2 (PDF/A-4) (Sử dụng ISO 32000-2 (PDF/A-4).
Lời giới thiệu
PDF là một định dạng số để trình bày các tài liệu theo trang. Các tệp PDF có thể ở dạng nguyên bản PDF, được chuyển đổi từ định dạng điện tử hoặc số hóa từ giấy, vi dạng, hoặc dạng bản cứng khác. Các doanh nghiệp, chính phủ, thư viện, cơ quan lưu trữ, các tổ chức và cá nhân trên toàn thế giới sử dụng PDF đề trình bày các phần chính yếu của nội dung thông tin quan trọng. Phần lớn thông tin này cần được lưu giữ trong một khoảng thời gian dài; một số cần được lưu giữ vĩnh viễn- Những tệp PDF này phải có khả năng sử dụng và truy cập qua nhiều thế hệ công nghệ khác nhau. Tuy nhiên, tính tổng thể, tính năng đa dạng của định dạng đòi hỏi phải có những ràng buộc đối với việc sử dụng và để phù hợp với việc bảo quản lâu dài các tài liệu điện tử. Việc sử dụng và truy cập vào các đối tượng này trong tương lai phụ thuộc vào việc duy trì hình thức trực quan cũng như các đặc tính bậc cao của chúng, như tính tổ chức logic của các trang, các phần và các đoạn, dòng văn bản có khả năng tự khôi phục theo trật tự đọc tự nhiên, đa dạng trong quản lý, bảo quản và mô tả siêu dữ liệu.
TCVN 14159 (ISO 19005) được xây dựng dưới dạng tài liệu gồm nhiều phần, trong đó đây là Phần 2. Điều này cho phép tạo lập các phần trong tương lai mà không cần kết xuất TCVN 14159 (ISO 19005), hoặc các ứng dụng dựa trên tiêu chuẩn này đã lỗi thời.
Mục đích chính của TCVN 14159 (ISO 19005) là để quy định một định dạng tệp dựa trên PDF, được gọi là PDF/A, cung cấp cơ chế trình bày tài liệu điện tử theo cách bảo quản hình thức trực quan của tài liệu theo thời gian, không phụ thuộc vào các công cụ và hệ thống được sử dụng để tạo lập, lưu trữ hoặc kết xuất tệp.
Mục đích thứ hai của TCVN 14159 (ISO 19005) là quy định một bộ khung để trình bày cấu trúc logic và thông tin ngữ nghĩa khác của tài liệu điện từ bên trong các tệp phù hợp.
Một mục đích khác của TCVN 14159 (ISO 19005) là cung cấp một bộ khung để ghi lại bối cảnh và lịch sử của tài liệu điện tử trong siêu dữ liệu bên trong các tệp phù hợp.
Những mục tiêu này được thực hiện bằng cách định danh một bộ các thành phần PDF có thể sử dụng được và những hạn chế về mẫu sử dụng chúng, trong tệp PDF/A phù hợp.
PDF/A không nhất thiết phải đảm bảo rằng hình thức trực quan của nội dung phải phản ánh chính xác bất kỳ tài liệu nguồn ban đầu nào được sử dụng để tạo lập tệp phù hợp, ví dụ: quá trình tạo ra một tệp phù hợp có thể thay thế phông chữ, chỉnh sửa văn bản, giảm chất lượng ảnh hoặc sử dụng tính năng nén có tổn hao. Các tổ chức cần đảm bảo rằng tệp phù hợp là bản thể hiện chính xác của tài liệu nguồn ban đầu, có thể đặt ra các yêu cầu bổ sung, chẳng hạn như thực hành tốt trong Phụ lục C, đối với các quá trình tạo lập tệp phù hợp nằm ngoài những quy định được áp dụng theo tiêu chuẩn này. Ngoài ra, điều quan trọng là các tổ chức phải áp dụng các chính sách và thực hành liên quan đến việc Kiểm tra các tệp phù hợp cho đúng hình thức trực quan.
PDF/A không đề cập trực tiếp đến tính xác thực, dù là với nội dung cơ bản được thể hiện trực quan hoặc đối với chính tệp PDF/A. Tính xác thực như vậy thường được xem là quan trọng đối với các mục đích pháp lý, quy định và quản trị và nằm ngoài phạm vi của tiêu chuẩn này.
Tiêu chuẩn này là một thành phần của môi trường lưu trữ điện tử của tổ chức để lưu giữ lâu dài tài liệu. Việc áp dụng thành công tiêu chuẩn này cho mục đích lưu trữ phụ thuộc vào:
- các yêu cầu lưu giữ của môi trường lưu trữ của một tổ chức, các chính sách và thủ tục quản lý hồ sơ, như được quy định trong TCVN 7420-1 (ISO 15489-1);
- bất kỳ yêu cầu và điều kiện bổ sung cần thiết nào để đảm bảo sự tồn tại của tài liệu điện tử và các đặc điểm của chúng theo thời gian, bao gồm, nhưng không giới hạn ở những yêu cầu và điều kiện được quy định trong ISO 14721, ISO/TR 15801 và ISO/TR 18492;
- các quá trình đảm bảo chất lượng cần thiết để xác minh sự phù hợp với các yêu cầu và điều kiện áp dụng, ví dụ: một chế độ kiểm tra để xác minh chất lượng và tính toàn vẹn của dữ liệu nguồn được chuyển đổi.
Tiêu chuẩn này chỉ dẫn việc phát triển các ứng dụng khác nhau để đọc, kết xuất, ghi và xác nhận các tệp phù hợp. Các ứng dụng phải kết hợp các khả năng khác nhau để chuẩn bị, diễn giải và xử lý các tệp phù hợp dựa trên nhu cầu mà các nhà cung cấp ứng dụng đó nhận biết. Tuy nhiên, điều quan trọng cần chú ý là một ứng dụng phù hợp cần có khả năng đọc và xử lý thích hợp tất cả các tệp tuân thủ mức độ phù hợp đã quy định.
Tiêu chuẩn này mở rộng các khả năng của TCVN 14159-1 (ISO 19005-1). Tiêu chuẩn này được xây dựng dựa trên phiên bản PDF 1.7 chứ không phải PDF phiên bản 1.4 (được sử dụng làm cơ sở của TCVN 14159-1 (ISO 19005-1). Các khả năng bổ sung này có thể được thực hiện thông qua việc tuân thủ ISO 32000-1 và bao gồm:
- cải tiến đối với tệp PDF được gắn thẻ (để tăng cường khả năng truy cập),
- các dòng nén Object và XRef (đối với kích thước tệp nhỏ hơn),
- phần đính kèm tệp tuân thủ PDF/A, bộ sưu tập di động và các gói PDF,
- hiệu ứng trong suốt, và
- nén JPEG 2000.
Tiêu chuẩn này (cùng với các viện dẫn tham khảo) cung cấp đầy đủ thông tin để giải thích bất kỳ tệp PDF/A-2 phù hợp nào.
NPES và AIIM (các tổ chức phát triển
tiêu chuẩn được công nhận) duy trì một loạt phiên bản của các ghi chú ứng dụng
để hướng dẫn các nhà phát triển và người sử dụng tiêu chuẩn này. Những ghi chú ứng
dụng này có sẵn tại trang
QUẢN LÝ TÀI LIỆU - ĐỊNH DẠNG TỆP TÀI LIỆU ĐIỆN TỬ CHO BẢO QUẢN LÂU DÀI - PHẦN 2: SỬ DỤNG ISO 32000-1 (PDF/A-2)
Document management - Electronic document file format for long-term preservation - Part 2: Use ISO 32000-1 (PDF/A-2)
1 Phạm vi áp dụng
Tiêu chuẩn này quy định việc sử dụng Định dạng Tài liệu Di động (PDF) 1.7, như được chính thức hóa trong ISO 32000-1, để bảo quản lâu dài dạng trình bày trực quan tĩnh của tài liệu điện tử dưới dạng trang.
Tiêu chuẩn này không áp dụng cho:
- các quá trình cụ thể để chuyển đổi các tài liệu giấy hoặc điện tử sang định dạng PDF/A,
- thiết kế kỹ thuật cụ thể, giao diện người sử dụng, sự áp dụng hoặc chi tiết hoạt động kết xuất,
- các phương pháp vật lý cụ thể để lưu trữ các tài liệu này chẳng hạn như phương tiện và điều kiện lưu trữ, hoặc
- yêu cầu về phần cứng máy tính và/ hoặc hệ điều hành.
2 Tài liệu viện dẫn
Các tài liệu được viện dẫn sau là rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu có ghi năm công bố thì áp dụng bản được nêu. Đối với các tài liệu không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi, bổ sung (nếu có).
TCVN 11777-2:2018 (ISO/IEC 15444-2:2004), Công nghệ thông tin - Hệ thống mã hóa ảnh JPEG 2000: Phần mở rộng (Information technology - JPEG 2000 image coding system: Extensions)
TCVN 14159-1 (ISO 19005-1), Quản lý tài liệu Định dạng tệp tài liệu điện tử cho bảo quản lâu dài - Phần 1: Sử dụng PDF 1.4 (PDF/A-1)
ISO/IEC 646, Information technology - ISO 7-bit coded character set for information interchange (Công nghệ thông tin - Bộ ký tự mã ISO 7 bit để trao đổi thông tin)[1]
ISO/IEC 10646, Information technology - Universal Coded Character Set (UCS) (Công nghệ thông tin - Bộ ký tự tổng hợp mã hóa (UCS)[2]
ISO 15076-1, Image technology colour management - Architecture, profile format and data structure - Part 1: Based on ICC.1:2010 (Công nghệ hình ảnh quản lý màu sắc - Kiến trúc, định dạng hồ sơ và cấu trúc dữ liệu - Phần 1: Dựa trên ICC.1:2010)
ISO 15930-7:2010, Graphic technology - Prepress digital data exchange using PDF - Part 7: Complete exchange of printing data (PDF/X-4) and partial exchange of printing data with external profile reference (PDF/X-4p) using PDF 1.6 (Công nghệ đồ họa - Chế bản trao đổi dữ liệu số sử dụng PDF - Phần 7: Trao đổi toàn bộ dữ liệu in (PDF/X-4) và trao đổi một phần dữ liệu in với tham chiếu hồ sơ bên ngoài (PDF/X- 4p) bằng cách sử dụng PDF 1.6)
ISO 24517-1, Document management - Engineering document format using PDF - Part 1: Use of PDF 1.6 (PDF/E-1) (Quản lý tài liệu - Định dạng tài liệu kỹ thuật sử dụng PDF - Phần 1: Sử dụng của PDF 1.6 (PDF/E-1))
ISO 32000-1:2008, Document management - Portable document format - Part 1: PDF 1.7 (Quản lý tài liệu - Định dạng tài liệu di động - Phần 1: PDF 1.7)
Extensible Markup Language (XML) 1.0 (Third
Edition),
W3C Recommendation, (Ngôn ngữ đánh dấu mở rộng (XML), 1.0 (Ấn bản lần thứ
3) Khuyến nghị W3C), ngày 4 tháng 2 năm 2004. Sẵn có trên Internet
ICC.1:1998-09, File Format for Color
Profiles,
International Color Consortium. (Định dạng tệp cho Hồ sơ Màu sắc, Hiệp hội Màu
Quốc tế). Sẵn có
trên Internet
ICC.1:2001-12, File Format for Color
Profiles (Version 4.0.0), International Color Consortium. (Định dạng tệp cho Hồ
sơ Màu sắc (Phiên bản 4.0.0), Hiệp hội Màu Quốc tế). Sẵn có trên Internet
ICC.1:2003-09, File Format for Color
Profiles (Version 4.1.0), International Color Consortium (ICC. 1:2003-09, Định dạng tệp
cho Hồ sơ Màu sắc (Phiên bản 4.1.0), Hiệp hội Màu Quốc tế)). Sẵn có trên
Internet
RDF/XML Syntax Specification (Revised), W3C Recommendation. (RDF/XML
Đặc
tả Cú pháp (đã thay thế), Khuyến nghị W3C), ngày 10 tháng 2 năm 2004.
Sẵn có trên Internet
RFC 2315, PKCSW7: Cryptographic
Message Syntax Version 1.5 (RFC 2315, PKCS#7: Cú pháp Thông điệp mật
mã Phiên bản 1.5). Sẵn có trên Internet
RFC 3280, Internet X.509 Public Key
Infrastructure Certificate and Certificate Revocation List (CRL) Profile. (RFC 3280, Internet
X.509 Chứng
chỉ cơ sở hạ tầng
Khóa công cộng và Hồ sơ danh
sách thu hồi chứng chỉ (CRL)). Sẵn có trên Internet
Adobe Glyph List, 20 September 2002, Adobe
Systems Incorporated
(Danh
sách Biểu tượng Adobe, ngày 20 tháng 9 năm 2002, Tập đoàn Adobe),
Adobe Supplement to ISO
32000-1,
BaseVersion 1.7, ExtensionLevel 5, Adobe Systems Incorporated. (Phần bổ sung của
Adobe cho ISO 32000-1, Trên cơ sở phiên bản 1.7, Mức mở rộng 5, Tập
đoàn Adobe). Sẵn có trên Internet
3 Thuật ngữ và định nghĩa
Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa sau.
3.1
Mức độ phù hợp (Conformance level)
Bộ định danh các hạn chế và yêu cầu mà tệp và trình đọc phải tuân thủ
3.2
Tài liệu điện tử (Electronic document)
Thể hiện điện tử của một tập hợp theo trang, bao gồm văn bản, đồ họa và siêu dữ liệu được định danh dưới dạng điện tử, hiểu và kết xuất được dữ liệu, có thể sao chép trên giấy hoặc vi dạng quang học mà không làm mất nội dung thông tin
3.3
Dấu kết thúc tệp (End-of-file marker)
Chuỗi năm ký tự (%%EOF) đánh dấu kết thúc tệp PDF
3.4
Dấu kết thúc dòng (End-of-line marker)
Dấu EOL (EOL marker)
Chuỗi một hoặc hai ký tự đánh dấu kết thúc của một dòng của văn bản, bao gồm một ký tự CARRIAGE RETURN (0Dh) hoặc một ký tự LINE FEED (0Ah) hoặc một ký tự CARRIAGE RETURN mà liền sau đó là ký tự LINE FEED
3.5
Lược đồ mở rộng (Extension schema)
Lược đồ XMP phù hợp mà không được quy định trong Đặc tả XMP, và cũng không quy định cả trong TCVN 14159-1 (ISO 19005-1) hoặc TCVN 14159-2 (ISO 19005-2)
3.6
Phông chữ (Font)
Bộ sưu tập định danh của các đồ họa có thể là biểu tượng hoặc các phần tử đồ họa khác
[ISO 32000-1]
3.7
Chương trình phông chữ (Font program)
Chương trình phần mềm được viết bằng ngôn ngữ dành cho mục đích đặc biệt, chẳng hạn như định dạng phông chữ Type 1, TrueType hoặc OpenType, được hiểu bởi trình thông dịch phông chữ chuyên dụng
[ISO 32000-1]
3.8
Trình đọc tương tác (Interactive reader)
Trình đọc yêu cầu hoặc cho phép con người tương tác với nội dung và các đối tượng khác có trong tài liệu trong suốt quá trình xử lý của phần mềm
CHÚ THÍCH: Công cụ hiển thị tệp là một ví dụ của trình đọc tương tác; bộ xử lý hình ảnh lưới tọa độ là một ví dụ về trình đọc không tương tác
3.9
Phù hợp mức độ A (Level A conformance)
Mức độ phù hợp bao gồm tất cả các yêu cầu trong tiêu chuẩn này
3.10
Phù hợp mức độ B (Level B conformance)
Mức độ phù hợp bao gồm tất cả các yêu cầu trong tiêu chuẩn này về hình thức trực quan của tài liệu điện tử, nhưng không liên quan đến các đặc tính cấu trúc và ngữ nghĩa của chúng cũng như yêu cầu rằng tất cả văn bản phải có Unicode tương đương.
3.11
Phù hợp mức độ U (Level U conformance)
Mức độ phù hợp bao gồm tất cả các yêu cầu của tiêu chuẩn này về hình thức trực quan của tài liệu điện tử, cùng với yêu cầu rằng tất cả văn bản phải có Unicode tương đương
3.12
Lâu dài (Long term)
Khoảng thời gian đủ dài để đánh giá về các tác động của việc thay đổi công nghệ, bao gồm hỗ trợ cho định dạng dữ liệu và công nghệ mới, sự thay đổi của cộng đồng người sử dụng thông tin trong kho lưu trữ và có thể kéo dài không xác định thời gian
3.13
Định dạng tài liệu di động (Portable Document Format)
Định dạng tệp được quy định trong ISO 3200-1:2008
3.14
Trình đọc (Reader)
Ứng dụng phần mềm có khả năng đọc và xử lý các tệp PDF/A
3.15
Trình ghi (Writer)
Ứng dụng phần mềm có khả năng ghi tệp PDF/A
3.16
Gói XMP (XMP packet)
Trình bọc có cấu trúc cho siêu dữ liệu XMP có thể được nhúng trong PDF cũng như trong các định dạng tệp khác
4 Ký hiệu
Toán tử PDF, từ khóa PDF, các tên của các khóa trong mục từ PDF và các tên được định trước khác, được viết bằng phông chữ sans serif đậm; toán hạng của toán tử PDF hoặc giá trị của khóa mục từ được viết bằng phông chữ sans serif in nghiêng. Một số tên cũng có thể được sử dụng làm giá trị, tùy thuộc vào bối cảnh và do đó kiểu dáng của nội dung phải theo bối cảnh cụ thể.
VÍ DỤ 1: Giá trị Default cho khóa TR2.
Các ký tự mã thông báo được sử dụng để phân tách các đối tượng và mô tả cấu trúc của tệp PDF, như được quy định trong 7.2.1, ISO 32000-1:2008, có thể được định danh bằng tên ký tự trong ISO/IEC 646, được viết bằng chữ hoa, đậm, phông chữ sans serif, theo sau là giá trị ký tự thập lục phân có hai chữ số trong dấu ngoặc đơn với hậu tố “h”.
VÍ DỤ 2: CARRIAGE RETURN (0Dh).
Các ký tự chuỗi văn bản, như được quy định trong 7.9.2, ISO 32000-1:2008, có thể được định danh bằng tên ký tự như trong TCVN 1069 (ISO/IEC 10646-1), được viết bằng chữ hoa, phông chữ sans serif đậm, theo sau là mã giá trị ký tự thập lục phân có bốn chữ số trong dấu ngoặc đơn với tiền tố “U+”.
VÍ DỤ 3: EN SPACE (U+2002)
Các thuật ngữ sau, viện dẫn đến TCVN 14159 (ISO 19005), hoặc các phần của nó, được khuyến nghị khi tên ISO đầy đủ không được sử dụng:
- “PDF/A” - đồng nghĩa với bộ tiêu chuẩn TCVN 14159 (ISO 19005);
- “PDF/A-1” - đồng nghĩa với TCVN 14159-1 (ISO 19005-1);
- “PDF/A-1a” - đồng nghĩa với TCVN 14159-1 (ISO 19005-1) phù hợp mức độ A;
- “PDF/A-1b” - đồng nghĩa với TCVN 14159-1 (ISO 19005-1) phù hợp mức độ B.
- “PDF/A-2” - đồng nghĩa với TCVN 14159-2 (ISO 19005-2);
- “PDF/A-2a” - đồng nghĩa với TCVN 14159-2 (ISO 19005-2); phù hợp mức độ A;
- “PDF/A-2b” - đồng nghĩa với TCVN 14159-2 (ISO 19005-2); phù hợp mức độ B;
- “PDF/A-2u” - đồng nghĩa với TCVN 14159-2 (ISO 19005-2); phù hợp mức độ U.
5 Mức độ phù hợp
5.1 Yêu cầu chung
Tiêu chuẩn này quy định định dạng tệp để trình bày cho các tài liệu điện tử được gọi là “PDF/A-2”. Các tệp PDF/A-2 phù hợp phải tuân theo tất cả các yêu cầu của ISO 32000-1 như được sửa đổi trong tiêu chuẩn này. Một tệp phù hợp có thể bao gồm bất kỳ các tính năng hợp lệ nào trong ISO 32000-1 mà tiêu chuẩn này không phải áp dụng. Không nên sử dụng các tính năng được mô tả trong quy định kỹ thuật PDF trước Phiên bản 1.7 mà không được mô tả rõ ràng trong ISO 32000-1.
CHÚ THÍCH 1: Tệp phù hợp không bắt buộc phải sử dụng bất kỳ tính năng PDF nào khác ngoài những tính năng được yêu cầu rõ ràng bởi ISO 32000-1 hoặc tiêu chuẩn này.
Như được mô tả trong 6.1.2, số phiên bản của tệp có thể là bất kỳ giá trị nào từ 1.0 đến 1.7 và giá trị này không được sử dụng để xác định xem tệp có phù hợp với tiêu chuẩn này hay không.
CHÚ THÍCH 2: Cơ chế thích hợp mà một tệp có thể giả định định danh một tệp PDF/A-2 của một mức độ phù hợp được mô tả trong 6.6.4.
5.2 Phù hợp mức độ A
Các tệp phù hợp mức độ A phải tuân theo tất cả các yêu cầu của tiêu chuẩn này. Một tệp đáp ứng mức độ phù hợp này được cho là “tệp PDF/A-2a phù hợp”.
5.3 Phù hợp mức độ B
Các tệp phù hợp mức độ B phải tuân theo tất cả các yêu cầu của tiêu chuẩn này ngoại trừ các đối tượng của 6.2.11.7 và 6.7. Một tệp đáp ứng mức độ phù hợp này được gọi là “tệp PDF/A-2b phù hợp”.
CHÚ THÍCH 1: Các yêu cầu phù hợp mức độ B nhằm đạt mức cần thiết tối thiểu để đảm bảo rằng hình thức trực quan được kết xuất của một tệp phù hợp có thể được bảo quản trong thời gian dài. Tuy nhiên, tệp phù hợp mức độ B có thể không có đầy đủ thông tin nội bộ để cho phép bảo quản cấu trúc logic của tài liệu và nội dung dòng văn bản theo trật tự đọc tự nhiên, được cung cấp bởi yêu cầu phù hợp mức độ A. Những yêu cầu để phù hợp mức độ A đặt trách nhiệm lớn hơn cho trình ghi của tệp phù hợp và các đối tượng chuẩn bị các tệp này, nhưng những yêu cầu này cho phép mức độ cao hơn của dịch vụ bảo quản tài liệu và sự tin cậy theo thời gian. Thêm vào đó, yêu cầu phù hợp mức độ A tạo điều kiện thuận lợi cho khả năng truy cập của các tệp phù hợp cho những người sử dụng bị khiếm khuyết về thể chất.
CHÚ THÍCH 2: Một tệp phù hợp mức độ B có thể bao gồm các tính năng từ 6.2.11.7 và 6.7 nhưng vẫn được định danh như mức độ B.
5.4 Phù hợp mức độ U
Các tệp phù hợp mức độ U phải tuân theo tất cả các yêu cầu của tiêu chuẩn này ngoại trừ các đối tượng của 6.7. Một tệp đáp ứng mức độ phù hợp này được gọi là “tệp PDF/A-2u phù hợp”.
CHÚ THÍCH 1: Các yêu cầu phù hợp mức độ U nhằm đạt mức cần thiết để đảm bảo rằng không chỉ hình thức trực quan được kết xuất của một tệp phù hợp có thể được bảo quản trong thời gian dài, nhưng bất kỳ văn bản nào có trong tài liệu đều có thể được trích xuất một cách đáng tin cậy dưới dạng một loạt các điểm mã Unicode. Tuy nhiên, tệp phù hợp mức độ U có thể không có đầy đủ thông tin nội bộ để cho phép bảo quản cấu trúc logic của tài liệu và nội dung dòng văn bản theo trật tự đọc tự nhiên, được cung cấp bởi phù hợp mức độ A. Những yêu cầu để phù hợp mức độ A đặt trách nhiệm lớn hơn cho trình ghi của tệp phù hợp và các đối tượng chuẩn bị các tệp này, nhưng những yêu cầu này cho phép mức độ cao hơn của dịch vụ bảo quản tài liệu và sự tin cậy theo thời gian. Thêm vào đó, phù hợp mức độ A tạo điều kiện thuận lợi cho khả năng truy cập của các tệp phù hợp cho những người sử dụng bị khiếm khuyết về thể chất.
CHÚ THÍCH 2: Một tệp phù hợp mức độ U có thể bao gồm các tính năng từ 6.7 nhưng vẫn được định danh như mức độ U.
CHÚ THÍCH 3: Mức độ U là mức độ mới trong tiêu chuẩn này và do đó không có quy định tương đương trong TCVN 14159-1 (ISO 19005-1).
5.5 Trình đọc phù hợp
Một trình đọc phù hợp phải tuân thủ tất cả các yêu cầu liên quan đến chức năng hoạt động của trình đọc được quy định trong tiêu chuẩn này. Những yêu cầu của tiêu chuẩn này đối với chế độ của trình đọc được nêu trong các yêu cầu chức năng tổng quan ứng dụng cho tất cả các trình đọc phù hợp. Tiêu chuẩn này không quy định bất kỳ thiết kế kỹ thuật cụ thể, giao diện người sử dụng hoặc chi tiết việc áp dụng của các trình đọc phù hợp.
Việc kết xuất và xử lý của các tệp phù hợp phải được thực hiện như được quy định trong ISO 32000-1 tuân theo các hạn chế bổ sung được quy định trong tiêu chuẩn này. Các tính năng được mô tả trong quy định kỹ thuật PDF không được mô tả rõ ràng trong ISO 32000-1 phải bị bỏ qua bởi trình đọc phù hợp.
Trình đọc PDF/A-2 phù hợp phải đọc và xử lý thích hợp tất cả các tệp PDF/A-2. Ngoài ra, các trình đọc PDF/A-2 phù hợp phải đọc và xử lý thích hợp tất cả các tệp PDF/A-1 theo quy định của TCVN 14159-1 (ISO 19005-1).
6 Yêu cầu kỹ thuật
6.1 Cấu trúc tệp
6.1.1 Yêu cầu chung
Các vấn đề về định dạng tệp và các phần tử cơ sở hình thành cấu trúc chung của tệp phù hợp được quy định trong 6.1.2 đến 6.1.12.
Bất kỳ dữ liệu nào có trong tệp phù hợp không được mô tả trong ISO 32000-1 hoặc trong tiêu chuẩn này bị bỏ qua bởi trình đọc phù hợp và không được sử dụng để kết xuất nội dung trên một trang.
6.1.2 Tiêu đề tệp
Tiêu đề tệp phải bắt đầu từ byte 0 và bao gồm “%PDF-1.n” theo sau bởi một dấu EOL, ở đó ‘n’ là một chữ số đơn trong khoảng từ 0 (30h) đến 7 (37h).
Dấu EOL nói trên phải được ký tự % đặt ngay đằng sau (25h), theo sau là ít nhất bốn byte, mỗi giá trị byte được mã hóa trong đó phải có giá trị thập phân lớn hơn 127.
CHÚ THÍCH: Sự hiện diện của các giá trị ký tự byte được mã hóa lớn hơn giá trị thập phân 127 gần đầu tệp được sử dụng bởi các công cụ phần mềm và giao thức khác nhau để phân loại tệp là chứa dữ liệu nhị phân 8 bit cần được bảo quản trong quá trình xử lý.
6.1.3 Đoạn giới thiệu tệp
Mục từ giới thiệu tệp sẽ chứa từ khóa ID có giá trị là Các yếu tố định danh tệp như được quy định trong 14.4, ISO 32000-1:2008.
CHÚ THÍCH 1: Không có dữ liệu nào có thể theo sau dấu kết thúc tệp ngoại trừ một dấu kết thúc dòng tùy chọn như được mô tả trong 7.5.5, ISO 32000-1:2008.
Từ khóa Encrypt không được có mặt trong mục từ giới thiệu tệp.
CHÚ THÍCH 2: Cấm có chủ ý từ khóa Encrypt nhằm không cho phép mã hóa và quyền truy cập được bảo vệ bằng mật khẩu.
6.1.4 Bảng tham chiếu
Từ khóa xref và tiêu đề tiểu mục tham chiếu phải được phân tách bằng một dấu EOL.
Bất kỳ đối tượng gián tiếp nào có khoảng trắng không được tham chiếu trong bất kỳ bảng hay dòng tham chiếu nào, được miễn tất cả các yêu cầu của tiêu chuẩn này và có thể bị bỏ qua bởi một trình đọc phù hợp. Nếu một trình đọc phù hợp không bỏ qua các đối tượng gián tiếp này, chúng phải không được ảnh hưởng đến cách nội dung được kết xuất.
6.1.5 Mục từ thông tin tài liệu
Một mục từ thông tin tài liệu có thể có trong một tệp phù hợp và trình đọc phù hợp PDF/A-2 phải bỏ qua nó.
CHÚ THÍCH: Siêu dữ liệu có thể được đưa vào trong một tài liệu thông qua việc sử dụng dòng siêu dữ liệu XMP như được quy định trong 6.6.3.
6.1.6 Đối tượng chuỗi
Số lượng của số thập lục phân trong một chuỗi thập lục phân phải luôn là số chẵn.
CHÚ THÍCH: Điều này tránh được yêu cầu cung cấp quy định của ISO 32000-1 về việc thiếu chữ số thập lục phân cuối cùng.
6.1.7 Đối tượng dòng
6.1.7.1 Yêu cầu chung
Từ khóa stream được theo sau bởi một chuỗi ký tự CARRIAGE RETURN (0Dh) và LINE FEED (0Ah) hoặc bởi một ký tự LINE FEED đơn. Từ khóa endstream được đặt trước bởi dấu EOL.
Giá trị của khóa Length được quy định trong mục từ dòng phải khớp với số của các byte trong tệp theo sau ký tự LINE FEED sau từ khóa stream và đặt trước dấu EOL trước từ khóa endstream.
Một mục từ đối tượng dòng không chứa các khóa F, FFilter, hoặc FdecodeParams.
CHÚ THÍCH 1: Những khóa này được sử dụng để chỉ đến nội dung tài liệu bên ngoài tệp. Việc cấm những khóa này nhằm không cho phép nội dung bên ngoài có thể tạo ra các phụ thuộc bên ngoài và làm phức tạp các nỗ lực bảo quản.
CHÚ THÍCH 2: Khi mục từ hình ảnh nội tuyến không phải là đối tượng dòng, điều này cho phép sự có mặt của phím F trong mục từ hình ảnh nội tuyến như là tên viết tắt của Filter.
6.1.7.2 Bộ lọc
Tất cả các bộ lọc dòng tiêu chuẩn được liệt kê trong 7.4, Bảng 6, ISO 32000-1:2008, có thể được sử dụng, trừ LZWDecode. Ngoài ra, bộ lọc Crypt không được sử dụng trừ khi giá trị của khóa Name trong mục từ tham số giải mã là Identity. Các bộ lọc không được liệt kê trong 7.4, Bảng 6, ISO 32000-1:2008, không được sử dụng.
CHÚ THÍCH: Bộ lọc Crypt được sử dụng để áp dụng mã hóa và kiểm soát truy cập vào tệp.
6.1.8 Đối tượng tên
Tên phông chữ, tên của chất màu trong khoảng màu Separation và DeviceN và tên kiểu cấu trúc, sau khi mở rộng của chuỗi ký tự thoát ra bằng NUMBER SIGN (23h), nếu có, phải là chuỗi ký tự UTF-8 hợp lệ.
Các yêu cầu này làm cho các khuyến nghị thiết lập trong 7.3.5, ISO 32000-1:2008, có tính quy định.
Tất cả các đối tượng tên khác phải tuân theo những hạn chế tương tự này.
6.1.9 Đối tượng gián tiếp
Số đối tượng và số thế hệ phải được phân tách bằng một ký tự khoảng trống trắng đơn. Số thế hệ và từ khóa obj phải được phân tách bằng một ký tự khoảng trống trắng đơn.
Số đối tượng và từ khóa endobj phải được đặt trước bởi một dấu EOL. Các từ khóa obj và endobj được theo sau bởi một dấu EOL.
6.1.10 Mục từ hình ảnh nội tuyến
Giá trị của khóa F trong mục từ hình ảnh nội tuyến không phải là LZW, LZWDecode, Crypt, một giá trị không liệt kê trong Bảng 6, ISO 32000-1:2008, hoặc một mảng chứa bất kỳ một giá trị nào như vậy.
6.1.11 PDF tuyến tính hóa
Việc tuyến tính hóa phải được cho phép nhưng bất kỳ thông tin tuyến tính hóa nào có mặt bên trong một tệp nên được bỏ qua bởi trình đọc phù hợp.
CHÚ THÍCH: Như được quy định trong Phụ lục F, ISO 32000-1:2008, một tệp PDF không được tuyến tính hóa nếu giá trị của khóa L trong mục từ tuyến tính hóa không khớp với độ dài thực của tệp PDF. Điều này ngụ ý rằng một bản cập nhật gia tăng đối với một tệp PDF tuyến tính hóa phải kết xuất phi tuyến tính hóa.
6.1.12 Sự cho phép
Không khóa nào ngoài UR3 và DocMDP phải có trong mục từ những điều cho phép (Bảng 258, 12.8.4, ISO 32000-1:2008). Nếu DocMDP có mặt, thì mục từ Tham chiếu Chữ ký (Bảng 253,12.8.1, ISO 32000- 1:2008,) không được chứa các khóa DigestLocation, DigestMethod và DigestValue.
GHI CHÚ: Những hạn chế này được đưa ra để đảm bảo rằng chức năng như các phiên bản lỗi thời của mục từ “Quyền của Người sử dụng” không xuất hiện trong một tài liệu phù hợp với tiêu chuẩn này.
6.1.13 Giới hạn áp dụng
Một tệp phù hợp không chứa bất kỳ số nguyên nào lớn hơn 2147483647.
Một tệp phù hợp không chứa bất kỳ số nguyên nào nhỏ hơn -2147483648.
Một tệp phù hợp không chứa bất kỳ số thực nào nằm ngoài phạm vi ±3.403 x 1038.
Một tệp phù hợp không chứa bất kỳ số thực nào gần với số 0 hơn ±1.175 x 10-38.
Một tệp phù hợp không chứa bất kỳ chuỗi nào dài hơn 32767 byte.
Một tệp phù hợp không chứa bất kỳ tên nào dài hơn 127 byte.
Một tệp phù hợp không chửa nhiều hơn 8388607 đối tượng gián tiếp.
Một tệp phù hợp không lồng ghép các cặp q/Q bởi hơn 28 mức độ lồng ghép.
Một tệp phù hợp không chứa khoảng màu DeviceN với hơn 32 chất màu.
Một tệp phù hợp không chứa giá trị CID lớn hơn 65535.
CHÚ THÍCH 1: Các giá trị này được lấy từ Bảng C.1, ISO 32000-1:2008.
Kích thước của bất kỳ ranh giới trang nào mô tả trong 14.11.2, ISO 32000-1:2008, không được nhỏ hơn 3 đơn vị theo cả hai hướng và không được lớn hơn 14 400 đơn vị theo cả hai hướng.
Yêu cầu này khiến khuyến nghị từ C.2, ISO 32000-1:2008, có tính quy định.
CHÚ THÍCH 2: Bằng cách tuân thủ các giới hạn này, một tệp phù hợp phải tương thích với phạm vi rộng nhất có thể của trình đọc.
6.2 Đồ họa
6.2.1 Yêu cầu chung
Các hạn chế đặt ra đối với cả tệp và trình đọc phù hợp liên quan đến các phần tử đồ họa mô tả trong 7.8, ISO 32000-1:2008, được mô tả trong 6.2.2 đến 6.2.11. Một trình đọc phù hợp phải kết xuất các phần tử đồ họa này lên các trang PDF tương ứng của chúng theo các yêu cầu kết xuất của ISO 32000-1 như được sửa đổi bởi tiêu chuẩn này.
Một trình đọc tương tác phù hợp có thể đặt các phần tử giao diện người sử dụng bổ sung xung quanh, bên trên hoặc bên dưới các phần tử đồ họa của trang. Các phần tử giao diện người sử dụng này có thể là bản trình bày của các đối tượng PDF khác (chẳng hạn như dấu trang hoặc hình thu nhỏ của trang) hoặc chúng có thể đại diện cho các đối tượng không phải PDF. Trong mọi trường hợp, các phần tử giao diện người sử dụng và nội dung của chúng không bắt buộc phải phù hợp với các yêu cầu của 6.2.2 đến 6.2.11.
6.2.2 Dòng nội dung
Dòng nội dung không được chứa bất kỳ toán tử nào mà không được quy định trong ISO 32000-1 ngay cả khi các toán từ đó được đặt trong dấu ngoặc bởi các toán tử có khả năng tương thích BX/EX.
CHÚ THÍCH 1: Trong các phiên bản PDF trước, một toán tử PostScript PS đã được quy định. ISO 32000-1 không quy định toán tử này, nên hoàn toàn không được sử dụng tại điều này.
CHÚ THÍCH 2: Dòng nội dung, như được quy định trong 7.8.2, ISO 32000-1:2008, có thể được sử dụng cho mô tả trang, Mẫu XObject, Kiểu dáng Type 1 và phông chữ Type 3, cũng như cho sự xuất hiện của các chú thích.
Việc sử dụng toán tử mục đích kết xuất (‘ri’) phải tuân theo các yêu cầu của 6.2.6.
Việc sử dụng toán tử tính phẳng (‘i’) phải phù hợp với các yêu cầu của 6.2.7.
Dòng nội dung mà tham chiếu đến các đối tượng khác, như hình ảnh và phông chữ cần thiết để hiển thị hoặc xử lý đầy đủ dòng, phải có mục từ Resources được liên kết rõ ràng như được mô tả trong 7.8.3, ISO 32000-1:2008, Bất kỳ tài nguyên nào có tên trong mục từ tài nguyên, nhưng tên của chúng không được tham chiếu từ dòng nội dung liên quan, không được sử dụng để kết xuất và do đó phải được miễn tất cả các yêu cầu của tiêu chuẩn này.
6.2.3 Mục đích đầu ra
Tệp phù hợp có thể quy định đặc điểm màu sắc của thiết bị mà nó dự định được kết xuất bằng cách sử dụng PDF/A Outputlntent. Một trình PDF/A Outputlntent được định danh như một mục từ Outputlntent, như được quy định bởi 14.11.5, ISO 32000-1:2008, được bao gồm trong mảng Outputlntents của tệp và có GTS_PDFA1 là giá trị của khóa S và dòng hồ sơ ICC hợp lệ là giá trị của khóa DestOutputProfile.
CHÚ THÍCH 1: PDF/A yêu cầu phải có Outputlntent khi sử dụng khoảng màu chưa sửa đổi (xem 6.2.4.3 để biết thêm chi tiết). Yêu cầu này để đảm bảo kết xuất đáng tin cậy của màu sắc thông qua việc sử dụng gián tiếp hồ sơ Outputlntent được cung cấp.
CHÚ THÍCH 2: Giá trị cho GTS_PDFA1 được duy trì cho tiêu chuẩn này nhằm cho phép khả năng tương thích cao hơn với TCVN 14159-1 (ISO 19005-1).
Ngoài ra, khóa DestOutputProfileRef, như được quy định trong Phụ lục A, ISO 15930-7:2010, không được có trong bất kỳ PDF/X Outputlntent nào.
CHÚ THÍCH 3: Việc không cho phép khóa DestOutputProfileRef duy trì mục đích của tiêu chuẩn này là đảm bảo các tài liệu độc lập không có tham chiếu bên ngoài. Tuy nhiên, nó không có nghĩa là một tệp PDF đơn không thể tuân thủ với cả PDF/A-2 và PDF/X-4p.
Nếu một mảng Outputlntents của tệp chứa nhiều hơn một mục nhập, có thể là trường hợp nơi một tệp tuân thủ với tiêu chuẩn này và đồng thời với PDF/X-4 hoặc PDF/E-1, thì tất cả các mục nhập có chứa khóa DestOutputProfile phải có giá trị của khóa đó như một đối tượng gián tiếp, là một dòng hồ sơ ICC hợp lệ.
Dòng hồ sơ là giá trị của khóa DestOutputProfile phải là hồ sơ đầu ra (Lớp Thiết bị = “prtr”) hoặc hồ sơ màn hình (Lớp Thiết bị = “mntr”). Hồ sơ phải có khoảng màu hoặc là “GRAY”, “RGB” hoặc “CMYK”. Nếu có trong đối tượng dòng DestOutputProfile, khóa Alternate phải bị bỏ qua bởi một trình đọc phù hợp PDF/A-2.
6.2.4 Khoảng màu
6.2.4.1 Yêu cầu chung
Tất cả các màu phải được quy định theo cách độc lập với thiết bị, trực tiếp bằng cách sử dụng khoảng màu độc lập với thiết bị hoặc gián tiếp bằng cách sử dụng DestOutputlntent trong PDF/A Outputlntent. Tệp phù hợp có thể sử dụng bất kỳ khoảng màu nào được quy định trong ISO 32000-1, ngoại trừ bị hạn chế trong 6.2.4.2 đến 6.2.4.5.
CHÚ THÍCH: Quy định màu theo cách độc lập với thiết bị được mô tả trong 6.2.4 cho phép kết xuất màu có thể dự đoán dựa trên định nghĩa thiết bị đo màu và không phụ thuộc vào các giả định hoặc thông tin bên ngoài tới tệp phù hợp. Nó cũng cung cấp một cơ chế theo đó định nghĩa thiết bị đo màu có thể được kết hợp với dữ liệu màu phụ thuộc vào thiết bị.
6.2.4.2 Khoảng màu ICCBased
Hồ sơ tạo thành dòng của khoảng màu ICCBased phải tuân theo ICC.1:1998-09, ICC.1:2001-12, ICC.1:2003-09 hoặc ISO 15076-1.
CHÚ THÍCH 1: ISO 32000-1 cho phép sử dụng tất cả các phiên bản của hồ sơ ICC lên đến ICC.1:2003-09. Vì những lý do thực tế dựa trên chế độ của phần mềm tạo hồ sơ, tiêu chuẩn này cũng cho phép người sử dụng của ISO 15076-1, được cho là giống nhau về mặt kỹ thuật ở mọi khía cạnh liên quan đến việc sử dụng nó ở đây, ngoại trừ giá trị của số phiên bản hồ sơ.
Một trình đọc phù hợp phải kết xuất các khoảng màu ICCBased như được quy định bởi ISO 32000-1 và đặc tả ICC và không được sử dụng khoảng màu Alternate được quy định trong mục từ dòng hồ sơ ICC.
Chế độ in đè (như được đặt bởi giá trị OPM trong mục từ ExtGState) không phải là một (1) khi khoảng màu ICCBased CMYK được sử dụng và khi in đè cho nét hoặc đổ màu hoặc cả hai được đặt là true.
CHÚ THÍCH 2: Việc cấm này tránh được chế độ in đè không định trước khi chế độ in đè là 1 nếu áp dụng chuyển đổi màu ngầm định như được mô tả trong 8.6.7, ISO 32000-1:2008.
6.2.4.3 Khoảng màu chưa hiệu chuẩn/Thiết bị
Chỉ sử dụng DeviceRGB nếu khoảng màu DefaultRGB độc lập với thiết bị đã được đặt khi khoảng màu DeviceRGB được sử dụng hoặc nếu tệp có PDF/A Outputlntent chứa hồ sơ nơi đến RGB.
DeviceCMYK chỉ được sử dụng nếu khoảng màu DefaultCMYK độc lập với thiết bị đã được đặt hoặc nếu khoảng màu DefauitCMYK dựa trên DeviceN đã được đặt khi khoảng màu DeviceCMYK được sử dụng hoặc tệp có PDF/A Outputlntent có chứa hồ sơ nơi đến CMYK.
DeviceGray chỉ được sử dụng nếu khoảng màu DefauItGray độc lập với thiết bị đã được đặt khi khoảng màu DeviceGray được sử dụng, hoặc nếu có PDF/A Outputlntent hiện diện.
CHÚ THÍCH 1: Như được mô tả trong 8.6.5.6, ISO 32000-1:2008, các màu được quy định trong khoảng màu thiết bị (DeviceGray, DeviceRGB hoặc DeviceCMYK) là thiết bị phụ thuộc. Bằng cách đặt các khoảng màu mặc định, trình viết phù hợp có thể yêu cầu các màu đó được chuyển đổi (ánh xạ lại) một cách có hệ thống thành các khoảng màu dựa trên CIE độc lập với thiết bị.
CHÚ THÍCH 2: Khoảng màu DefaultCMYK dựa trên DeviceN phải tuân theo 6.2.4.4, để làm cho nó độc lập với thiết bị.
Khi kết xuất các màu được quy định trong DeviceRGB hoặc DeviceCMYK và không phù hợp khoảng màu mặc định độc lập với thiết bị đã được đặt ra, trình đọc phù hợp phải sử dụng hồ sơ trong mục từ PDF/A Outputlntent của tệp làm khoảng màu nguồn.
Khi kết xuất các màu được quy định trong DeviceGray và không có khoảng màu DefauItGray độc lập với thiết bị nào được đặt, một trình đọc phù hợp phải kết xuất màu DeviceGray như sau:
- Nếu PDF/A Outputlntent chứa hồ sơ nơi đến ‘GRAY’, cấu hình đó được sử dụng làm khoảng màu nguồn khi kết xuất màu.
- Nếu PDF/A Outputlntent chứa hồ sơ nơi đến 'RGB', thì trình đọc phù hợp phải chuyển đổi màu DeviceGray thành RGB theo phương pháp được mô tả trong 10.3.2, ISO 32000-1:2008, và sử dụng hồ sơ nơi đến RGB làm khoảng màu nguồn khi kết xuất màu.
- Nếu PDF/A Outputlntent chứa cấu hình đích 'CMYK', thì trình đọc phù hợp phải chuyển đổi màu DeviceGray thành CMYK theo phương pháp được mô tả trong 10.3.3, ISO 32000-1:2008, và sử dụng hồ sơ nơi đến CMYK như không gian màu nguồn khi kết xuất màu.
6.2.4.4 Khoảng màu Separation và DeviceN
Nếu các chất màu được đặt tên trong khoảng màu từ danh sách Cyan, Magenta, Yellow và Black, nếu tệp có PDF/A Outputlntent và nếu Outputlntent đó có chứa một hồ sơ nơi đến CMYK thì một trình đọc phù hợp phải xử lý chất màu như các thành phần của khoảng màu quy định bởi hồ sơ nơi đến trong mục từ PDF/A Outputlntent, như được quy định trong 6.2.3.
CHÚ THÍCH 1: Tất cả các khía cạnh khác của kết xuất khoảng màu Separation được mô tả trong 8.6.6.4, ISO 32000-1:2008.
CHÚ THÍCH 2: Tất cả các khía cạnh khác của kết xuất khoảng màu DeviceN và NChannel được mô tả trong 8.6.6.5, ISO 32000-1:2008.
Khoảng thay thế của khoảng màu Separation hoặc DeviceN phải tuân theo tất cả các hạn chế về khoảng màu được quy định trong 6.2.4.2 và 6.2.4.3.
Đối với bất kỳ màu đốm nào được sử dụng trong khoảng màu DeviceN hoặc NChannel, một mục nhập trong mục từ Colorants phải có mặt. Bất kỳ khoảng màu Separation xuất hiện trong một mục từ Colorant phải tuân theo những hạn chế như bất kỳ khoảng màu Separation khác.
CHÚ THÍCH 3: Mặc dù khóa Colorant được quy định trong ISO 32000-1 là tùy chọn trong mục từ thuộc tính khoảng màu DeviceN, nhưng yêu cầu này khiến khóa này trở thành bắt buộc đối với tiêu chuẩn này.
Tất cả các mảng Separation bên trong một tệp PDF/A 2 (bao gồm cả các mảng trong mục từ Colorants) có cùng tên phải có cùng một tintTransform và altemateSpace. Khi đánh giá tính tương đương, các đối tượng PDF phải bị so sánh, thay vì kết quả tính toán của việc sử dụng các đối tượng PDF đó. Việc nén và đối tượng có trực tiếp hay gián tiếp hay không phải bị bỏ qua.
CHÚ THÍCH 4: Trình ghi PDF/A-2 có thể cần đồng bộ hóa nhiều mục nhập altemateSpace và tintTransform khi tạo tệp PDF/A-2.
Các mảng Separation trong mục từ Colorants của khoảng màu DeviceN và NChannel phải nhất quán với tintTransform và altemateSpace của khoảng màu DeviceN hoặc NChannel của chính nó.
6.2.4.5 Khoảng màu được lập chỉ mục và kiểu dáng
Khoảng màu Indexed và Patterm là phương pháp gián tiếp của quy định màu. Tất cả các yêu cầu của 6.2.4 áp dụng cho các khoảng màu nằm dưới của các khoảng màu Indexed và Patterm.
6.2.5 Trạng thái đồ họa mở rộng
Một mục từ ExtGState không chứa khóa TR hoặc HTP. Một mục từ ExtGState không được chứa khóa TR2 có giá trị khác với giá trị Default. Một trình đọc phù hợp có thể bỏ qua bất kỳ trường hợp của khóa HT trong mục từ ExtGState.
CHÚ THÍCH 1: Khóa HTP có mặt trong các phiên bản sớm nhất của PDF nhưng đã bị loại bỏ bởi PDF 1.3
Khóa TransferFunction trong mục từ bán sắc chỉ được sử dụng theo yêu cầu của ISO 32000-1.
Tất cả các bán sắc trong tệp PDF/A-2 phù hợp có giá trị 1 hoặc 5 cho khóa HalftoneType.
CHÚ THÍCH 2: Điều này nghiêm cấm việc sử dụng các màn hình ngưỡng phải tạo ra các hình thức khác nhau ở các độ phân giải khác nhau.
Bán sắc trong tệp PDF/A-2 phù hợp không chứa khóa HalftoneName.
Việc sử dụng khóa RI phải phù hợp với các yêu cầu của 6.2.6.
Việc sử dụng khóa FL phải phù hợp với các yêu cầu của 6.2.7.
Trình đọc phù hợp phải bỏ qua các chức năng BG, BG2, UCR và UCR2 khi kết xuất PDF.
Trình đọc phù hợp phải tuân thủ các mục nhập OP, op và OPM trong các mục từ ExtGState như được mô tả trong 8.6.7, ISO 32000-1:2008, khi kết xuất PDF. Khi kết xuất tới một thiết bị không hỗ trợ nguyên bản tất cả các chất màu được kết xuất, một trình đọc phù hợp phải mô phỏng việc in đè các chất màu như thể chúng đã được kết xuất tới một thiết bị có hỗ trợ nguyên bản.
CHÚ THÍCH 3: Việc có một trình đọc phù hợp tuân thủ các điểm truy nhập này, cả khi xem trên màn hình và khi in, đảm bảo kết xuất nhất quán giữa hai kiểu đầu ra này.
6.2.6 Mục đích kết xuất
Trường hợp mục đích kết xuất được quy định, giá trị của nó phải là một trong bốn giá trị được quy định trong Bảng 70: RelativeColorimetric, AbsoluteColorimetric, Perceptual hoặc Saturation, ISO 32000-1:2008.
CHÚ THÍCH: Mục đích kết xuất mặc định là RelativeColorimetric.
6.2.7 Tính phẳng
Bộ đọc phù hợp phải bỏ qua giá trị thực của mục nhập FL của Trạng thái Đồ họa Mở rộng hoặc giá trị toán hạng cho toán tử i. Thay vào đó, khi một trình đọc phù hợp kết xuất nội dung, nó phải chọn một giá trị phù hợp để cho phép hiển thị hiệu quả mả không giới thiệu các đồ tạo tác có thể nhìn thấy được.
6.2.8 Hình ảnh
6.2.8.1 Yêu cầu chung
Mục từ Image không được chứa khóa Alternates hoặc khóa OPI.
Nếu mục từ Image có chứa khóa Interpolate, khóa giá trị của nó phải là false. Đối với hình ảnh nội tuyến, Khóa I phải có giá trị là false.
Sử dụng khóa Intent phải phù hợp với các yêu cầu trong 6.2.6.
6.2.8.2 Hình ảnh thu nhỏ
Trình đọc phù hợp không được thay thế việc kết xuất của trang bằng cách sử dụng hình ảnh thu nhỏ, và các trường hợp như hình ảnh thu nhỏ đó có được truy xuất từ mục nhập Thumbs trong mục từ trang hay không, một mục nhập xmp:Thumbnails trong tài liệu, một dòng siêu dữ liệu XMP ở mức độ trang hoặc từ bất kỳ dữ liệu nào khác trong tệp.
6.2.8.3 JPEG2000
Nén JPEG2000 được sử dụng như quy định trong ISO 32000-1:2008. Chỉ có bộ các tính năng đường cơ sở JPX, bị hạn chế hoặc mở rộng bởi ISO 32000-1:2008 và điều này, mới được sử dụng.
CHÚ THÍCH 1: Bộ các tính năng đường cơ sở JPX được quy định trong M.9.2, ISO/IEC 15444-2:2004.
Số kênh màu trong dữ liệu JPEG2000 phải là 1, 3 hoặc 4.
Nếu số lượng đặc tính khoảng màu trong dữ liệu JPEG2000 lớn hơn 1, thì phải có chính xác một đặc tính khoảng màu có giá trị 0x01 trong trường APPROX. Nếu quy định đặc tính khoảng màu sử dụng trong hồ sơ ICC, thì tệp đó phải phù hợp với các yêu cầu của 8.6.5.5, ISO 32000-1:2008.
CHÚ THÍCH 2: Giá trị 0x01 trong trường APPROX định danh khoảng màu có độ trung thực màu tốt nhất hiện có.
Giá trị của mục nhập METH trong hộp 'colr' của nó phải là 0x01, 0x02 hoặc 0x03. Một trình đọc phù hợp chỉ sử dụng khoảng màu đó và bỏ qua tất cả các đặc tính khoảng màu khác.
Khoảng màu JPEG2000 19 (CIEJab) được liệt kê không được sử dụng.
Khoảng màu JPEG2000 12 (CMYK) được liệt kê, mà là một phần của JPX nhưng không phải đường cơ sở JPX, có thể được sử dụng.
Trong trường hợp hình ảnh JPEG2000 sử dụng DeviceGray, DeviceRGB hoặc DeviceCMYK một cách hiệu quả, cho dù thông qua mục nhập ColorSpace trong Hình ảnh XObject hoặc trong trường hợp không thông qua định nghĩa khoảng màu trong dữ liệu JPEG2000, thì các quy định của 6.2.4.3 phải được áp dụng.
CHÚ THÍCH 3: s-YCC và es-YCC - hai ký hiệu YCC được cho phép trong đường cơ sở JPX - là các đại diện thay thế của sRGB và esRGB. Chi tiết có thể được tìm thấy trong ISO 15444-2.
CHÚ THÍCH 4: ISO 32000-1 quy định rằng mục nhập ColorSpace trong Hình ảnh XObject chứa dữ liệu nén JPEG2000 phải ghi đè bất kỳ khoảng màu nào được quy định trong chính dòng dữ liệu JPEG2000 của nó. Nó còn yêu cầu số lượng kênh màu trong dữ liệu PEG2000 phải phù hợp với số lượng thành phần trong khoảng màu được quy định trong mục nhập ColorSpace của Hình ảnh XObject; nhà sản xuất PDF phải đảm bảo rằng các mẫu phù hợp với khoảng màu được sử dụng.
Độ sâu-bit của dữ liệu JPEG2000 phải có giá trị trong phạm vi từ 1 đến 38. Tất cả các kênh màu trong dữ liệu JPEG2000 phải có cùng độ sâu-bit.
Hình ảnh được nén bằng phương pháp nén JPEG2000 được tạo lập và đọc như mô tả trong ISO/IEC 15444-2:2004.
CHÚ THÍCH 5: Phần này dựa trên 6.27 (PDF/X-4), ISO 15930-7:2010. Việc đưa nó vào tiêu chuẩn này đảm bảo việc sử dụng một tập hợp con được quy định rõ ràng trong đặc tả tiêu chuẩn ISO 15444-2 hoàn chỉnh và phù hợp với các tiêu chuẩn quốc tế khác. Ngoài ra, phần này cung cấp một tập hợp con của JPEG2000, cũng được căn chỉnh với ISO 24517-1 (PDF/E-1).
6.2.9 XObject
6.2.9.1 XObject mẫu
Một mục từ XObject mẫu không được chứa bất kỳ điều nào sau đây:
- Khóa OPI;
- Khóa Subtype2 với một giá trị của PS;
- Khóa PS.
CHÚ THÍCH: Trong các phiên bản PDF trước đó, khóa Subtype2 có giá trị của PS và khóa PS được sử dụng để quy định các dòng mã PostScript có thể thực hiện tùy ý, có khả năng gây trở ngại cho việc kết xuất đáng tin cậy và có thể dự đoán được.
6.2.8.2 XObject tham chiếu
Một tệp phù hợp không chứa bất kỳ XObject tham chiếu nào.
CHÚ THÍCH: Các XObject tham chiếu để cập đến nội dung tài liệu tùy ý trong các tệp PDF bên ngoài, tạo ra các phụ thuộc bên ngoài làm phức tạp các nỗ lực bảo quản.
6.2.9.3 PostScript XObject
Một tệp phù hợp không chứa bất kỳ PostScript XObject nào.
CHÚ THÍCH: Các PostScript XObject có chứa dòng mã PostScript có thể thực hiện tùy ý có khả năng cản trở kết xuất đáng tin cậy và có thể dự đoán được.
6.2.10 Hiệu ứng trong suốt
Hiệu ứng trong suốt của PDF (như được mô tả trong Điều 11, ISO 32000-1:2008) có thể được sử dụng trong tệp PDF/A-2. Phương pháp mà trình đọc phù hợp nên sử dụng để xác định xem trang đã cho có chứa bất kỳ phần tử đồ họa nào mà trạng thái đồ họa liên quan có chứa hiệu ứng trong suốt hoặc có liên quan đến một quá trình hoạt động hiệu ứng trong suốt hay không được quy định trong Phụ lục A.
Một trình đọc phù hợp phải sử dụng PDF/A Outputlntent của tài liệu làm khoảng màu pha trộn mặc định (11.3.4, ISO 32000-1:2008). Nếu tài liệu không chứa PDF/A Outputlntent, thì tất cả các đối tượng Page chứa hiệu ứng trong suốt phải bao gồm khóa Group và mục từ thuộc tính tạo nên giá trị của khóa Group đó phải bao gồm một mục nhập CS có giá trị được sử dụng làm giá trị mặc định khoảng màu pha trộn mặc định.
CHÚ THÍCH: Yêu cầu này đảm bảo rằng luôn có một không gian pha trộn hiệu ứng trong suốt được quy định rõ cho bất kỳ nội dung nào có liên quan tới hiệu ứng trong suốt.
Giá trị cho bất kỳ khóa CS nào trong mục từ thuộc tính của nhóm hiệu ứng trong suốt bất kỳ phải tuân theo các giới hạn về khoảng màu được nêu trong 6.2.4.
Chỉ các chế độ trộn được quy định trong ISO 32000-1:2008 mới được sử dụng cho giá trị của khóa BM trong mục từ trạng thái đồ họa mở rộng. Trình đọc tuân thủ PDF/A-2 phải xử lý các chế độ trộn này như được mô tả trong 11.3.5, ISO 32000-1:2008, và được bổ sung bởi Adobe Supplement cho ISO 32000-1, Phiên bản cơ bản 1.7, Mức độ mở rộng 5, Phần 3.
6.2.11 Phông chữ
6.2.11.1 Yêu cầu chung
Mục đích của những yêu cầu từ 6.2.11.2 đến 6.2.11.8 nhằm đảm bảo việc kết xuất trong tương lai của nội dung văn bản của một tệp phù hợp khớp nhau, trên cơ sở từng biểu tượng, hình thức tĩnh của một tệp giống như được tạo từ đầu và khi có thể, cho phép khôi phục các đặc tính ngữ nghĩa cho từng ký tự của nội dung văn bản. Trừ trường hợp một yêu cầu đặc biệt chỉ rõ việc áp dụng cho văn bản phải được kết xuất bởi một trình đọc phù hợp, các yêu cầu phải được áp dụng cho bất kỳ phông chữ nào kể cả những phông chữ được sử dụng riêng với chế độ kết xuất văn bản 3.
CHÚ THÍCH: Một phông chữ tham chiếu đơn nhất trong chế độ kết xuất văn bản 3 (9.3.6, ISO 32000-1:2008) không được kết xuất và do đó được miễn các yêu cầu có ảnh hưởng đến việc thể hiện trực quan của các biểu tượng của phông chữ.
6.2.11.2 Kiểu phông chữ
Tất cả các phông chữ và chương trình phông chữ được sử dụng trong một tệp phù hợp, bất kể việc sử dụng ở chế độ kết xuất nào, phải tuân theo các quy định trong 9.6 và 9.7, ISO 32000-1:2008, cũng như các đặc tả phông chữ được tham chiếu bởi các điều này.
CHÚ THÍCH: Trình ghi có trách nhiệm đảm bảo sự phù hợp này. Tiêu chuẩn này không quy định cách thức xác định sự phù hợp của phông chữ.
Các phông chữ chính phải được coi là một trường hợp đặc biệt của phông chữ Type 1; bất kỳ yêu cầu nào được nêu đối với phông chữ Type 1 cũng phải được yêu cầu đối với các phông chữ chính.
6.2.11.3 Phông chữ tổng hợp
6.2.11.3.1 Yêu cầu chung
Đối với bất kỳ phông chữ tổng hợp (Type 0) nào trong một tệp phù hợp, mục nhập CIDSystemlnfo trong mục từ CIDFont và mục từ Mã hóa của nó phải có mối quan hệ sau:
- Nếu khóa Encoding trong mục từ phông chữ Type 0 là Identity-H hoặc Identity-V, bất kỳ giá trị nào của Registry, Ordering và Supplement đều có thể được sử dụng trong mục nhập CIDSystemlnfo của CIDFont.
- Nếu không, các chuỗi Registry và Ordering tương ứng trong cả hai mục từ CIDSystemlnfo phải giống hết nhau và giá trị của khóa Supplement trong mục từ CIDSystemlnfo của CIDFont phải lớn hơn hoặc bằng khóa Supplement trong mục từ CIDSystemlnfo của CMap.
CHÚ THÍCH: Yêu cầu đối với khóa Supplement đảm bảo rằng phông chữ bao gồm các biểu tượng cho tất cả các CID có thể được tham chiếu bởi CMap.
6.2.11.3.2 CIDFonts
Bảng 117, 9.7.4, ISO 32000-1:2008, yêu cầu tất cả các CIDFonts Type 2 nhúng trong mục từ CIDFont phải chứa một mục nhập CIDToGIDMap phải là một dòng ánh xạ từ CIDs đến các chỉ số biểu tượng hoặc tên Identity, như được mô tả trong Bảng 117, 9.7.4, ISO 32000-1:2008.
6.2.11.3.3 Cmaps
Tất cả các CMap được sử dụng trong tệp PDF/A-2, ngoại trừ những CMap được liệt kê trong Bảng 118, 8.7.5.2, ISO 32000-1:2008, phải được nhúng vào tệp đó như được mô tả trong 9.7.5, ISO 32000-1:2008. Đối với những CMap đã được nhúng, giá trị số nguyên của mục nhập WMode trong mục từ CMap phải giống với giá trị WMode trong dòng CMap nhúng.
Một CMap không tham chiếu đến bất kỳ CMap nào khác ngoại trừ những CMap được liệt kê trong Bảng 118, 9.7.5.2, ISO 32000-1:2008.
6.2.11.4 Phép nhúng
6.2.11.4.1 Yêu cầu chung
Các chương trình phông chữ cho tất cả các phông chữ được sử dụng để kết xuất trong một tệp phù hợp phải được nhúng trong tệp đó, như được quy định trong 9.9, ISO 32000-1:2008. Phông chữ được xem xét để sử dụng nếu ít nhất một trong số các biểu tượng của nó được tham chiếu từ dòng nội dung (6.2.2).
CHÚ THÍCH 1: Việc nhúng các chương trình phông chữ cho phép bất kỳ trình đọc phù hợp nào có thể tái tạo chính xác tất cả các biểu tượng theo cách mà chúng được xuất bản ban đầu mà không cần tham chiếu tới các nguồn bên ngoài.
CHÚ THÍCH 2: Như đã thảo luận trong 9.3.6, ISO 32000-1:2008, chế độ kết xuất văn bản 3 quy định rằng các biểu tượng không được tô; đổ màu hoặc sử dụng như là đường ranh giới. Một phông chữ được tham chiếu để sử dụng đơn nhất trong chế độ này không được kết xuất và do đó được miễn yêu cầu nhúng.
Chỉ những phông chữ có thể được nhúng một cách hợp lệ trong một tệp để hiển thị không giới hạn, kết xuất phổ quát phải được sử dụng.
CHÚ THÍCH 3: Tiêu chuẩn này ngăn ngừa việc nhúng các chương trình phông chữ, các chương trình có tính hợp lệ phụ thuộc vào sự thỏa thuận đặc biệt với chủ sở hữu bản quyền. Một khoản kinh phí như vậy đặt ra những gánh nặng không thể chấp thuận với một kho lưu trữ để xác nhận sự tồn tại, hiệu lực và tuổi thọ của những đòi hỏi đó.
Phông chữ nhúng phải quy định tất cả các biểu tượng được tham chiếu để kết xuất trong tệp phù hợp.
CHÚ THÍCH 4: Như đã nêu trong 6.2.11.4.2, các tập hợp con của một phông chữ được chấp nhận miễn là phông chữ được nhúng cung cấp các định nghĩa biểu tượng cho tất cả các ký tự được tham chiếu trong tệp.
Tất cả các trình đọc phù hợp phải sử dụng phông chữ nhúng, thay vì phông chữ có tính địa phương, được thay thế hoặc mô phỏng, để kết xuất.
CHÚ THÍCH 5: Không có sự miễn trừ từ các yêu cầu của 6.2.11.4 đối với 14 phông chữ Type 1 tiêu chuẩn.
6.2.11.4.2 Nhúng tập hợp con
Điều 9.6, ISO 32000-1:2008, cho phép nhúng các tập hợp con của các chương trình phông chữ.
CHÚ THÍCH 1: Việc sử dụng các tập hợp con của một phông chữ và chương trình phông chữ liên quan của nó cho phép giảm đáng kể kích thước của các tệp phù hợp.
Nếu mục từ FontDescriptor của phông chữ nhúng Type 1 có chứa chuỗi CharSet, thì nó phải liệt kê tên ký tự của tất cả các biểu tượng có trong chương trình phông chữ, bất kể biểu tượng trong phông chữ đó có được tham chiếu hoặc sử dụng bởi PDF hay không.
CHÚ THÍCH 2: Yêu cầu trên làm cho các tuyên bố trong 9.8, ISO 32000-1:2008, có tính quy định.
Nếu mục từ FontDescriptor của một phông chữ CID nhúng có chứa một dòng CIDSet, thì nó phải định danh tất cả các CID có trong chương trình phông chữ, bất kể CID trong phông chữ đó có được tham chiếu hoặc sử dụng bởi PDF hay không.
CHÚ THÍCH 3: Yêu cầu trên làm cho các tuyên bố trong Bảng 124,9.8.3.1, ISO 32000-1:2008, có tính quy định.
6.2.11.5 Hệ đo phông chữ
Đối với mọi phông chữ nhúng trong một tệp phù hợp và được sử dụng để kết xuất, thông tin về chiều rộng biểu tượng trong mục từ phông chữ và trong chương trình phông chữ nhúng phải nhất quán. Đối với TCVN 14159 (ISO 19005), tính nhất quán được quy định là một khác biệt không quá 1/1000 đơn vị.
CHÚ THÍCH: Yêu cầu này là cần thiết để đảm bảo kết xuất phông chữ có thể dự đoán được, bất kể trình đọc nào được đưa ra sử dụng các hệ đo trong mục từ phông chữ hoặc trong chương trình phông chữ.
6.2.11.6 Mã hóa ký tự
Đối với tất cả các phông chữ TrueType không biểu tượng được sử dụng để kết xuất, chương trình phông chữ TrueType nhúng phải chứa một hoặc một số mục nhập cmap không biểu tượng như vậy tất cả các tìm kiếm biểu tượng cần thiết có thể thực hiện được.
Tất cả các phông chữ TrueType không biểu tượng phải có MacRomanEncoding hoặc WirtAnsiEncoding như là giá trị cho khóa Encoding trong mục từ Phông chữ hoặc là giá trị cho khóa BaseEncoding trong mục từ mà là giá trị của khóa Encoding trong mục từ Phông chữ.
Ngoài ra, không có phông chữ TrueType không biểu tượng nào phải quy định một mảng Differences trừ khi tất cả các tên biểu tượng trong mảng Differences được liệt kê trong Danh sách Biểu tượng Adobe và chương trình phông chữ nhúng chứa ít nhất Microsoft Unicode (3,1-Platform ID=3, Encoding ID=1) mã hóa trong bảng “cmap”.
Tất cả các phông chữ TrueType có biểu tượng không được chứa mục nhập Encoding trong mục từ phông chữ và bảng “cmap” trong chương trình phông chữ nhúng không được chứa chính xác một mã hóa hoặc ít nhất phải chứa Biểu tượng Microsoft mã hóa (3,0-Nền tảng ID=3, Mã hóa ID=0).
Trong mọi trường hợp, đối với phông chữ TrueType được kết xuất, các mã ký tự phải có khả năng ánh xạ tới biểu tượng theo 8.6.6.4, ISO 32000-1, mà không cần sử dụng ánh xạ không tiêu chuẩn được lựa chọn bởi trình đọc phù hợp.
6.2.11.7 Bản đồ ký tự Unicode
6.2-11.7.1 Yêu cầu chung
6.2.11.7 chỉ có tính áp dụng cho tệp đáp ứng phù hợp mức độ A hoặc U. Để phù hợp mức độ B, các yêu cầu của 6.2.11.7 có thể được bỏ qua bởi một trình ghi phù hợp.
6.2.11.7.2 Phù hợp mức độ A và U
Mục từ phông chữ của mọi phông chữ, bất kể việc sử dụng chế độ kết xuất của chúng như thế nào, phải bao gồm mục nhập ToUnicode có giá trị là một đối tượng dòng CMap ánh xạ các mã ký tự cho ít nhất là tất cả các biểu tượng được tham chiếu tới các giá trị Unicode, như được mô tả trong 9.10.3, ISO 32000-1:2008, trừ khi phông chữ thuộc ít nhất một trong bốn loại sau:
- Phông chữ sử dụng các mã hóa được quy định trước MacRomanEncoding, MacExpertEncoding hoặc WinAnsiEncoding;
- Phông chữ Type 1 và Type 3 trong đó biểu tượng tên của các biểu tượng được tham chiếu đều có trong Danh sách Biểu tượng Adobe hoặc tập hợp các ký tự được đặt tên trong phông chữ Symbol, như được quy định trong ISO 32000-1:2008, Phụ lục D;
- Phông chữ Type 0 có phần tử con CIDFont sử dụng bộ sưu tập ký tự Adobe-GB1, Adobe-CNS1, Adobe-Japan1 hoặc Adobe-Korea1.
- Phông chữ TrueType không biểu tượng.
CHÚ THÍCH 1: Ánh xạ Unicode cho phép truy xuất các đặc tính ngữ nghĩa về mọi ký tự được tham chiếu trong tệp.
Tất cả các giá trị Unicode được quy định trong ToUnicode CMap đều phải lớn hơn không (0), nhưng không bằng U+FEFF hoặc U+FFFE.
CHÚ THÍCH 2: Yêu cầu này đảm bảo rằng các giá trị trong ToUnicode CMap phải là các giá trị hữu ích và không chỉ đơn giản là trình giữ chỗ.
6.2.11.7.3 Phù hợp mức độ A
Chỉ đối với phù hợp mức độ A, với bất kỳ ký tự nào, bất kể chế độ kết xuất của nó, được ánh xạ tới một mã hoặc các mã trong Khu vực Sử dụng riêng Unicode (Unicode Private Use Area - PUA), một mục nhập ActualText như được mô tả trong 14.9.4, ISO 32000-1:2008, phải có ký tự này, hoặc một chuỗi ký tự trong đó ký tự này phải là một phần.
6.2.11.8 Sử dụng biểu tượng .notdef
Tài liệu tuân thủ PDF/A-2 không được chứa tham chiếu đến biểu tượng .notdef từ bất kỳ toán tử thể hiện văn bản nào, bất kể chế độ kết xuất văn bản, trong bất kỳ dòng nội dung nào.
CHÚ THÍCH: Khi biểu tượng .notdef không có bất kỳ giá trị ngữ nghĩa nào, yêu cầu này được lập để tránh bất kỳ sự mơ hồ nào mà có thể là kết quả từ việc sử dụng nó.
6.3 Chú giải
6.3.1 Kiểu chú giải
Không sử dụng các kiểu chú giải không được quy định trong ISO 32000-1. Ngoài ra, không sử dụng các kiểu 3D, Sound, Screen và Movie.
CHÚ THÍCH: Hỗ trợ cho nội dung đa phương tiện nằm ngoài mục tiêu của tiêu chuẩn này.
6.3.2 Mục từ chú giải
Ngoại trừ các mục từ chú giải, có giá trị Subtype là Popup, tất cả các mục từ chú giải phải chứa khóa F. Nếu có, bit cờ Print của khóa F phải được đặt thành 1 và các bit cờ Hidden, invisible, ToggleNoView và NoView của nó phải được đặt thành 0.
Các chú giải văn bản nên đặt các bít cờ Nozoom và NoRotate của khóa F thành 1
CHÚ THÍCH: Các hạn chế trên cờ chú giải ngăn việc sử dụng chú giải bí ẩn hoặc có thể được xem nhưng không được in. Các cờ NoZoom và NoRotate được cho phép, cho phép việc sử dụng các kiểu chú giải có cùng chế độ như kiểu chú giải văn bản thường được sử dụng. Theo định nghĩa, các chú giải văn bản thể hiện chế độ NoZoom và NoRotate ngay cả khi các cờ không được đặt, như được mô tả trong 12.5.3, ISO 32000-1:2008; việc đặt các cờ này một cách rõ ràng sẽ loại bỏ mọi khả năng nhầm lẫn giữa các mục từ chú thích và chế độ của trình đọc.
6.3.3 Hình thức chú giải
Mọi chú giải (bao gồm các loại có giá trị Subtype là Widget, như được sử dụng cho trường mẫu), ngoại trừ cho hai trường hợp được liệt kê dưới đây, phải có ít nhất một mục từ hình thức:
- chú giải trong đó giá trị của khóa Rect bao gồm một mảng trong đó giá trị 1 bằng giá trị 3 và giá trị 2 bằng giá trị 4;
- chú giải có giá trị Subtype là Popup hoặc Link.
Một trình đọc phù hợp phải kết xuất mục từ hình thức mà không liên quan đến bất kỳ khóa và giá trị nào khác trong mục từ chú giải và phải bỏ qua các giá trị của các khóa C, IC, Border, BS, BE, CA, H, DA, Q, DS, LE, LL, LLE và Sy.
CHÚ THÍCH 1: Yêu cầu một mục từ hình thức cho mỗi chú giải đảm bảo việc kết xuất đáng tin cậy của các chú giải.
Đối với tất cả các mục từ chủ giải có chứa khóa AP, mục từ hình thức quy định giá trị của nó chỉ chứa khóa N. Nếu khóa Subtype của mục từ chú giải có giá trị là Widget và khóa FT của nó có giá trị là Btn, thì giá trị của khóa N phải là một mục từ hình thức con, nếu không giá trị của khóa N phải là một dòng hình thức.
CHÚ THÍCH 2: Phù hợp với các yêu cầu của 12.7.4.2.3 và 12.7.4.2.4, ISO 32000-1:2008, trường mẫu Nút cần có nhiều trạng thái hình thức, mỗi trạng thái được liên kết với các giá trị cụ thể mà nút có thể lấy.
6.3.4 Hiển thị nội dung chú giải
Ngoài chế độ kết xuất được quy định bởi ISO 32000-1 và được sửa đổi bởi tiêu chuẩn này, các trình đọc tương tác phù hợp phải cung cấp một cơ chế để hiển thị các giá trị của Khóa Contents của tất cả các mục từ chủ giải, kể cả những mục từ có giá trị Subtype là Widget, ngoại trừ các ứng dụng nhỏ của kiểu Sig (Chữ ký số).
CHÚ THÍCH: Tiêu chuẩn này không quy định chế độ cụ thể hoặc chi tiết sự áp dụng kỹ thuật mà trình đọc tương tác có thể sử dụng để áp dụng yêu cầu chức năng này.
6.4 Mẫu tương tác
6.4.1 Yêu cầu chung
Mục đích của yêu cầu 6.4 là để đảm bảo sự rõ ràng về kết xuất của các trường mẫu.
Giá trị của trường mẫu không được sử dụng bởi trình đọc phù hợp khi kết xuất trường. Thay vào đó, trình đọc phù hợp phải tuân theo các yêu cầu của 6.3.3 và kết xuất mục từ hình thức.
CHÚ THÍCH 1: Giá trị của một trường, ngoại trừ trường nút bấm, là giá trị của khóa V trong mục từ trường. Trường nút bấm không có giá trị.
Một mục từ chú giải ứng dụng nhỏ hoặc mục từ Trường không được chứa các khóa A hoặc AA. Cờ NeedAppearances của mục từ mẫu tương tác không được có mặt hoặc phải là false.
CHÚ THÍCH 2: Chú giải của kiểu Ứng dụng nhỏ cũng phải tuân theo các điều 6.3.2 và 6.3.3.
6.4.2 Mẫu XFA
Mục từ mẫu tương tác của tài liệu tạo thành giá trị của khóa AcroForm trong Catalog tài liệu của một tệp PDF/A-2, nếu có, không được chứa khóa XFA. Ngoài ra, Catalog của tài liệu không được chứa khóa NeedsRendering.
CHÚ THÍCH 1: Điều này cấm sử dụng các mẫu XFA dựa trên XML
CHÚ THÍCH 2: Để cho phép bảo quản mẫu dữ liệu từ mẫu XFA trong tài liệu tuân thủ PDF/A, các quy định về việc di chuyển dữ liệu đó từ khóa XFA sang một phần khác của định dạng PDF được mô tả trong Phụ lục D.
6.4.3 Chữ ký số
Theo sự cho phép của 12.8.1, ISO 32000-1:2008, tệp phù hợp PDF/A-2 có thể chứa tài liệu, chứng nhận hoặc chữ ký quyền của người sử dụng. Các chữ ký đó phải được quy định trong PDF thông qua việc sử dụng các Trường chữ ký phù hợp với 12.7.4.5, ISO 32000-1:2008. Tất cả các chú thích liên quan đến các trường chữ ký phải đáp ứng các yêu cầu ở 6.3.2 và 6.3.3 của tiêu chuẩn này.
Khi tạo hiển thị chữ ký và bất kỳ đối tượng PDF nào khác như một phần của quá trình ký, trình đọc phù hợp phải đảm bảo rằng nó không làm mất hiệu lực tuân thủ tiêu chuẩn này, đặc biệt liên quan đến bất kỳ nội dung nào được thêm vào hiển thị của ứng dụng nhỏ.
Các yêu cầu bổ sung đối với việc sử dụng chữ ký số trong tệp phù hợp PDF/A có thể được tìm thấy trong Phụ lục B.
6.5 Hành động
6.5.1 Yêu cầu chung
Các hành động Launch, Sound, Movie, ResetForm, ImportData, Hide, SetOCGState, Rendition, Trans, Gotot3DView và JavaScript không được phép. Thêm vào đó, hành động phản đối Set-state và no-op không được phép. Các hành động được nêu tên ngoài NextPage, PrevPage, FirstPage và LastPage không được phép. Tương ứng với mỗi hành động trong số bốn hành động được phép đã được nêu tên, trình đọc tương tác phù hợp phải thực hiện hành động thích hợp được mô tả trong Bảng 211, 12.6.4.11, ISO 32000-1:2008.
CHÚ THÍCH 1: Hỗ trợ nội dung đa phương tiện nằm ngoài mục tiêu của tiêu chuẩn này. Hành động ResetForm thay đổi hình thức được kết xuất của một mẫu. Hành động ImportData nhập dữ liệu mẫu từ tệp bên ngoài. Hành động Hide đặt cờ Ẩn của chú thích. Các hành động JavaScript cho phép một mã thực hiện tùy ý có khả năng gây trở ngại cho kết xuất tin cậy và có thể dự đoán được.
CHÚ THÍCH 2: Yêu cầu bổ sung đối với các trường mẫu tương tác được quy định trong 6.4.
6.5.2 Sự kiện kích hoạt
Một mục từ chú giải hoặc mục từ Trường không được bao gồm mục nhập AA cho một mục từ hành động bổ sung. Catalog tài liệu không được bao gồm mục nhập AA cho một mục từ hành động bổ sung. Mục từ Page không được bao gồm mục nhập AA cho mục từ hành động bổ sung.
CHÚ THÍCH: Các mục từ hành động bổ sung này quy định các hành động JavaScript tùy ý. Việc cấm mục nhập AA nhằm không cho phép các hành động JavaScript có thể tạo ra các phụ thuộc bên ngoài và làm phức tạp các nỗ lực bảo quản.
6.5.3 Xử lý các hành động của GoToR, URI và SubmitForm
Trong khi được cho phép xuất hiện trong một tệp phù hợp, có ba kiểu hành động mà trình đọc tương tác phù hợp phải cung cấp cách xử lý đặc biệt - hành động GoToR, URI và SubmitForm. Trình đọc tương tác phù hợp phải cung cấp một cơ chế để hiển thị các khóa F và D của mục từ hành động GoToR, khóa URI của mục từ hành động URI và khóa F của mục từ hành động SubmitForm.
Ngoài ra, việc dẫn chứng ba hành động này trong thực tế bằng trình đọc tương tác phù hợp liên quan đến định vị và tương tác với các tệp khác nên hoặc có thể không phù hợp, trình đọc có thể lựa chọn hoặc không cho phép tuân thủ các trình đọc tương tác liên quan đến việc định vị và tương tác với các tệp khác có thể phù hợp hoặc có thể nếu không phù hợp, trình đọc có thể chọn không cho phép thực hiện các hành động này.
CHÚ THÍCH: Với mục đích tiết lộ lưu trữ của nội dung thông tin hoàn thiện của tệp phù hợp, điều này là quan trọng cho trình đọc tương tác để cung cấp một số cơ chế để hiển thị nơi đến của các hành động này. Tuy nhiên, tiêu chuẩn này không quy định bất kỳ chế độ cụ thể nào hoặc chi tiết sự áp dụng kỹ thuật mà các trình đọc tương tác có thể sử dụng để đáp ứng các yêu cầu chức năng.
6.6 Siêu dữ liệu
6.6.1 Yêu cầu chung
Yêu cầu đối với siêu dữ liệu bên trong tệp phù hợp được quy định trong 6.6.2 tới 6.6.6. Siêu dữ liệu là yếu tố cần thiết để quản lý hiệu quả tệp trong suốt vòng đời của tệp. Một tệp phụ thuộc vào siêu dữ liệu để định danh và mô tả, cũng như để mô tả các vấn đề kỹ thuật và quản trị thích hợp. Do vậy, trình ghi của các tệp phù hợp có thể phải tuân thủ các yêu cầu siêu dữ liệu theo từng miền cụ thể khác nhau được quy định bên ngoài tiêu chuẩn này. Tiêu chuẩn này phác thảo một khuôn khổ có cấu trúc, nhất quán hỗ trợ nhiều yêu cầu về siêu dữ liệu.
6.6.2 Dòng siêu dữ liệu
6.6.2.1 Yêu cầu chung
Mục từ Catalog của một tệp phù hợp phải chứa khóa Metadata có giá trị là một dòng siêu dữ liệu như được quy định trong 14.3.2, ISO 32000-1:2008.
Thêm vào đó, tất cả các dòng siêu dữ liệu có trong PDF phải tuân theo Đặc tả XMP.
Các thuộc tính bytes và encoding không được sử dụng trong tiêu đề của gói XMP.
CHÚ THÍCH: Cả hai thuộc tính bytes và encoding đều không được chấp nhận trong Đặc tả XMP.
Tất cả nội dung của tất cả các gói XMP phải được định dạng đúng, như được quy định bởi Ngôn ngữ đánh dấu mở rộng (XML) 1.0 (Ấn bản lần 3), 2.1 và Đặc tả cú pháp RDF/XML (Đã sửa đổi). Tại thời điểm trình ghi phù hợp tạo lập hoặc lưu lại một tệp phù hợp, tất cả nội dung của các gói XMP của tệp đó phải được xác thực.
6.6.2.2 Không gian tên và tiền tố
Theo khuyến nghị Không gian tên XML của W3C [17] ,tiền tố không gian tên là lối tắt đến các URI không gian tên. Không có chú ý nào đối với bản thân tiền tố, ngoại trừ trường hợp một tiền tố cụ thể được định danh như là bắt buộc, bất kỳ tiền tố nào cũng có thể được sử dụng. Các tiền tố trong Bảng 1 nên được sử dụng cho tất cả các đặc tính bằng cách sử dụng không gian tên được định danh bởi các URI được liệt kê trong bảng đó.
Ngoài ra, các URI không gian tên chỉ dành cho mục đích định danh và không bắt buộc phải là các liên kết có thể hành động được. Không có URI không gian tên nào được quy định trong tiêu chuẩn này được đảm bảo là một liên kết có thể hành động được, cố gắng loại bỏ tham chiếu hoặc đi theo bất kỳ liên kết nào trong số này có thể không dẫn đến một trang web hợp lệ.
Bảng 1 - Ánh xạ được đề xuất giữa các URI không gian tên và tiền tố của chúng
URI |
Tiền tố |
|
dc |
|
|
|
xmp |
|
xmpMM |
6.6.2.3 Lược đồ
6.6.2.3.1 Yêu cầu chung
Tất cả các đặc tính được quy định trong mẫu XMP phải sử dụng các lược đồ được định trước được quy định trong Đặc tả XMP, TCVN 14159-1 (ISO 19005-1) hoặc tiêu chuẩn này, hoặc bất kỳ lược đồ mở rộng nào tuân thủ 6.6.2.3.2.
6.6.2.3.2 Lược đồ mở rộng
Tất cả các lược đồ mở rộng được tham chiếu từ bất kỳ dòng siêu dữ liệu nào trong một tệp phù hợp phải có các mô tả nhúng trong dòng siêu dữ liệu tham chiếu hoặc dòng siêu dữ liệu là giá trị của khóa Metadata trong Catalog. Bất kỳ lược đồ nào có trong dòng siêu dữ liệu được tham chiếu từ Catalog phải được kế thừa và áp dụng cho tất cả các dòng siêu dữ liệu; tuy nhiên, tất cả các lược đồ khác chỉ được xem xét trong bối cảnh của dòng được nhúng. Các lược đồ có mặt trong các dòng siêu dữ liệu không phải của Catalog có thể mở rộng hoặc thay thế một số hoặc tất cả của một lược đồ đã được kế thừa từ dòng của Catalog.
CHÚ THÍCH 1: Lý do để đặt các lược đồ mở rộng vào dòng siêu dữ liệu của tài liệu là để tránh trùng lặp các lược đồ chung trên nhiều dòng siêu dữ liệu.
Các lược đồ mở rộng phải được quy định bằng cách sử dụng lược đồ vùng chứa lược đồ mở rộng PDF/A được quy định trong 6.6.2.3.3. Tất cả các trường được mô tả trong mỗi bảng trong 6.6.2.3.3 phải có trong bất kỳ lược đồ vùng chứa lược đồ mở rộng nào.
6.6.2.3.3 Lược đồ vùng chứa lược đô mở rộng
Lược đồ vùng chứa lược đồ mở rộng
được quy định trong Bảng 2 sử dụng URI không gian tên
Bảng 2 - Lược đồ vùng chứa lược đồ mở rộng PDF/A
Tên trường |
Kiểu giá trị |
Hạng |
Sự giải thích |
pdfaExtension:schemas |
Bag Schema |
Bên trong |
Vùng chứa cho tất cả mô tả lược đồ mở rộng nhúng |
Kiểu lược đồ được quy định trong Bảng
3 là một cấu trúc XMP chứa định nghĩa của một lược đồ mở rộng. URI không gian tên
của trường là
Bảng 3 - Kiểu giá trị lược đồ PDF/A
Tên trường |
Kiểu giá trị |
Sự giải thích |
pdfaSchema:schema |
Text |
Mô tả lược đồ |
pdfaSchema:namespaceURI |
URI |
URI không gian tên lược đồ |
pdfaSchemarprefix |
Text |
Tiền tố không gian tên lược đồ ưu tiên |
pdfaSchema:property |
Seq property |
Danh sách đặc tính lược đồ |
pdfaSchema:valueType |
Seq ValueType |
Mô tả kiểu giá trị lược đồ cụ thể |
Kiểu Property được quy định trong Bảng
4 là một cấu trúc XMP chứa định nghĩa của một đặc tính lược đồ. URI không gian
tên của trường là
Bảng 4 - Kiểu giá trị Đặc tính PDF/A
Tên trường |
Kiểu giá trị |
Sự giải thích |
pdfaProperty:name |
Text |
Tên đặc tính |
pdfaProperty:valueType |
Open Choice of Text |
Kiểu giá trị của đặc tính, được rút ra từ Đặc tả XMP hoặc kiểu giá trị lược đồ PDF/A nhúng |
pdfaProperty:category |
Closed Choice of Text |
Hạng đặc tính: Bên trong hoặc bên ngoài |
pdfaProperty description |
Text |
Mô tả đặc tính |
Các giá trị cho pdfaProperty:valueType phải là các kiểu giá trị được quy định trong Đặc tả XMP hoặc các kiểu giá trị tùy chỉnh được quy định trong lược đồ mở rộng.
Kiểu ValueType được quy định
trong Bảng 5 là cấu trúc XMP chứa định nghĩa của tất cả các kiểu giá trị đặc
tính được sử dụng bởi các lược đồ mở rộng nhúng không được quy định trong Đặc
tả XMP. URI không gian tên của trường là
Bảng 5 - Kiểu giá trị ValueType PDF/A
Tên trường |
Kiểu giá trị |
Sự giải thích |
pdfaType:type |
Text |
Tên kiểu giá trị đặc tính |
pdfaType:namespaceURI |
URI |
URI không gian tên trường kiểu giá trị đặc tính |
pdfaType:prefix |
Text |
Tiền tố không gian tên trường kiểu giá trị ưu tiên |
pdfaType:description |
Text |
Mô tả giá trị của đặc tính |
pdfaType:field |
Seq Field |
Mô tả của trường cấu trúc |
Kiểu Field được quy định
trong Bảng 6 là cấu trúc XMP chứa định nghĩa của trường kiểu giá trị đặc
tính. URI không gian tên của trường là
Bảng 6 - Kiểu giá trị Trường PDF/A
Tên trường |
Kiểu giá trị |
Sự giải thích |
pdfaField:name |
Text |
Tên trường |
pdfaField:valueType |
Open Choice of Text |
Kiểu giá trị trường được rút ra từ Đặc tả XMP hoặc lược đồ mở rộng kiểu giá trị PDF/A nhúng bên trong cùng một lược đồ mở rộng khi trường đó làm cho việc sử dụng định nghĩa kiểu giá trị này được quy định |
pdfaField:description |
Text |
Mô tả trường |
6.6.3 Mục từ thông tin tài liệu
Một mục từ thông tin tài liệu có thể xuất hiện bên trong một tệp phù hợp. Nếu mục từ xuất hiện, trình đọc tuân thủ PDF/A-2 phải bỏ qua nó. Trình ghi phù hợp PDF/A-2 phải đảm bảo rằng các giá trị trong mục từ thông tin tài liệu nhất quán với các giá trị tương ứng trong dòng siêu dữ liệu của tài liệu như được liệt kê trong Bảng 7.
CHÚ THÍCH: Khi mục từ thông tin tài liệu được cho phép bên trong một tệp phù hợp, một tệp đơn có thể tuân theo nhiều tiêu chuẩn, bao gồm tiêu chuẩn này, PDF/X (ISO 15930-1, ISO 15930-3, ISO 15930-4, ISO 15930-6 và ISO 15930-7) và PDF/E-1 (ISO 24517-1).
Bảng 7 - Bảng đối chiếu giữa mục từ thông tin tài liệu và các đặc tính XMP
Mục từ thông tin tài liệu |
XMP |
||
Điểm truy cập |
Kiểu PDF |
Đặc tính |
Kiểu XMP |
Title |
text string |
dc:title["x-default"] |
Text |
Author |
text string |
dc:creator[0] |
ProperNames |
Subject |
text string |
dc:description["x-default"] |
Text |
Keywords |
text string |
pdf:Keywords |
Text |
Creator |
text string |
xmp:CreatorTool |
AgentName |
Producer |
text string |
pdf:Producer |
AgentName |
CreationDate |
Date |
xmp:CreateDate |
Date |
ModDate |
Date |
xmp:ModifyDate |
Date |
6.6.4 Phiên bản và định danh mức độ phù hợp
Phiên bản PDF/A và mức độ phù hợp của một tệp phải được quy định sử dụng lược đồ mở rộng Định danh PDF/A được quy định trong điều này.
Lược đồ Định danh PDF/A được quy định
trong Bảng 8 sử dụng URI không gian tên
Bảng 8 - Lược đồ Định danh PDF/A
Tên trường |
Kiểu giá trị |
Hạng |
Sự giải thích |
pdfaid:part |
Open Choice of Integer |
Bên trong |
Định danh phiên bản PDF/A |
pdfaid:amd |
Open Choice of Text |
Bên trong |
Định danh sửa đổi PDF/A tùy ý |
pdfaid:corr |
Open Choice of Text |
Bên trong |
Định danh đính chính PDF/A tùy ý |
pdfaid:conformance |
Open Choice of Text |
Bên trong |
Mức độ phù hợp PDF/A: A hoặc B hoặc U |
Giá trị của pdfaid:part phải tùy theo từng phần của TCVN 14159 (ISO 19005) mà tệp tuân thủ. Các tệp được chuẩn bị tuân theo tiêu chuẩn này phải sử dụng giá trị là 2.
Nếu tệp tuân theo phiên bản TCVN 14159 (ISO 19005) được quy định bằng bản sửa đổi cho một phần, thì giá trị của pdfaid:amd phải là số và năm của bản sửa đổi, được phân tách bằng dấu hai chấm.
Nếu tệp tuân theo phiên bản TCVN 14159 (ISO 19005) được quy định bằng bản đính chính cho một phần, thì giá trị của pdfaid:corr phải là số và năm của bản đính chính, được phân tách bằng dấu hai chấm.
Một tệp phù hợp mức độ A quy định giá trị của pdfaid:conformance là A. Một tệp phù hợp mức độ B quy định giá trị của pdfaid:conformance là B. Một tệp phù hợp mức độ U quy định giá trị của pdfaid:conformance là U.
Các giá trị của các đặc tính pdfaid:part, pdfaid:amd, pdfaid:corr và pdfaid:conformance không quy định sự phù hợp bởi chúng mà theo từng phần của TCVN 14159 (ISO 19005). Việc xác định sự phù hợp thực tế phải được thực hiện như quy định trong Điều 5.
6.6.5 Yếu tố định danh tệp
Một tệp phù hợp phải có một hoặc nhiều đặc tính siêu dữ liệu để biểu thị đặc điểm, phân loại và các cách định danh tệp khác. Tiêu chuẩn này không ủy thác bất kỳ sơ đồ định danh cụ thể nào. Các yếu tố định danh có thể là căn cứ bên ngoài, như Mã số tiêu chuẩn quốc tế cho sách (ISBN) hoặc Mã định danh đối tượng kỹ thuật số (DOI) hoặc dựa trên nội bộ, chẳng hạn như Mã định danh duy nhất toàn cầu/ Định danh đơn nhất phổ dụng (GUID/UUID) hoặc một nơi đến khác trong suốt quy trình hoạt động. Các yếu tố định danh có thể bao gồm thông qua sử dụng đặc tính xmp:ldentifier, đặc tính xmpMM:lnstancelD, xmpMM:DocumentlD, xmpMM:VersionlD, hoặc sử dụng từ các lược đồ mở rộng. Có thể sử dụng lâu dài bất kỳ hệ thống định danh nào miễn là các thuộc tính tuân thủ các yêu cầu của XMP và tiêu chuẩn này, danh sách trước đó không được xem là đầy đủ.
Nếu một mục nhập xmpMM:History, như được mô tả trong 6.6.6 được thêm vào bởi tệp phù hợp, thì phần định danh thay đổi của khóa ID của mục từ đoạn giới thiệu tệp phải được sửa đổi theo 6.1.3.
6.6.6 Thông tin nguồn gốc tệp
Để mô tả các hành động của người sử dụng mức độ cao thực hiện, để tạo lập, chuyển đổi hoặc khởi tạo một tệp phù hợp, mỗi một hành động đó phải được ghi lại trong đặc tính xmpMM:History bên trong dòng siêu dữ liệu XMP có giá trị của mục nhập Metadata trong mục từ thư mục tài liệu. Với mỗi hành động được ghi lại, cần:
- Quy định các trường action, parameters và when;
- Quy định trường SoftwareAgent;
- Quy định trường instancelD.
CHÚ THÍCH 1: Các ứng dụng có yêu cầu kiểm tra cụ thể có thể cần ghi lại các kiểu hành động bổ sung hoặc chi tiết bổ sung về các hành động ngoài những hành động được quy định bởi lược đồ XMP được định trước. Ví dụ kiểu bổ sung của hành động bao gồm các hành động thay đổi hình thức của tài liệu, như lấy mẫu xuống hoặc thay thế phông chữ. Ví dụ của chi tiết bổ sung bao gồm định danh của đại lý tác nhân đã thúc đẩy hoặc thực hiện hành động hoặc môi trường mà hành động đó xảy ra.
Trong trường hợp các nguồn ban đầu như giấy, vi dạng hoặc tệp điện tử được chuyển đổi thành tệp phù hợp, xmpMM:History nên mô tả quá trình xử lý mức độ cao (ví dụ chuyển đổi từ ISO 32000-1 sang PDF/A-2); sự thay đổi đối với nội dung hoặc chức năng tệp (ví dụ: JavaScript nhúng và các đối tượng âm thanh không được giữ lại); xử lý của siêu dữ liệu tồn tại từ trước (ví dụ: tất cả các giá trị mục từ thông tin tài liệu được chuyển đổi thành XMP); và bất kỳ khía cạnh quan trọng nào khác của quá trình chuyển đổi.
Đối với tất cả các tệp phù hợp, cho dù được tạo từ đầu hay bằng cách chuyển đổi từ các nguồn như giấy, vi dạng hoặc các định dạng điện tử khác, xmpMM:History phải mô tả tất cả các quy trình làm việc mức độ cao tiếp theo (ví dụ mô tả các hoạt động và thực hiện); trích dẫn đến các chính sách điều chỉnh việc xử lý tệp (ví dụ nhan đề của các chỉ thị chính thức theo đó các tệp được thu thập, xử lý và sử dụng); tên và phiên bản của các công cụ phần mềm; bất kỳ vấn đề nào khác cần thiết để biểu thị bối cảnh của việc tạo lập và sử dụng tệp.
Trong trường hợp các thuộc tính siêu dữ liệu XMP đã bị thay đổi hoặc bị xóa khi tệp di chuyển qua vòng đời của nó, xmpMM:History nên mô tả các thay đổi đó bằng cách bao gồm các mục nhập có trường parameters quy định tên của đặc tính và giá trị trước đó của chúng. Khuyến nghị này áp dụng cho tất cả các đặc tính siêu dữ liệu ngoại trừ chính xmpMM:History.
CHÚ THÍCH 2: Phần “Theo dõi Lịch sử Tư liệu” trong Hướng dẫn đối tác về XMP cho Đa Phương tiện Năng động mô tả giải pháp toàn diện hơn để theo dõi lịch sử tài liệu thông qua siêu dữ liệu XMP mà một số trình đọc phù hợp có thể chọn để áp dụng thay thế.
6.7 Cấu trúc logic
6.7.1 Yêu cầu chung
Điều 6.7 chỉ ứng dụng cho các tệp đáp ứng phù hợp mức độ A. Đối với các tệp phù hợp mức độ B và mức độ U các yêu cầu của điều này có thể được bỏ qua.
Mục đích của các yêu cầu trong 6.7.2 đến 6.7.8 là cung cấp hướng dẫn trong việc kết hợp thông tin ngữ nghĩa mức độ cao hơn trong các tài liệu phù hợp PDF/A-2 dựa trên các khuyến nghị trong 14.7 và 14.8, ISO 32000-1:2008. Thông tin như vậy giúp đảm bảo khôi phục nội dung văn bản của tệp phù hợp theo thứ tự đọc tự nhiên của ngôn ngữ mà chúng được viết. Ngoài ra, sự hiện diện của cấu trúc cho phép khả năng truy cập PDF phong phú hơn đối với những người sử dụng khuyết tật như được nêu chi tiết trong 14.9, ISO 32000-1:2008.
CHÚ THÍCH 1: Ví dụ về thông tin như vậy là cấp bậc cấu trúc, đặc tả ngôn ngữ tự nhiên, mô tả thay thế, chú giải phi văn bản, văn bản thay thế và mở rộng các chữ viết tắt và từ viết tắt.
Các trình ghi PDF/A-2 không được thêm thông tin cấu trúc hoặc ngữ nghĩa không có mặt rõ ràng hoặc ẩn ý trong tài liệu nguồn chỉ với mục đích đạt được sự phù hợp.
CHÚ THÍCH 2: Trình ghi không tạo thông tin cấu trúc hoặc ngữ nghĩa bằng cách sử dụng quy trình tự động mà không có sự xác thực thích hợp.
6.7.2 PDF được gắn thẻ
6.7.2.1 Yêu cầu chung
Một tệp phù hợp mức độ A phải đáp ứng mọi yêu cầu đặt ra cho PDF được gắn thẻ trong 14.8, ISO 32000-1:2008.
CHÚ THÍCH: PDF được gắn thẻ quy định các quy ước cho việc khai báo và mô tả rõ ràng các khía cạnh cấu trúc logic của nội dung tài liệu.
6.7.2.2 Mục từ thông tin đánh dấu
Mục từ thư mục tài liệu phải bao gồm một mục từ Marklnfo mà có duy nhất một mục nhập, Marked, có giá trị là true.
CHÚ THÍCH: Cài đặt này biểu thị tệp tuân thủ các quy ước về PDF được gắn thẻ.
6.7.3 Đồ tạo tác
6.7.3.1 Yêu cầu chung
Các tính năng phân trang như chạy đầu trang hoặc số trang, các tính năng bổ cục thẩm mỹ như quy tắc chú thích cuối trang hoặc màn hình nền và các công cụ hỗ trợ sản xuất như dấu cắt và thanh màu phải được quy định là phân trang, bố cục và tạo trang, như được mô tả trong ISO 32000-1:2008, 14.8.2.2.1 và 14.8.2.2.2.
6.7.3.2 Ranh giới từ
Đối với các ngôn ngữ và hệ thống tập lệnh thường sử dụng các ký tự khoảng trống (4.42, ISO 32000-1) để biểu thị ranh giới từ, hạn chế bổ sung sau phải được áp dụng:
Trong các chuỗi hiển thị, ranh giới từ phải được biểu thị rõ ràng bằng sự có mặt của một hoặc nhiều ký tự khoảng trống giữa tất cả các từ riêng lẻ trong chuỗi hiển thị. Nếu một từ kết thúc ở ranh giới chuỗi hiển thị, một hoặc nhiều ký tự khoảng trống phải được chèn vào cuối chuỗi hiển thị trừ khi theo sau ngay sau đó là một ký tự dấu câu.
CHÚ THÍCH: Một từ đơn có thể kéo dài hai hoặc nhiều chuỗi hiển thị; ranh giới từ chỉ được biểu thị bởi sự hiện diện rõ ràng của một hoặc nhiều ký tự khoảng trống, không phải bởi ranh giới của một chuỗi hiển thị. Với mục đích biểu thị ranh giới từ, một chuỗi gồm hai hoặc nhiều ký tự khoảng trống liên tiếp là sự tương đương về mặt ngữ nghĩa với một ký tự khoảng trống đơn.
6.7.3.3 Cấp bậc cấu trúc
Cấu trúc logic của một tệp phù hợp được mô tả bởi cấp bậc cấu trúc gắn vào mục nhập StructTreeRoot của mục từ Catalog tài liệu, như được mô tả trong 14.7, ISO 32000-1:2008,
Trình ghi của tệp phù hợp phải nỗ lực để ghi lại cấp bậc cấu trúc logic của một tài liệu ở mức chi tiết nhất, sử dụng các kiểu cấu trúc tiêu chuẩn để nhóm các phần tử, phần tử cấu trúc khối-mức, phần tử dạng đoạn, phần tử danh sách, phần tử bảng, phần tử cấu trúc cấp nội tuyến, phần tử liên kết và phần tử minh họa đến mức tối đa có thể, như được quy định trong 14.8.4, ISO 32000-1:2.008.
CHÚ THÍCH: Mô tả rõ ràng của cấu trúc logic của tài liệu phải chứng tỏ có giá trị cho những nỗ lực trong tương lai để phục hồi giá trị ngữ nghĩa đầy đủ của tài liệu cho mục đích kết xuất hoặc di trú sang các định dạng dữ liệu khác.
6.7.3.4 Kiểu cấu trúc
Tất cả kiểu cấu trúc phi tiêu chuẩn phải ánh xạ tới kiểu tiêu chuẩn tương đương về chức năng gần nhất, như được mô tả trong trong 14.8.4, ISO 32000-1:2008, trong mục từ vai trò ánh xạ của rễ cây cấu trúc. Ánh xạ này có thể là gián tiếp; bên trong bản đồ vai trò một kiểu phi tiêu chuẩn có thể ánh xạ trực tiếp tới một kiểu phi tiêu chuẩn khác, tuy nhiên ánh xạ phải kết thúc ở một kiểu tiêu chuẩn.
6.7.4 Đặc tả ngôn ngữ tự nhiên
Ngôn ngữ tự nhiên mặc định cho tất cả văn bản trong tệp phải được quy định bởi mục nhập Lang trong mục từ thư mục tài liệu.
Tất cả nội dung văn bản bên trong một tệp khác với ngôn ngữ mặc định phải được biểu thị bằng cách sử dụng đặc tính Lang đính kèm với một chuỗi nội dung được đánh dấu hoặc bởi một mục nhập Lang trong mục từ phần tử cấu trúc, như được mô tả trong 14.9.2, ISO 32000-1:2008.
Nếu mục nhập Lang có mặt trong mục từ Catalog tài liệu hoặc trong mục từ phần tử cấu trúc hoặc danh sách đặc tính, giá trị của nó phải là một yếu tố định danh ngôn ngữ được quy định bởi 14.9.2, ISO 32000-1:2008.
CHÚ THÍCH 1: Phụ lục C của tiêu chuẩn này cũng đưa ra một số hướng dẫn về các thực hành tốt trong lĩnh vực này.
Tất cả các chuỗi mã hóa trong Unicode có ngôn ngữ không phải là ngôn ngữ mặc định tự nhiên cho tệp hoặc không phải ngôn ngữ tự nhiên được quy định bởi phần tử cấu trúc bao bọc trong cùng hoặc chuỗi nội dung đánh dấu phải được biểu thị ngôn ngữ của chúng sử dụng chuỗi thoát bên trong được mô tả trong 7.9.2, ISO 32000-1:2008.
CHÚ THÍCH 2: Sự phân biệt giữa các từ nước ngoài với một ngôn ngữ và từ nước ngoài kết hợp bằng cách sử dụng phổ biến trong một ngôn ngữ là một vấn đề rắc rối. Mục đích của các yêu cầu là để cho phép sự giải thích ngữ nghĩa rõ ràng trong tương lai của nội dung văn bản.
6.7.5 Mô tả thay thế
Tất cả các phần tử cấu trúc mà nội dung không có dạng tương tự văn bản tự nhiên được xác định trước, ví dụ hình ảnh, các công thức..., phải cung cấp mô tả văn bản thay thế sử dụng mục nhập Alt trong mục từ phần tử cấu trúc, như được mô tả 14.9.3, ISO 32000-1:2008.
CHÚ THÍCH: Các mô tả thay thế cung cấp những mô tả dạng văn bản, hỗ trợ việc giải thích chính xác các nội dung phi văn bản mờ đục.
6.7.6 Chú giải phi văn bản
Đối với các kiểu chú giải không hiển thị văn bản, khóa Contents của mục từ chú giải phải được quy định bằng mô tả thay thế về nội dung của chú giải ở dạng con người có thể đọc được.
6.7.7 Văn bản thay thế
Tất cả các phần tử cấu trúc dạng văn bản được trình bày không theo tiêu chuẩn, ví dụ: ký tự tùy chỉnh hoặc đồ họa nội tuyến, phải cung cấp văn bản thay thế sử dụng mục nhập ActualText trong mục từ phần tử cấu trúc, như được mô tả trong 14.9.4, ISO 32000-1:2008.
CHÚ THÍCH: Văn bản thay thế cung cấp các văn bản tương đương, hỗ trợ việc giải thích đúng các thể hiện mờ đục, khác thường của các thành phần văn bản.
6.7.8 Mở rộng của chữ viết tắt và từ viết tắt
Tất cả các thực thể của chữ viết tắt và từ viết tắt trong nội dung văn bản phải được đặt trong một chuỗi nội dung đánh dấu bằng thẻ Span có đặc tính E cung cấp sự mở rộng văn bản của chữ viết tắt và từ viết tắt như được mô tả trong 14.9.5, ISO 32000-1:2008.
CHÚ THÍCH: Chữ viết tắt và sự mở rộng các từ viết tắt cung cấp những văn bản tương đương, hỗ trợ việc giải thích đúng các danh pháp mờ đục.
6.8 Tệp nhúng
Một mục từ đặc tả tệp, như được quy định trong 7.11.3, ISO 32000-1:2008, có thể chứa khóa EF, với điều kiện là tệp nhúng phải tuân thủ TCVN 14159-1 (ISO 19005-1:2005); hoặc tiêu chuẩn này. Mục từ đặc tả tệp cho tệp nhúng phải chứa các khóa F và UF và phải chứa khóa Desc.
Mục từ tên của tệp, như được quy định trong 7.7.4, ISO 32000-1:2008, có thể chứa khóa EmbeddedFiles, với điều kiện là tất cả các tệp nhúng đều tuân thủ TCVN 14159-1 (ISO 19005-1) hoặc tiêu chuẩn này.
CHÚ THÍCH: Việc cấm các tài liệu không tuân thủ PDF/A là không cho phép các tệp nhúng có thể tạo ra các phụ thuộc bên ngoài và làm phức tạp các nỗ lực bảo quản.
Một trình đọc phù hợp cung cấp một cơ chế để hiển thị các chuỗi tên từ giá trị của khóa EmbeddedFiles trong mục từ tên của một tệp phù hợp. Ngoài ra, một trình đọc phù hợp cũng có thể chọn hiển thị thông tin từ các mục từ dòng tệp nhúng được liên kết hoặc mục từ Params của chúng.
6.9 Nội dung tùy chọn
Nội dung tùy chọn có thể được sử dụng trong tệp PDF/A-2 để cho phép nhiều biến thể của tài liệu được cung cấp trong một tệp đơn. Các trường hợp sử dụng phổ biến cho việc này bao gồm tài liệu đa ngôn ngữ, phiên bản khu vực hoặc các nhóm đối tượng khác nhau trên bản vẽ kiểu-CAD.
Một biến thể bao gồm một hoặc nhiều nhóm nội dung tùy chọn (OCGs), được liên kết thông qua mục từ thành viên nội dung tùy chọn (OCMD) và mục từ cấu hình nội dung tùy chọn (OCCD). Mỗi mục từ cấu hình nội dung tùy chọn quy định những OCG nào được nhóm lại với nhau để tạo thành một biến thể đơn.
Tài liệu của Catalog có thể chứa khóa OCProperties. Sự hiện diện của OCProperties biểu thị rằng tệp có chứa các biến thể và các yêu cầu phần này áp dụng.
Trong trường hợp không có hướng dẫn rõ ràng tới chiều ngược lại, trình đọc PDF/A 2 phải kết xuất tệp ở trạng thái mặc định được đặt bởi giá trị của khóa D trong mục từ OCPropertĩes, như được quy định trong “Xác định trạng thái của các nhóm nội dung tùy chọn” (8.11.4, ISO 32000-1:2008).
Mục từ OCProperties cũng có thể chứa khóa Contigs. Nếu khóa Configs có mặt, thì mỗi phần tử của mảng tạo thành giá trị của Configs phải quy định một biến thể đơn.
Mỗi mục từ cấu hình nội dung tùy chọn tạo thành giá trị của khóa D hoặc đó là một phần tử trong mảng tạo nên giá trị của khóa Configs trong mục từ OCProperties, phải chứa khóa Name, là định danh của biến thể, phải có giá trị là duy nhất trong số tất cả các mục từ cấu hình nội dung tùy chọn bên trong tệp PDF/A-2.
CHÚ THÍCH 1: Khuyến nghị rằng tất cả các giá trị cho khóa Name được chọn theo cách để cho phép việc định danh rõ ràng nội dung chính xác được in hoặc hiển thị.
Nếu mục từ cấu hình nội dung tùy chọn có chứa khóa Order, mảng mà là giá trị của khóa Order này phải chứa các tham chiếu đến tất cả OCG trong tệp phù hợp.
Một trình đọc tương tác phù hợp phải cung cấp một giá trị phương tiện để hiển thị nội dung của khóa Order từ bất kỳ OCCD nào có trong tệp phù hợp có chứa khóa Order hoặc kế thừa khóa Order từ OCCD mặc định. Ngoài ra, nếu một tệp phù hợp có chứa OCCD, ngoài OCCD mặc định, thì một trình đọc tương tác phù hợp phải cung cấp một phương tiện để hiển thị danh sách OCCD mà từ đó người sử dụng có thể chọn cái nào để xem và in.
CHÚ THÍCH 2: Các OCG trong mảng Order có thể được cấu trúc bằng cách sử dụng cấp bậc của mảng và không phải đơn giản là một danh sách phẳng.
Khóa AS không được xuất hiện trong bất kỳ mục từ cấu hình nội dung tùy chọn nào.
CHÚ THÍCH 3: Điều này ngăn cản việc điều chỉnh tự động các trạng thái dựa trên thông tin sử dụng (8.11.4.5, ISO 32000- 1:2008).
CHÚ THÍCH 4: Các yêu cầu của 6.2.11 áp dụng cho tất cả các phông chữ được sử dụng trong tất cả các nội dung tùy chọn, ngay cả khi một trao đổi cụ thể không dẫn đến được một số nội dung tùy chọn được kết xuất.
Một trình đọc phù hợp không sử dụng giá trị của khóa Intent.
6.10 Sử dụng các bản trình bày thay thế và chuyển tiếp
Không được có điểm truy nhập AlternatePresentations trong mục từ tên của tài liệu. Không được có điểm truy nhập PresSteps trong bất kỳ mục từ Trang nào.
CHÚ THÍCH: Những hạn chế này cấm sử dụng bản trình chiếu thay thế bản trình bày, bởi điều này có thể khiến bản trình bày trên màn hình khác với những gì được nhìn thấy khi in cùng một tệp.
Trình đọc tương tác phù hợp với PDF/A-2 phải bỏ qua các khóa Trans và Dur có mặt trong mục từ Page.
6.11 Yêu cầu tài liệu
Thư mục tài liệu không được chứa khóa Requirements.
CHÚ THÍCH: Tất cả các trình đọc phù hợp với PDF/A-2 đáp ứng các yêu cầu của tiêu chuẩn này và do đó các tài liệu phù hợp không có các yêu cầu cụ thể.
Phụ lục A
(Quy định)
Phương pháp xác định hiệu ứng trong suốt trên một trang
A.1 Yêu cầu chung
Phần này mô tả phương pháp mà trình đọc phù hợp phải sử dụng để xác định xem trang đã cho có chứa bất kỳ phần tử đồ họa nào mà trạng thái đồ họa liên quan chứa hiệu ứng trong suốt hoặc có liên quan đến hoạt động hiệu ứng trong suốt hay không.
A.2 Nội dung trang
Đối với mỗi phần tử đồ họa được kết xuất trên trang, trạng thái đồ họa phải được kiểm tra có bất kỳ điều kiện nào dưới đây không. Nếu có thì, phần tử được coi là có liên quan đến hiệu ứng trong suốt và trang đó chứa hiệu ứng trong suốt.
- Khóa SMask có mặt và giá trị của nó là của mục từ kiểu.
- Khóa ca có mặt và giá trị của nó nhỏ hơn 1.
- Khóa CA có mặt và giá trị của nó nhỏ hơn 1.
- Khóa BM có mặt và giá trị của nó không phải là Normal.
Nếu một phần tử của trạng thái đồ họa đặt khoảng màu là Kiểu mẫu Type 1 thì tài nguyên Patterm phải được coi như là Mẫu XObject và được xử lý theo A.3.
Ngoài trạng thái đồ họa, một số kiểu phần tử đồ họa cần được xử lý thêm. Bất kỳ phần tử đồ họa nào đại diện cho một Mẫu XObject phải được xử lý theo A.3. Các phần tử đồ họa liên kết với các Hình ảnh XObject phải được xử lý theo A.4. Các phần tử văn bản phải được xử lý theo A.5.
Khi các Chú giải yêu cầu một luồng hiển thị được vẽ bởi một trình đọc phù hợp trên đầu nội dung trang, nên sự có mặt của chúng có thể khiến một trang không có bất kỳ hiệu ứng trong suốt nào có được một số hiệu ứng trong suốt. Do đó, tất cả các đối tượng chú giải trong mảng Annots của mục từ trang phải có luồng hiển thị của chúng, nếu có, được xử lý như là Mẫu XObject, theo A.3.
A.3 Xobject mẫu
Nếu mục từ của XObject chứa khóa Group và giá trị của Group là Transparency, thì XObject là một phần của nhóm hiệu ứng trong suốt và bất kỳ trang nào mà nó được đặt trên đó đều chứa hiệu ứng trong suốt.
Ngoài ra, dòng nội dung của XObject Mẫu phải được xử lý theo A.2.
A.4 XObject hình ảnh
Nếu mục từ XObjetct có chứa một khóa Smask và giá trị của nó là một dòng kiểu, thì hình ảnh có hiệu ứng trong suốt liên kết với nó và bất kỳ trang nào mà nó được đặt trên đó đều chứa hiệu ứng trong suốt.
Nếu mục từ của XObject chứa khóa SMasklnData có giá trị lớn hơn không (0), thì hình ảnh có hiệu ứng trong suốt được liên kết với nó và bất kỳ trang nào mà nó được đặt trên đó đều có hiệu ứng trong suốt.
A.5 Đối tượng văn bản
Đối với bất kỳ phần tử đồ họa nào thể hiện bản vẽ văn bản, trạng thái văn bản của nó phải được kiểm tra để xác định kiểu phông chữ đang được sử dụng để kết xuất. Nếu Subtype của mục từ phông chữ là Type 3, thì mỗi đối tượng trong mảng CharProc phải được xử lý như XObject Mẫu theo A.3.
Phụ lục B
(Quy định)
Yêu cầu đối với chữ ký số trong PDF/A
B.1 Ký tên
Khi tính toán bản tóm tắt cho tệp, nó phải được tính toán trên toàn bộ tệp, bao gồm mục từ chữ ký nhưng ngoại trừ bản thân Chữ ký PDF. Phạm vi này sau đó được chỉ ra bởi mục nhập ByteRange của mục từ chữ ký.
CHÚ THÍCH 1: Điều này làm cho một khuyến nghị trong 12.8.1, ISO 32000-1:2008 có tính quy định.
CHÚ THÍCH 2: Bằng cách hạn chế mục nhập ByteRange theo cách này, nó đảm bảo rằng không có byte nào trong PDF không nằm trong bản tóm tắt, ngoại trừ chính Chữ ký PDF.
Chữ ký PDF (một đối tượng dữ liệu nhị phân PKCS#7 được mã hóa-DER) phải được đặt vào mục nhập Contents của mục từ chữ ký. Đối tượng PKCS#7 phải tuân theo đặc điểm kỹ thuật PKCS#7 trong RFC 2315. Tối thiểu, nó phải bao gồm chứng chỉ ký tên X.509 của người ký và chỉ có một người ký (ví dụ: một cấu trúc "Signerlnfo" đơn) trong Chữ ký PDF.
CHÚ THÍCH 3: Mặc dù ISO 32000-1 cũng cho phép giá trị của mục nhập Contents của mục từ chữ ký là đối tượng dữ liệu nhị phân PKCS#1 được mã hóa DER, nhưng định dạng đó không được khuyến khích.
Theo khuyến nghị của 12.8.3.3.1, ISO 32000-1:2008, thông tin về tem thời gian và việc thu hồi nên được đưa vào để cải thiện các thuộc tính chống thoái thác dài hạn của chữ ký. Thông tin thu hồi này và toàn bộ chuỗi chứng chỉ hiện có phải được chụp lại và xác thực trước khi hoàn thành việc tạo Chữ ký PDF. Ngoài ra, thông tin thu hồi phải là một thuộc tính được ký của Chữ ký PDF.
ISO 32000-1:2008 cho phép bao hàm một hoặc nhiều chứng chỉ thuộc tính RFC 5755 được liên kết với chứng chỉ người ký. Tuy nhiên, một trình ghi phù hợp không nên đưa chúng vào vì chúng không được hỗ trợ rộng rãi; do đó, việc sử dụng thuộc tính sẽ làm giảm khả năng tương tác.
CHÚ THÍCH 4: Một trình đọc phù hợp không yêu cầu phải xử lý bất kỳ chứng chỉ thuộc tính nào.
ISO 32000-1:2008 cho phép các giá trị cho Filter và SubFilter khác với các giá trị được ghi trong 12.8.3.3.1, ISO 32000-1:2008. Để xác thực chữ ký trong PDF/A, trình đọc phù hợp có thể gọi trình xử lý chữ ký thích hợp. Để tối đa hóa khả năng tương tác, hai giá trị cho SubFilter được liệt kê trong ISO 32000-1:2008,12.8.3.3.1 (adbe.pkcs7.detached và adbe.pkcs7.sha1) phải được hỗ trợ bởi trình đọc phù hợp.
B.2 Tính hợp lệ
Trình đọc phù hợp phải thực hiện các bước sau khi xác thực bất kỳ chữ ký nào trong một tệp phù hợp:
- Xác minh rằng bản tóm tắt tài liệu khớp với chữ ký như quy định trong 12.8.1, ISO 32000-1.
- Xác thực đường dẫn của chứng chỉ được sử dụng để xác minh sự ràng buộc giữa tên phân biệt của chủ đề và khóa công cộng của chủ đề như được quy định trong RFC 3280. Việc kiểm tra tính hợp lệ phải được thực hiện vào thời điểm được biểu thị, hoặc là bằng tem thời gian hoặc một số dấu hiệu đáng tin cậy khác của thời gian ký kết. Trạng thái thu hồi phải được kiểm tra.
Khi xác thực Chữ ký PDF, trình đọc phù hợp có thể bỏ qua bất kỳ thông tin thu hồi nhúng nào để ủng hộ lưu trữ thay thế hoặc dữ liệu tham chiếu theo chính sách riêng.
Phụ lục C
(Tham khảo)
Thực hành tốt cho PDF/A
C.1 Sử dụng siêu dữ liệu không phải XMP
Việc sử dụng siêu dữ liệu không phải XMP ở cấp tệp không được khuyến khích vì không thể đảm bảo rằng siêu dữ liệu đó có thể được giữ nguyên theo đặc tả này. Trong trường hợp có siêu dữ liệu không phải XMP, ưu tiên là chuyển đổi chúng thành XMP, nhúng chúng vào tệp và mô tả chuyển đổi trong đặc tính xmpMM:History. Tốt hơn là, thuộc tính xmpMM:History cũng được sử dụng để chỉ ra bất kỳ phần tử không phải XMP nào chưa được chuyển đổi.
Việc không bảo quản siêu dữ liệu có thể gây ra các vấn đề trong việc định vị, diễn giải, quản lý và xác thực tệp trong tương lai, do đó có thể làm giảm hoặc hủy giá trị lưu trữ của tệp đó.
C.2 Các yếu tố định danh ngôn ngữ tự nhiên
Ngôn ngữ tự nhiên được khai báo như đã thảo luận trong 14.9.2, ISO 32000-1:2008 và 7.9.2, ISO 32000- 1:2008.
Mã ngôn ngữ được định danh bằng cách sử dụng mã định danh đã đăng ký ISO 639-2 hoặc TCVN 7217- 2 (ISO 3166-2). Số định danh sử dụng riêng chỉ được sử dụng nếu ngôn ngữ không có số định danh được quy định trong ISO 639-2 hoặc ISO 3166-2. Trong trường hợp một ngôn ngữ thực sự không xác định, có thể sử dụng yếu tố định danh x-unknown.
CHÚ THÍCH: ISO 32000-1:2008 sử dụng ISO 639-2 hoặc TCVN 7217-2 (ISO 3166-2) làm cơ sở cho các định danh ngôn ngữ.
Ngoài ra, các khuyến nghị sau đây có thể được thực hiện khi có thể:
- Các tài liệu không được thể hiện bằng ngôn ngữ tự nhiên có thể khai báo ngôn ngữ gốc là zxx.
- Các tài liệu được thể hiện bằng ngôn ngữ không xác định cho tác giả hoặc người tạo lập có thể khai báo ngôn ngữ gốc là und.
- Các tài liệu có tỷ lệ bằng nhau của nhiều ngôn ngữ có thể khai báo ngôn ngữ gốc là mul và sử dụng các phần tử cấu trúc để nhóm và gắn thẻ từng khối nội dung với mã chính xác cho ngôn ngữ của nội dung.
- Thay đổi trong ngôn ngữ tự nhiên phải được khai báo.
- Hướng văn bản phải được khai báo và các thay đổi trong hướng văn bản phải được khai báo.
- Khi trình đọc được dự định, các chữ viết tắt, từ viết tắt, chữ viết tắt độc lập và các dạng viết tắt được gắn thẻ Abbr và phần mở rộng của chúng phải được cung cấp theo 14.9.5, ISO 32000-1:2008.
C.3 Khuyến nghị cho việc chụp hoặc chuyển đổi tài liệu sang PDF/A
Đối với mục đích bảo quản lưu trữ, tuyên bố về Thực hành tốt này cung cấp các khuyến nghị cho các quá trình chụp hoặc chuyển đổi tài liệu sang dạng PDF/A để đảm bảo rằng các tệp phù hợp giữ nguyên chất lượng và tính toàn vẹn như hồ sơ. Các viện lưu trữ và các tổ chức khác với yêu cầu bảo quản dài hạn nên khuyến khích việc sử dụng phù hợp mức độ A như được mô tả trong 5.2 và phần hướng dẫn bổ sung của điều này.
TCVN 7420-1:2004 (ISO 15489-1:2001), 7.1, chỉ rõ rằng “Để hỗ trợ cho việc tiến hành công việc liên tục, phù hợp với môi trường chế định và đảm bảo trách nhiệm cần thiết, tổ chức cần tạo lập và duy trì các hồ sơ một cách xác thực, tin cậy và khả dụng, bảo đảm tính toàn vẹn của các hồ sơ đó trong khoảng thời gian theo như yêu cầu”.
Môi trường pháp lý để gửi tài liệu đến viện lưu trữ của tổ chức có thể bao gồm các yêu cầu, tiêu chuẩn và chính sách đối với tài liệu điện tử quy định các quy tắc về chất lượng tài liệu như độ phân giải ảnh tối thiểu, hạn chế nén hoặc các quá trình bị cấm, làm thay đổi hoặc hủy bỏ dữ liệu đã được phê duyệt. Cho mục đích bảo quản lưu trữ, chất lượng và tính toàn vẹn của tài liệu tạo ra theo những yêu cầu pháp lý và yêu cầu quy định này, các tiêu chuẩn có thể ứng dụng và chính sách tổ chức phải được giữ nguyên khi chúng được chụp hoặc chuyển đổi sang PDF/A.
Để đáp ứng những nhu cầu lưu trữ nguy cấp, quá trình chụp hoặc chuyển đổi PDF/A nên sao chép nội dung chính xác và chất lượng của tài liệu nguồn trong tệp phù hợp. Những ví dụ sau của hướng dẫn phát triển phần mềm thực hiện điều này.
- Trình ghi các tệp phù hợp không nên sử dụng tính năng nén có tổn hao, lấy mẫu nhỏ, giảm mẫu hoặc bất kỳ quá trình nào khác làm thay đổi nội dung hoặc làm giảm chất lượng của dữ liệu nguồn trong tệp phù hợp.
- Phần mềm không được thay thế văn bản có thể tìm kiếm, dựa trên nhận dạng ký tự quang học, cho văn bản gốc được quét bên trong hình ảnh ánh xạ-bit của tài liệu được quét sang tệp phù hợp từ giấy hoặc được chuyển đổi sang tệp phù hợp từ định dạng hình ảnh.
CHÚ THÍCH: Các quá trình nhận dạng ký tự quang học có thể làm mất dữ liệu thông qua việc diễn giải không chính xác các ký tự được quét.
C.4 Xử lý hình ảnh
Để tránh làm giảm chất lượng hình ảnh được nén sử dụng nén có tổn hao (như JPEG), trình ghi phù hợp phải đưa hình ảnh nén gốc vào tệp PDF/A mà không làm thay đổi Hình ảnh hoặc giải nén hình ảnh và nén lại bằng thuật toán nén không tổn hao.
Phụ lục D
(Tham khảo)
Sự hợp nhất các tập dữ liệu XFA vào một tệp phù hợp PDF/A-2
Phần tử
Một trình đọc phù hợp không sử dụng bất kỳ giá trị nào trong cây tên được liên kết với XFAResources để kết xuất.
CHÚ THÍCH: Mục từ Names là một vùng PDF đại diện cho bộ sưu tập của dữ liệu mức độ tài liệu có thể dễ dàng định vị bằng các công cụ xử lý PDF do đó cho phép dữ liệu được dễ dàng trích xuất sang định dạng XML ban đầu để xử lý.
Thư mục tài liệu tham khảo
[1] TCVN 6909 (ISO/IEC 10646-1) Công nghệ thông tin - Bộ mã ký tự tiếng Việt 16-bit
[2] TCVN 7217-2 (ISO 3166-2) Mã thể hiện tên và vùng lãnh thổ của các nước - Phần 2: Mã vùng lãnh thổ
[3] TCVN 7420-1 (ISO 15489-1) Thông tin và tư liệu - Quản lý hồ sơ - Phần 1: Yêu cầu chung
[4] ANSI X3.4, Information Systems - Coded Character Sets - 7-Bit American National standard Code for Information Interchange (7-Bit ASCII)
[5] ECMA-6, 7-Bit coded Character Set
Available from
[6] ISO 639-2:1998, Codes for the representation of names of languages - Part 2: Alpha-3 code
[7] ISO 14721:2003, Space data and information transfer systems - Open archival information system - Reference model
[8] ISO/TR 15801, Document management - Information stored electronically - Recommendations for trustworthiness and reliability
[9] ISO 15930-1:2001, Graphic technology - Prepress digital data exchange - Use of PDF - Part 1: Complete exchange using CMYK data (PDF/X-1 and PDF/X-1a)
[10] ISO 15930-3:2002, Graphic technology - Prepress digital data exchange - Use of PDF - Part 3: Complete exchange suitable for colour-managed workflows (PDF/X-3)
[11] ISO 15930-4:2003, Graphic technology - Prepress digital data exchange using PDF - Part 4: Complete exchange of CMYK and spot colour printing data using PDF 1.4 (PDF/X-1a)
[12] ISO 15930-6:2003, Graphic technology - Prepress digital data exchange using PDF - Part 6: Complete exchange of printing data suitable for colour-managed workflows using PDF 1.4 (PDF/X-3)
[13] ISO/TR 18492, Long-term preservation of electronic document-based information
[14] Partners Guide to XMP for Dynamic
Media, Adobe Systems Incorporated. Available from
[15] The Unicode standard, Version 4.0. The Unicode Consortium. Boston, MA: Addison-Wesley, 2003, ISBN 0-321-18578-1
[16] Unicode Standard Annex #15, Unicode
Normalization Forms, Unicode Consortium, 17 April 2003. Available from
[17] Namespaces in XML 1.0 (Second
Edition), W3C Recommendation, 16 August 2006. Available from
[18] ICC. 1A:1999-04, Addendum 2 to Spec.
ICC.1:1998-09, International Color Consortium. Available from
[19] ICC.1:2004-10, File Format forColor
Profiles, International Color Consortium. Available from
[20] RFC 5755, An Internet Attribute Certificate Profile for Authorization. Available from http://www.rfc- editor.org[3]
[21] XMP: Extensible Metadata Plafform,
September 2005, Adobe Systems Incorporated. Available from
Mục lục
Lời nói đầu
Lời giới thiệu
1 Phạm vi áp dụng
2 Tài liệu viện dẫn
3 Thuật ngữ và định nghĩa
4 Ký hiệu
5 Mức độ phù hợp
5.1 Yêu cầu chung
5.2 Phù hợp mức độ A
5.3 Phù hợp mức độ B
5.4 Phù hợp mức độ U
5.5 Trình đọc phù hợp
6 Yêu cầu kỹ thuật
6.1 Cấu trúc tệp
6.2 Đồ họa
6.3 Chú giải
6.4 Mẫu tương tác
6.5 Hành động
6.6 Siêu dữ liệu
6.7 Cấu trúc logic
6.8 Tệp nhúng
6.9 Nội dung tùy chọn
6.10 Sử dụng các bản trình bày thay thế và chuyển tiếp
6.11 Yêu cầu tài liệu
Phụ lục A (quy định) Phương pháp xác định hiệu ứng trong suốt trên một trang
Phụ lục B (quy định) Yêu cầu đối với chữ ký số trong PDF/A
Phụ lục C (tham khảo) Thực hành tốt cho PDF/A
Phụ lục D (tham khảo) Sự hợp nhất các tập dữ liệu XFA vào một tệp phù hợp PDF/A-2
Thư mục tài liệu tham khảo
Ý kiến bạn đọc
Nhấp vào nút tại mỗi ô tìm kiếm.
Màn hình hiện lên như thế này thì bạn bắt đầu nói, hệ thống giới hạn tối đa 10 giây.
Bạn cũng có thể dừng bất kỳ lúc nào để gửi kết quả tìm kiếm ngay bằng cách nhấp vào nút micro đang xoay bên dưới
Để tăng độ chính xác bạn hãy nói không quá nhanh, rõ ràng.