ISO/IEC 15444-6:2013
CÔNG NGHỆ THÔNG TIN - HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG2000 - ĐỊNH DẠNG TỆP HÌNH ẢNH PHỨC HỢP
Information technology - JPEG 2000 image coding system - Compound image file format
Mục lục
1 Phạm vi áp dụng
2 Tài liệu viện dẫn
3 Thuật ngữ và định nghĩa
4 Ký hiệu và thuật ngữ viết tắt
5 Sắp xếp chung
5.1 Mô hình quét nội dung kết hợp
5.2 Cấu trúc và các thành phần tệp tin
5.2.1 Tập trang
5.2.2 Các trang
5.2.3 Đối tượng trình bày
5.2.4 Các ảnh thu nhỏ
5.2.5 Dòng mã liên tục và dòng mã đã phân mảnh
5.2.6 Dữ liệu chia sẻ
5.2.7 Dữ liệu đặc tả
5.3 Dữ liệu đặc tả văn bản ẩn
5.4 Kịch bản sử dụng JPM
5.4.1 Tệp tin tự chứa và các tệp tin tham chiếu bên ngoài
5.4.2 Tệp tin chuẩn bị để sử dụng trên Internet
5.4.3 Ví dụ tập trang
5.4.4 Tập trang trong một ngữ cảnh máy khách/máy chủ
5.4.5 Ví dụ về tương tác máy khách/máy chủ
5.4.6 Ví dụ về thu hình máy quét (scanner capture)
Phụ lục A (Quy định) Cấu trúc tệp tin ảnh phức hợp
A.1 Nhận dạng tệp tin
A.2 Tổ chức tệp tin
A.3 Định nghĩa khung
A.4 Các khung được sử dụng trong tệp tin ảnh phức hợp
Phụ lục B (Quy định) Định nghĩa khung
B.1 Các khung cấp độ tệp tin
B.2 Khung cấp độ trang
B.3 Khung cấp độ đối tượng trình bày
B.4 Khung cấp độ đối tượng
B.5 Khung phần tử dòng mã JP2
B.6 Khung tổng quát
Phụ lục C (Quy định) Dữ liệu đặc tả (Metadata)
C.1 Bổ sung thông tin sở hữu trí tuệ vào tệp tin JPM
C.2 Bổ sung thông tin nhà cung cấp cụ thể vào định dạng tệp tin JPM
Phụ lục D (Quy định) Hồ sơ
D.1 Hồ sơ JPM
D.2 Hồ sơ giải nén
Phụ lục E (Quy định) (Dự kiến xây dựng)
Phụ lục F (Quy định) Lưu trữ văn bản ẩn và các chú thích
F.1 Lưu trữ của HTX trong JPM
F.2 Nén HTX
Phụ lục G (Quy định) Văn bản ẩn và các loại chú thích và các phần tử
G.1 Tổng quan
G.2 Loại
G.3 Thuộc tính chung
G.4 Phần tử
Phụ lục H (Quy định) Lược đồ văn bản ẩn và các chú giải
H.1 Lược đồ XML
H.1.1 Phiên bản và mã hóa
H.1.2 Lược đồ
Phụ lục I (Tham khảo) Các ví dụ về văn bản ẩn và các chú giải
I.1 Ví dụ 1
I.2 Ví dụ 2
I.3 Ví dụ 3
Phụ lục J (Tham khảo) Hướng dẫn cấu trúc các nguồn URL cho các tệp tin JPM
J.1 Các trang và các đối tượng trình bày (Pages and layout objects)
J.2 Khung dữ liệu đặc tả (Metadata boxes)
J.3 Nhãn
J.4 Tập trang (Page collections)
J.5 Hình thu nhỏ của trang (Page thumbnails)
J.6 Hình thu nhỏ tài liệu (Document thumbnail)
J.7 Dải byte
Lời nói đầu
TCVN 11777-6:2018 hoàn toàn tương đương ISO/IEC 15444-6:2013.
TCVN 11777-6:2018 do Học viện Công nghệ Bưu chính Viễn thông biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.
CÔNG NGHỆ THÔNG TIN - HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 - ĐỊNH DẠNG TỆP HÌNH ẢNH PHỨC HỢP
Information technology - JPEG 2000 image coding system - Compound image file format
Tiêu chuẩn này đưa ra quy định định dạng tệp tin chuẩn để lưu giữ ảnh phức hợp bằng cách sử dụng cấu trúc họ định dạng tệp tin JPEG 2000. Định dạng này là một phần mở rộng của các định dạng tập tin JP2 đã được quy định trong Phụ lục I của ISO/IEC 15444-1 và sử dụng các khung quy định cho cả hai định dạng tệp tin JP2 và định dạng tệp tin JPX quy định tại Phụ lục M của ITU-T T.801 | ISO/IEC 15444-2. Tiêu chuẩn này dùng cho các ứng dụng lưu trữ ảnh kiểu nhiều trang, các ảnh với nhiều nội dung, và/hoặc ảnh với nhiều cấu trúc so với hình ảnh quy định trong JP2.
Các ứng dụng định dạng tệp tin trong tiêu chuẩn này như sau:
- Quy định khung nhị phân ảnh nhiều mức và ảnh nhiều sắc độ liên tục trong việc thể hiện ảnh phức hợp;
- Quy định cơ chế kết hợp nhiều ảnh thành phần thành một ảnh phức hợp duy nhất, dựa trên mô hình quét nội dung kết hợp (MRC);
- Quy định cơ chế cho phép nhóm nhiều ảnh trong một cấu trúc với nhiều đối tượng trình bày, nhiều trang ảnh và nhiều tập trang ảnh;
- Quy định cơ chế lưu trữ ảnh JPEG 2000 và các định dạng dữ liệu ảnh nén khác;
- Quy định cơ chế để dữ liệu đặc tả được bao gồm trong tệp tin.
Các tài liệu viện dẫn sau đây là cần thiết để áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi, bổ sung (nếu có).
ITU-T T.44 (1999) | ISO/IEC 16485/Amd 1:2000, Information technology - Mixed Raster Content (MRC) (Công nghệ thông tin - Quét nội dung kết hợp).
ITU-T T.44 Amd.1 (1999) | ISO/IEC 16495:2000 Amd 1, Accommodation of new Annex B (Hiệu đính mới cho Phụ lục B).
ITU-T T.45 (2000), Run-length Colour Encoding (Mã hóa màu loạt dài).
ITU-T T.50 (1992) | ISO/IEC 646:1991, International Reference Alphabet (IRA) (Formerly International Alphabet No. 5 or IA5) - Information technology - 7 bit coded character set for information interchange. (Bảng chữ cái chuẩn quốc tế (IRA) (Bảng chữ cái quốc tế dạng số 5 hoặc IA5) - Công nghệ thông tin - bộ ký tự mã hóa 7 bít cho trao đổi thông tin).
ITU-T T.81 (1992) | ISO/IEC 0918-1:1994, Information technology - Digital compression and coding of continuous-tone still Images: Requirements and guidelines (Công nghệ thông tin - Nén số và mã hóa các ảnh có sắc độ liên tục: yêu cầu và các dòng hướng dẫn).
ITU-T T.82 (1993) | ISO/IEC 11544:1993, Information technology-Coded representation of picture and audio information - Progressive bi-level Image compression (Công nghệ thông tin - Biểu diễn mã hóa thông tin âm thanh và ảnh - Tiến trình nén ảnh hai mức).
ITU-T T.83 (1994) | ISO/IEC 10918-2:1995, Information technology- Digital compression and coding of continuous-tone still images: Compliance testing (Công nghệ thông tin - Nén số và mã hóa các ảnh có sắc độ liên tục: Kiểm tra tuân thủ).
ITU-T T.84 (1996) | ISO/IEC 10918-3:1997, Information technology- Digital compression and coding of continuous-tone still images: Extensions (Công nghệ thông tin - Nén số và mã hóa các ảnh có sắc độ liên tục: Các mở rộng).
ITU-T T.84 bổ sung 1 (1999) | ISO/IEC 10918-3:1997/Amd 1:1999, Provisions to allow registration of new compression types and versions in the SPIFF header (Các điều để cho phép đăng ký các kiểu nén và các phiên bản mới trong trường tiêu đề SPIEF).
ITU-T T.86 (1998) | ISO/IEC 10918-4:1999, Information technology-Digital compression and coding of continuous-tone still Images: Registration of JPEG Profiles, SPIFF Profiles, SPIFF Tags, SPIFF colour Spaces, APPn Markers, SPIFF Compression types and Registration authorities (REGAUT) (Công nghệ thông tin - Công nghệ thông tin - Nén số và mã hóa các ảnh có sắc độ liên tục: Đăng ký các profile JPEG, SPIEF, các thẻ SPIEF, các không gian màu SPIEF, các nhãn APPn, các loại nén và đăng ký bản quyền SPIEF (REGAAUT)).
ITU-T T.87 (1998) | ISO/IEC 14495-1:2000, Information technology - Lossless and near-lossless compression of continuous-tone still Images - Baseline (Công nghệ thông tin - Nén không tổn thất và ít tổn thất của các ảnh sắc độ liên tục - giảm các ảnh có sắc độ liên tục: Đường cơ sở).
ITU-T T.88 (2000) | ISO/IEC 14492:2001, Information technology - Lossy/lossless coding of bi-level images (Công nghệ thông tin - Mã hóa tổn thất/không tổn thất với các ảnh hai mức).
ITU-T T.800 (2002) | ISO/IEC 15444-1:2004, Information technology - JPEG 2000 image coding system: Core coding system (Công nghệ thông tin - Hệ thống mã hóa ảnh JPEG 2000: Hệ thống mã hóa lõi).
ITU-T T.801 (2002) | ISO/IEC 15444-2:2004, Information technology - JPEG 2000 image coding system; Extensions (Công nghệ thông tin-Hệ thống mã hóa hình ảnh JPEG 2000: Các mở rộng).
ITU-T T.801 (2002) | ISO/IEC 15444-2:2004, Information technology - JPEG 2000 image coding system: Conformance testing (Công nghệ thông tin-Hệ thống mã hóa ảnh JPEG 2000: Kiểm tra tương thích).
ITU-T T.4 (2003), Standardization of Group 3 facsimile terminals for document transmission (Tiêu chuẩn hóa các thiết bị đầu cuối fax Nhóm 3 cho việc truyền tài liệu).
ITU-T T.6 (1998), Facsimile coding schemes and coding control functions for Group 4 facsimile apparatus (Các lược đồ mã hóa fax và các chức năng điều khiển mã hóa cho bản sao và các chức năng điều khiển mã hóa cho các Công cụ fax Nhóm 4).
ITU-T T.42 (2003), Continuous-tone colour representation method for facsimile (Phương thức thể hiện sắc độ liên tục cho bản fax).
ITU-T T.89 (2001), Application profiles for Recommendation T.88 - Lossy/lossless coding of bi-level images (JBIG2) for facsimile (Các profile ứng dụng cho Khuyến nghị T.88 - Mã hóa tổn thất/không tổn thất với các ảnh hai mức (JBIG2) cho bản fax).
IEC 61966-2-1:1999-10, Multimedia systems and equipment - Colour measurement and management - Part 2-1: Colour management - Default RGB colour space - sRGB (Các hệ thống đa phương tiện và thiết bị - Quản lý và Đo lường màu sắc - Phần 2-1: Quản lý màu sắc - Không gian màu RGB mặc định-sRGB).
IEC 61966-2-1/Amd.12003, Multimedia systems and equipment - Colour measurement and management - Part 2-1: Colour management - Default RGB colour space - sRGB (Các hệ thống đa phương tiện và thiết bị - Quản lý và Đo lường màu sắc - Phần 2-1: Quản lý màu sắc-Không gian màu RGB mặc định - sRGB).
ISO 3166-1:1997, Codes for the representation of names of countries and their subdivisions - Part 1: Country codes (Mã biểu diễn tên các quốc gia và vùng lãnh thổ của chúng - Phần 1: Các mã quốc gia).
ISO 3166-2:1998, Codes for the representation of names of countries and their subdivisions - Part 2: Country subdivision code (Mã biểu diễn tên các quốc gia và vùng lãnh thổ của chúng - Phần 2: Các mã vùng lãnh thổ quốc gia).
ISO 5807-2:1985, Information processing - Documentation symbols and conventions for data, program and system flowcharts, program network charts and system resources charts (Xử lý thông tin - Các ký hiệu và quy ước tài liệu cho dữ liệu, chương trình, và các sơ đồ tiến trình hệ thống, các biểu đồ mạng chương trình và các biểu đồ tài nguyên hệ thống).
ISO 8601:2000, Data elements and Interchange formats - Information interchange - Representation of dates and times (Các thành phần dữ liệu và các chuyển đổi định dạng - Chuyển đổi thông tin - Biểu diễn/thể hiện thời gian ngày và giờ).
ISO/IEC 6859-1:1998, Information technology - 8-bit single-byte coded graphic character sets - Part 1: Latin alphabet No. 1 (Công nghệ thông tin - Các bộ ký tự đồ họa mã byte đơn 8 bít - Phần 1: Ký tự Latin số 1).
ISO/IEC 11578:19968, Information technology - Open Systems Interconnection - Remote Procedure Call (RPC) (Công nghệ thông tin - Đa kết nối các hệ thống mở - Gọi thủ tục từ xa (RFC)).
IEEE Std. 754-1985, Tiêu chuẩn IEEE cho số học nhị phân dấu chấm động - điểm số học. (IEEE Standard for Binary Floating-Point Arithmetic)
IETF RFC 1766 (1995), Các thẻ cho việc nhận dạng ngôn ngữ. (Tags for the Identification of Languages.)
IETF RFC 1950 (1996), Kỹ thuật định dạng dữ liệu nén ZLIB phiên bản 3.3. (ZLIB Compressed Data Format Specification version 3.3.)
IETF RFC 1951 (1996), Kỹ thuật định dạng dữ liệu nén DEFLATE phiên bản 1.3. (DEFLATE Compressed Data Format Specification version 1.3.)
IETF RFC 2045 (1996), Tiêu chuẩn Phần mở rộng thư điện tử internet đa mục đích (MIME) Phần 1: Định dạng của khung bản tin Internet (Multipurpose Internet Mail Extensions (MIME) Part One: Format of Internet Message Bodies.)
IETF RFC 2279 (1998), UTF-8, định dạng chuyển đổi của chuẩn ISO 10646 (UTF-8, a transformation format of ISO 10646.)
IETF RFC 2396 (1998), Mã nhận dạng tài nguyên đồng nhất: Cú pháp chung. (Uniform Resource Identifiers (URI): Generic Syntax.)
W3C (2008), Phân tầng kiểu cách các trang, Đặc tính kỹ thuật mức độ 1 (CSS1) (Cascading Style Sheets, level 1 (CSS1) Specification). http://www.w3.org/TR/REC-CSS1/.
W3C (2011), Phân tầng kiểu cách các trang, mức độ 2, Đặc tính kỹ thuật Biên soạn lần thứ 1 (CSS2). (Cascading style Sheets, level 2, revision 1 (CSS2) Specification.) http://www.w3.org/TR/REC-CSS2.
W3C (2008), Ngôn ngữ đánh dấu mở rộng (XML) 1.0, Biên soạn lần thứ 5.
(Extensible Markup Language (XML) 1.0,
Fifth Edition.)
W3C (1999), Đặc tính kỹ thuật HTML
4.01. (HTML 4.01 Specification).
W3C (2002), XHTML ™ 1.0 Ngôn ngữ đánh dấu siêu văn bản mở rộng, Biên soạn lần thứ 2. (XHTML™ 1.0 Extensible HyperText Markup Language, Second Edition.) http://www.w3.org/TR/xhtml1.
W3C (2004), Lược đồ XML Phần 0: Mở
đầu, Biên soạn lần thứ 2. (XML Schema Part 0: Primer, Second Edition.)
W3C (2004), Lược đồ XML Phần 1: Cấu trúc. Biên
soạn lần thứ 2.
W3C (2004), Lược đồ XML Phần 2: Các kiểu số liệu, Biên
soạn lần thứ 2.
ICC.1:1998-09, Tổ chức tổ hợp màu quốc tế, định dạng tệp tin cho các profile màu. (International Color Consortium, File Format for Color Profiles.)
Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa sau:
3.1
Chú thích (annotation)
Khu vực cụ thể của một trang trong một tài liệu JPM có kết hợp tham chiếu dữ liệu URL, hay ghi chú hoặc đánh dấu nộl dung.
3.2
Màu gốc (Base colour)
Màu sắc của một đối tượng ảnh mà không có dữ liệu ảnh.
3.3
Trang gốc (BasePage)
Tình trạng cơ bản ban đầu của trang trước khi nó được kết hợp thêm các đối tượng trình bày.
3.4
Khung (box)
Một phần của định dạng tệp tin được xác định bằng độ dài và loại khung duy nhất. Một số loại khung có thể chứa các khung khác.
3.5
Thành phần (component)
Mảng hai chiều của các thành phần lấy mẫu.
3.6
Hình ảnh phức hợp (compound image)
Một ảnh chứa các ảnh được quét, ảnh tổng hợp hoặc cả hai, và cũng với các yêu cầu phù hợp trong việc trộn lẫn các phương pháp nén ảnh hai mức và ảnh sắc độ liên tục.
3.7
Văn bản ẩn XML có nén (compressed hidden text XML)
Loại dữ liệu văn bản XML (Extensible Markup Language - Ngôn ngữ đánh dấu mở rộng) được nén bằng cách sử dụng các cơ chế đã được quy định tại Điều F.2 trong Phụ lục F.
3.8
Định dạng tệp tin (file format)
Một dòng mã hay nhiều dòng mã với các thông tin hỗ trợ bổ sung cần thiết cho quá trình giải mã dòng mã. Các ví dụ về dữ liệu đặc tả bao gồm các trường văn bản cung cấp thông tin về tên, thông tin bảo mật, thông tin lịch sử, và dữ liệu hỗ trợ chi việc phân bố nhiều dòng mã trong tệp tin dữ liệu nhất định, và dữ liệu hỗ trợ trao đổi giữa các nền tảng hoặc chuyển đổi sang các định dạng tệp tin khác.
3.9
Phân mảnh (fragment)
Một phần của dòng mã cho một ảnh. Xem Điều 5.2.5 hướng dẫn sử dụng phân mảnh.
3.10
Văn bản ẩn (hidden text)
Ký hiệu thể hiện các ký tự và các từ có trong ảnh.
3.11
Khung UUID văn bản ẩn (hidden text UUID box)
Khung định danh duy nhất toàn cục (UUID: Universal Unique Identifier) chứa văn bản ẩn XML có nén.
3.12
Văn bản ẩn XML (hidden text XML)
Dữ liệu văn bản XML thể hiện văn bản ẩn và giải thích cho trang đơn trong tệp tin JPM mà tuân thủ theo các lược đồ trong Phụ lục H.
3.13
Lược đồ văn bản ẩn XML (hidden text XML schema)
Lược đồ văn bản ẩn XML được quy định tại phụ lục H.1.
3.14
Tệp tin JP2 (JP2 file)
Tên của tệp tin trong định dạng tệp tin được mô tả trong ISO/IEC 15444-1. Cấu trúc tệp tin JP2 là một dãy liên tiếp các khung.
3.15
Tệp tin JPM (JPM file)
Tên của tệp tin trong định dạng tệp tin được mô tả trong tiêu chuẩn này. Tệp tin JPM có thể có một hoặc nhiều trang kết hợp từ một hoặc nhiều đối tượng trình bày, trong số đó tệp tin được kết hợp từ ít nhất hai đối tượng. Cấu trúc tệp tin JPM là dãy liên tiếp các khung.
3.16
Tệp tin JPX (JPX file)
Tên của tập tin trong các định dạng tệp tin được mô tả trong ITU-T T.801 | ISO/IEC 15444-2. Cấu trúc, tệp tin JPX là một dãy liên tiếp các khung,
3.17
Đối tượng trình bày (layout object)
Một thực thể bao gồm tối đa hai đối tượng kết hợp hoặc các lớp MRC.
3.18
Tập trang chính (main page collection)
Tập trang chính chứa tất cả các trang và tập trang trong tệp tin.
3.19
Đối tượng mặt nạ (mask object)
Một đối tượng được sử dụng để chọn các mẫu của đối tượng ảnh tương ứng đó sẽ được tạo ảnh lên một trang.
3.20
Siêu dữ liệu (metadata)
Là các dữ liệu bổ sung để kết hợp cho việc mô tả các thông tin khác của dữ liệu ảnh thuộc ngoài các thông tin dữ liệu ảnh thể hiện.
3.21
Quét nội dung kết hợp (MRC - Mixed raster content)
Mô hình nhiều lớp ảnh được mô tả trong ITU-T T.44 | ISO/IEC 16485.
3.22
Đối tượng (object)
Một ảnh mà là một phần của đối tượng trình bày; lớp MRC.
3.23
Trang (page)
Tập lớn nhất của đối tượng trình bày được tạo ảnh một cách độc lập về bất kỳ các đối tượng trình bày khác; về các màn hoặc khung cho việc tạo ảnh.
3.24
Tập trang (page collection)
Tập các trang được nhóm lại với nhau trong tệp tin JPM. Mỗi trang phải chứa ít nhất một tập trang.
3.25
Ảnh trang (PageImage)
Ảnh được tạo ra bằng việc kết xuất trang gốc với đối tượng trình bày. Ảnh trang k là các ảnh được tạo ra bằng cách kết xuất trang gốc với lớp k đầu tiên của các đối tượng trình bày.
3.26
Tập trang cơ sở (primary page collection)
Tập trang cơ sở quy định cách thức chuyển trang ảnh trước và trang ảnh kế tiếp trong ảnh phức hợp được liên kết với một trang.
3.27
Profile
Một tập con của tất cả các trường có thể có giá trị trong tệp tin.
3.28
Tổ hợp khung (superbox)
Khung chính chứa chuỗi liên tiếp các khung (là duy nhất với một chuỗi liên tiếp các khung).
4 Ký hiệu và thuật ngữ viết tắt
Tiêu chuẩn này sử dụng các ký hiệu và thuật ngữ viết tắt nêu trong Điều 4 của ISO/IEC15444-1 và các ký hiệu, thuật ngữ sau:
DPI |
Dots per inch |
Số điểm trên mỗi inch. Là đơn vị để đo độ phân giải của màn hình hay máy in. Nó biểu thị số điểm mà thiết bị có thể in hay hiển thị được trên 1 inch chiều dài. 1 inch = 2,54 cm. |
HTX |
Hidden Text XML |
Văn bản ẩn XML: Dữ liệu Ngôn ngữ đánh dấu mở rộng (XML: Extensible Markup Language) thể hiện văn bản ẩn và giải thích cho trang duy nhất trong tệp tin JPM và dữ liệu phù hợp với các lược đồ trong Phụ lục H. |
IPR |
Intellectual Property Rights |
Quyền sở hữu trí tuệ |
JP2 |
JPEG 2000 File Format defined in Rec. ISO/IEC 15444-1 |
Định dạng tệp tin JPEG 2000 quy định trong ISO/IEC 15444-1 |
JPX |
JPEG 2000 File Format defined in Rec. ITU-T T.801 | ISO/IEC 15444-2; JPEG 2000 File Format Extended |
Định dạng tệp tin JPEG 2000 quy định trong ITU-T T.801 | ISO/IEC 15444-2; JPEG 2000 mở rộng định dạng tệp tin. |
JPM |
JPEG 2000 File Format defined in this International Standard; JPEG 2000 File Format - Multilayer |
Định dạng tệp tin JPEG 2000 được quy định trong tiêu chuẩn này; Định dạng tệp tin JPEG 2000 - nhiều lớp. |
MRC |
Mixed Raster Content |
Quét nội dung kết hợp |
PPCLoc |
Primary Page Collection Locator |
Bộ định vị tập trang cơ sở |
UUID |
Universal Unique Identifier |
Bộ nhận diện duy nhất toàn cục |
Mục đích của điều này cung cấp thông tin tổng quan về tiêu chuẩn này. Các danh mục quy định trong các điều trước trong tiêu chuẩn này cũng sẽ được giới thiệu. (Các danh mục quy định tại Điều 3 và Điều 4 của ISO/IEC 15444-1 cũng được áp dụng trong tiêu chuẩn này). Thông qua tiêu chuẩn này, văn bản được định dạng như một CHÚ Ý chỉ trong các dạng thông tin sau đây:
Tiêu chuẩn này định nghĩa định dạng tệp tin để lưu trữ các ảnh phức hợp bằng cách sử dụng định dạng tệp tin JPEG 2000 cấu trúc quen thuộc. Tệp tin ảnh phức hợp chứa nhiều ảnh, có cả ảnh có sắc độ liên tục và ảnh mức nhị phân, cùng với những mô tả để kết hợp các hình mẫu, các ảnh riêng được kết hợp để tạo ra ảnh phức hợp. Tiêu chuẩn này được dựa trên mô hình Quét nội dung kết hợp nhiều lớp, quy định tại ITU-T T.44 | ISO/IEC 16485.
Tiêu chuẩn này quy định thành phần của định dạng tệp tin JPEG 2000 quen thuộc cho phép xử lý hiệu quả, trao đổi và lưu trữ các trang ảnh quét theo định hướng có kết hợp cả các ảnh hai mức và ảnh nhiều mức. Điều này thực sự có hiệu quả để thể hiện ảnh phối trộn nội dung sử dụng nhiều lớp, nhằm xác định loại ảnh, và bằng việc áp dụng mã hóa chi tiết ảnh, không gian ảnh và kỹ thuật xử lý phân giải màu. Một trang mành quét có thể chứa một hoặc nhiều loại ảnh, ví dụ như: ảnh nhiều mức sắc độ liên tục hoặc chứa hình thường gắn liền với các ảnh tự nhiên; ảnh hai mức là ảnh có chi tiết kết hợp với các ký tự và nền khung; ảnh màu đa mức liên quan đến văn bản và nền khung. Tiêu chuẩn này quy định về việc xử lý, trao đổi, lưu trữ các loại ảnh trong nhiều lớp và quy định thành phần các mô hình tái tạo ảnh mong muốn.
5.1 Mô hình quét nội dung kết hợp
Tệp tin phù hợp với tiêu chuẩn này có một hoặc nhiều trang. Các ảnh trang liên kết với một trang được tạo ra bằng cách kết hợp các đối tượng trình bày trang với trang cơ sở.
BasePage (trang gốc) là PageImage (ảnh trang) ban đầu trước khi bất kỳ đối tượng trình bày được kết xuất vào. Các trang cơ sở có cùng chiều rộng và chiều cao như trang, có thể là trong suốt hoặc được làm đầy với một màu duy nhất. Trang cơ sở được quy định tại Điều 5.2.2.1 ở bên dưới. Các đối tượng trình bày được áp dụng tuần tự, theo thứ tự được xác định bởi trường mã nhận diện đối tượng trình bày trong các khung tiêu đề đối tượng trình bày, tới BasePage (trang cơ sở) để tạo ra PageImage (ảnh trang) cuối cùng. Lớp các đối tượng trình bày với một giá trị mã nhận diện đối tượng trình bày có giá trị từ 0 là trang thu nhỏ và không được sử dụng trong việc tạo ra ảnh trang.
Kết hợp với mỗi đối tượng trình bày là mặt nạ M và ảnh I. Các mặt nạ M là ảnh mờ và chỉ có một thành phần; I có thể là mức xám hoặc có màu với một hoặc nhiều thành phần. M và I được quy định tại Điều 5.2.3. Cả M và I đều có cùng một chiều rộng và chiều cao như trang.
Các phương trình sau đây cho thấy các mô hình cho việc kết hợp các trang cơ sở và một chuỗi các lớp n các đối tượng với mã nhận diện đối tượng trình bày có giá trị khác không. Các giá trị tạo ra ảnh trang. Chúng ta sẽ sử dụng các ký hiệu N [c] [x,y] để tham chiếu các giá trị mẫu tại vị trí (x,y) trong thành phần c của một ảnh N.
Trong đó, Mm[c][x,y] và Im[c][x,y] là những giá trị mẫu ảnh của thành phần c tại vị trí có tọa độ (x,y) của mặt nạ M trong đối tượng trình bày mth và ảnh I tương ứng, và sm = 2bit depth of Mm-1. M, I và Basepage được quy định tại Điều 5.2.2.1 và 5.2.3. PageImage [c] [x,y] là ảnh trang cuối, thu được sau khi kết hợp tất cả n lớp đối tượng với trang.
CHÚ THÍCH: Hình 1 cho thấy ví dụ đơn giản về một ảnh trang xây dựng từ một trang cơ sở với một màu duy nhất và hai lớp đối tượng. Màu trắng trong mặt nạ M0 và M1 biểu thị bằng giá trị 0.
CHÚ THÍCH: Trong tệp tin JPM, mặt nạ và ảnh các đối tượng trong một đối tượng trình bày thường có các độ phân giải không gian khác nhau. Vì vậy, chúng phải được chia tỷ lệ với độ phân giải và xác định độ phân giải trang trước khi được kết hợp để tạo ra một ảnh theo phương trình 1-3. Trong tệp tin JPM, kích thước mặt nạ, ảnh và trang được quy định bởi bộ lưới tọa độ trang, nhưng độ phân giải của chúng có thể chưa được xác định. Việc chia tỷ lệ mặt nạ và ảnh được xác định bởi một hệ số tỷ lệ. Phương pháp chia tỷ lệ không được quy định trong tiêu chuẩn này, mặc dù dòng thông tin hướng dẫn chia tỷ tệ mặt nạ và ảnh có được cung cấp. Ảnh trang sau đó được chia tỷ lệ đến độ phân giải của thiết bị đầu ra phù hợp với việc thể hiện trên màn hình hoặc in ra thiết bị in. Như mô tả ở đây, có hai công đoạn chia tỷ lệ riêng biệt thứ nhất, mặt nạ và ảnh của lớp các đối tượng kế tiếp được thu nhỏ đến một độ phân giải thông thường và được kết hợp trên trang; thứ hai, ảnh trang kết quả được thu nhỏ với độ phân giải thiết bị. Trong thực tế, hai công đoạn chia tỷ lệ thường được kết hợp vào một, công đoạn chia tỷ lệ thiết bị phụ thuộc vào kỹ thuật thực hiện.
Hình 1 - Ví dụ kết hợp các tài liệu ảnh
5.2 Cấu trúc và phần tử tệp tin
Các tệp tin phù hợp với các định dạng được quy định trong tiêu chuẩn này gọi là các tệp tin JPM. Bản chất, tệp tin JPM gồm một chuỗi các trang, trong đó mỗi trang lần lượt là một chuỗi lớp các đối tượng. Một đối tượng trình bày thông thường bao gồm một đối tượng mặt nạ và một đối tượng ảnh. Mặt nạ và đối tượng ảnh được kết hợp lại để xây dựng ảnh cuối cùng theo phương trình 1-3. Các phần tử chủ đạo hoặc các khung của tệp tin JPM gồm: các tập trang, trang, đối tượng trình bày, và đối tượng. Một đối tượng trỏ vào dữ liệu ảnh của mình trực tiếp thông qua một khung dòng mã liên tục hoặc gián tiếp thông qua một khung bảng phân mảnh. Giống như tất cả thành phần của định dạng tệp tin JPEG 2000 thông thường, tệp tin JPM bắt đầu với một ký hiệu khung JPEG 2000 và một khung loại tệp tin. Một khung tiêu đề ảnh phức hợp, chứa thông tin chung về các tệp tin, sau đó tiếp theo là tập trang, trang, bảng phân mảnh, dòng mã liên tục, dữ liệu đa phương tiện và khung dữ liệu đặc tả. Các ràng buộc về vị trí của các khung trong tệp tin JPM được trình bày tại Phụ lục B.
Danh sách dưới đây cho thấy mối quan hệ thứ bậc giữa các phần tử chủ đạo trong tệp tin JPM. Một thứ tự chi tiết các khung không bao gồm trong danh sách này. Chi tiết tất cả các khung như trình bày trong Phụ lục B.
JPEG 2000 signature |
Ký số JPEG 2000 |
File type |
Loại tệp tin |
Compound image header |
Tiêu đề ảnh phức hợp |
Page collection |
Tập trang |
Page |
Trang |
Layout object |
Đối tượng trình bày |
Mask object |
Đối tượng mặt nạ |
Image object |
Đối tượng ảnh |
Fragment table |
Bảng phân mảnh |
Codestream fragment |
Mảnh dòng mã |
Contiguous codestream |
Dòng mã liên tục |
Tệp tin JPM bao gồm một chuỗi các trang, mỗi trang được biểu diễn bởi một khung trang xuất hiện ở đầu của tệp tin và mỗi khung trong đó được chuyển đổi một cách độc lập với trang khác. Các tập trang được sử dụng để nhóm các trang một cách hợp lý trong tệp tin JPM. Tập trang có thể được lồng vào nhau một cách hợp lý, nên bản thân một tập trang có thể bao gồm một hoặc nhiều tập trang và/hoặc một hoặc nhiều trang. Tập trang tham chiếu từ tập trang khác được gọi là tập trang phụ. Tất cả các trang trong tệp tin JPM phải được chỉ đến bởi tập trang có ít nhất một trang.
Một trang có thể chứa trong một tập trang, nhưng điều này không có nghĩa rằng khung trang nằm trong tập khung trang. Cả hai các khung trang và các khung tập trang xuất hiện ở đầu của tệp tin và không được chứa trong các khung khác.
Tệp tin JPM chứa một tập trang được gọi là tập trang chính được sử dụng để xác định vị trí tất cả các trang của tệp tin. Bất kỳ tập trang bổ sung trong tệp tin JPM được lồng nhau một cách hợp lý trong tập trang chính (xem Điều 5.2.1.3). Khung của tập trang chứa một khung nhãn tùy chọn, khung dữ liệu đặc tả tùy chọn (XML và/hoặc UUID), và một khung bảng trang chứa các vị trí của các trang và các tập trang thuộc tập trang.
Các tệp tin đã tối ưu hóa có tập trang chính nằm ở gần nơi bắt đầu của tệp tin. Trong khi khung trang và khung tập trang xuất hiện ở mức đỉnh của tệp tin, hoặc chúng có thể nằm trong các tệp tin bên ngoài. Trường hợp này có thể được xem như tương đương với ở đầu của tệp tin.
Mỗi trang trong tệp tin JPM có một tập trang cơ sở. Mục đích của một tập trang cơ sở để cho phép chuyển hướng trong các tài liệu ảnh cơ sở để trang liên quan sử dụng thứ tự trong tập trang cơ sở, để hỗ trợ cho các câu lệnh chuyển về trang trước và chuyển sang trang tiếp theo.
Mỗi khung tập trang chứa một khung bảng trang. Các mục khung bảng trang trỏ đến vị trí của các khung trang và tập trang trong tập trang. Sử dụng mỗi cờ báo cho mỗi mục xác định vị trí là một khung trang hoặc khung tập trang, cũng như cho biết liệu các khung chứa một ảnh thu nhỏ hoặc dữ liệu đặc tả hay không.
Bằng cách dò theo cây thư mục của trang và tập trang và lồng vào nhau các tập trang một cách hợp lý trong tập trang cơ sở của trang, có thể biết tất cả các trang trong tài liệu ảnh cơ sở của trang. Các trang (trừ trường hợp tệp tin JPM khép kín chỉ chứa một trang duy nhất) đều có một bộ định vị tập trang cơ sở hay khung PPCLoc. Khung này trỏ đến các tập trang cơ sở của trang và cung cấp một chỉ số, PIx, vào trong bảng tập trang nơi trang được tham chiếu tới.
Sau đó, trang liền trước và trang liền sau được tìm thấy bằng cách dò theo một trang về phía trước hoặc ngược lại từ trang hiện tại
CHÚ THÍCH - Các tập nhiều trang có thể tồn tại trong tệp tin JPM. Một số tập trang có thể có các chức năng điều hướng khác hiệu quả hơn so kiểu điều hướng cơ bản. Một bảng các dạng hình điều hướng có thể trỏ đến các trang chứa các dạng điều hướng. Một phần hoặc một đoạn (chapter) của bảng chỉ có thể trỏ đến những trang đầu tiên của các phần hoặc các đoạn. Bất kỳ tập trang của sắp xếp (sort) này phải phụ trợ cho tập trang, vì vậy chúng cung cấp con trỏ dự phòng tới trang, tập trang và dự phòng để cho mục đích trỏ khác (xem điều 5.2.1.3).
CHÚ THÍCH: - Hình 2 minh họa một nhóm logic các tập trang PC và các trang P trong tệp tin JPM. PCa là tập trang chính và các tập trang cơ sở cho các trang P0, P8 và P9 và tập trang PCb, PCc và PCe. Trong tệp tin JPM, khung bảng trang của khung tập trang cho PCa tham chiếu các khung trang cho các trang P0, P8 và P9, và các khung tập trang cho PCb, PCc và PCe. Các khung bộ định vị tập trang chính trong các khung trang và tập trang sẽ tham chiếu khung tập trang cho PCa.
PCb là một tập trang phụ của Pca và tập trang cơ sở cho trang P1, P6 và P7 và cho PCd tập trang. PCd là tập chính trang cho các trang P2, P3, P4 và P5. PCc là tập trang cơ sở cho trang P10 và P11.
PCe là một tập trang phụ trợ, có tham chiếu tập trang PCc và trang P5.
Hình 2 - Ví dụ về các tập trang và các trang
5.2.1.1 Tập trang chính
Mỗi tệp tin JPM có một tập trang chính. Mục đích của tập trang chính của tệp tin là liệt kê tất cả các trang (và các tập trang phụ) trong tệp tin JPM. Điều này cho phép tìm kiếm ngẫu nhiên đến bất kỳ trang nào trong tệp tin.
Các khung trang cho các trang này xuất hiện ở đầu của định dạng tệp tin, cũng như các khung dữ liệu truyền thông chứa các đoạn của các dòng mã. Từ đó các khung dữ liệu truyền thông này có thể có kích thước lớn và thúng có thể đan xen với các khung trang, và các khung trang có thể mở rộng một cách riêng rẽ trong tệp tin. Trong tệp tin JPM chứa một bản sao máy khách của một số trang đã tìm thấy của tệp tin JPM trong máy chủ, mỗi một trang được hiển thị lần lượt và một số phần của các phân mảnh dòng mã của nó có thể sẽ được nối lần lượt đến cuối của tệp tin. Một cập nhật tới tập trang chính cho phép mỗi trang trong các trang mới này được xác định vị trí.
Tập trang chính tham chiếu toàn bộ các trang và các tập trang bằng một cấu trúc sắp xếp. Một số trang có thể được tham chiếu từ một tập trang dưới tập trang chính, nhưng tất cả các trang và các tập trang là một phần của cấu trúc cây của tập trang chính.
Tệp tin JPM đã tối ưu hóa cho các trình duyệt phải có tập trang chính gần phía trước của tệp tin. Mặt khác, một bản sao máy khách được tạo trong một phiên trình duyệt phải gần giống với tập trang chính nối thêm vào cuối tệp tin mỗi khi nó được sửa đổi. Khung tập trang của tập trang chính cũ có thể bị bỏ lại vào chỗ mà loại khung của nó bị thay đổi từ “pcol” sang “free”. Nếu tại bước tập hợp dữ liệu hỏng gần nhất thì phải xóa bỏ các khung tự do. Bởi vì, trong các trường hợp giống như thế, định dạng tệp tin có trỏ đến tập trang chính bao gồm trong khung tiêu đề ảnh phức hợp gần đầu của tệp tin. Điều này giúp xác định vị trí của khung tập trang chính.
5.2.1.2 Tập trang cơ sở
Mỗi trang hoặc tập trang có một tập trang cơ sở. Bằng cách phân biệt, mỗi tệp tin JPM có một tập trang chính. Một tập trang cơ sở là một đặc tính của trang hoặc tập trang, không phải là đặc tính của tệp tin JPM.
Tập trang cơ sở của một trang là tập trang ở đó một ứng dụng đọc tệp tin JPM có thể tìm thấy “trang tiếp theo” và “trang trước đó” cho một trang hiện hành.
Một bộ định vị trí tập trang cơ sở hoặc khung PPCLoc phải xuất hiện trong tất cả các khung trang và tất cả các khung tập trang, với một chi tiết ngoại lệ trong mảnh tiếp theo. Khung PPCLoc cung cấp một bộ con trỏ đến tập trang cơ sở của trang hay của tập trang. Con trỏ quay ngược này sẽ giúp dò toàn bộ cây thư mục để tìm tất cả các trang và các tập trang trong tệp tin. Khung PPCLoc chỉ là tùy chọn trong trường hợp của một trang đơn, tệp tin JPM tự chứa (ví dụ, tệp tin không có tham chiếu bên ngoài). Trong trường hợp này, trang không có tập trang cơ sở, nhưng hiện tại tập trang chính của file có các chức năng như là tập trang cơ sở của trang. Tập trang cơ sở của một trang hoặc tập trang có thể không ở trong tệp tin JPM, trong đó khung trang hoặc khung tập trang được định vị trí. Ví dụ, các tệp tin nội bộ có thể có ba trang đơn, mỗi trong số đó đã được sao chép từ một trong ba tệp tin từ xa khác nhau. Dõi theo các con trỏ tập trang cơ sở cho các trang này trỏ tới các tệp tin từ xa nguyên gốc sẽ cho phép người dùng dõi theo việc tìm duyệt các nguồn tài liệu nguyên gốc thông qua các câu lệnh sang trang tiếp theo và trở tại trang trước. Tập trang chính của tệp tin có thể là một bản sao của một tập trang phụ trên một máy chủ từ xa, ví dụ, trong trường hợp này nó có thể có tập trang mẹ trên máy chủ từ xa như tập trang cơ sở của nó. Khi tập trang chính không có tập trang cơ sở, thì khung tập trang chính sẽ không chứa khung PPCLoc.
5.2.1.3 Tập trang phụ trợ
Các tập trang phụ trợ là các tập trang mà cung cấp các con trỏ dự phòng trỏ tới trang đã được trỏ sẵn tới trong cấu trúc cây logic của tập trang chính. Ví dụ về các tập trang phụ trợ có thể gồm một danh sách các hình hoặc một danh sách các bảng. Các tập trang phụ trợ vẫn xuất hiện trong cấu trúc cây logic của tập trang chính để chúng có thể được định vị trí, nhờ sử dụng một cờ trạng thái để đánh dấu chúng là tập trang phụ trợ. Bằng cách này, một ứng dụng giải mã biết chúng không được sử dụng để thực hiện dò cây tìm kiếm thông qua tất cả các trang được tham chiếu trong tập trang chính.
Các tập trang phụ xuất hiện trong tập trang chính để trợ giúp một ứng dụng trong việc định vị chúng trong các tệp tin, nhưng chúng không phải là một phần của cây logic được mà được dò để định vị toàn diện tất cả các trang. Thay vì chúng cung cấp một dự phòng của trang đã lựa chọn tìm tới và do đó phải được bỏ qua khi cố gắng xác định thứ tự trang ban đầu của tệp tin. Các tập trang phụ có thể xuất hiện bên dưới trong cấu trúc của tập trang chính; chúng không cần xuất hiện ở đầu cấu trúc.
Các tập trang phụ trợ phải được dán nhãn bằng các trường của nhãn theo một thứ tự để giúp cho ứng dụng thu nhận dễ nhận biết. Nếu chúng đã được dán nhãn, ứng dụng giải mã phải thể hiện nhãn để thiết bị cuối và thiết bị yêu cầu biết như là các chọn lựa như “sang trang trong danh mục hình vẽ” và “trở lại trang trước trong danh mục hình vẽ”.
Ví dụ, nếu trang 17 xuất hiện trong “Danh sách các hình dạng” tập trang, ứng dụng giải mã sẽ trở lại với tập trang để có được những trang tiếp theo hoặc trước đó chứa một hình dạng, nhưng sẽ trở lại với tập trang cơ sở cho trang 17 (bởi tính chất của khung PPCLoc trong khung trang 17 trang) để tìm các trang kế tiếp hoặc trang trước đó.
Một trang trong tệp tin JPM được thể hiện bởi một khung trang, tổ hợp khung bao gồm một khung tiêu đề trang, chứa thông tin chung về các trang, một khung bộ định vị tập trang, chứa vị trí của tập trang cơ sở của trang, một màu gốc tùy chọn khung, trong đó mô tả màu trang gốc, khung dữ liệu đặc tả tùy chọn, và khung đối tượng trình bày, một cho mỗi đối tượng trình bày trên trang. Chi tiết đầy đủ của các khung có thể được tìm thấy tại Điều B.2.
Trang xuất hiện ở mức đỉnh của các định dạng tệp tin. Điều này có nghĩa cập nhật được tăng lên đến tệp tin có thể được thực hiện bằng cách gắn thêm các trang mới vào cuối của tệp tin. Khung trang và khung chứa các dòng mã hoặc các phần của các dòng mã có thể được trộn lẫn trong tệp tin.
Với mở rộng của các hình thu nhỏ tài liệu, mỗi ảnh trong tệp tin JPM là hợp lý kết hợp với ít nhất một trang.
5.2.2.1 Trang gốc (Base page)
BasePage (Trang gốc) là PageImage (ảnh trang) ban đầu trước khi bất kỳ đối tượng trình bày phải được chuyển đổi (rendered). Để chiều rộng của trang và chiều cao của trang tương ứng, độ rộng và độ cao đồng bộ phải được thể tiện trong khung tiêu đề trang.
Để spc là các điểm màu mà trong đó các ảnh I sẽ được kết hợp với nhau để tạo ra PageImage (ảnh trang). Trang gốc (BasePage) là một ảnh với các kích thước chiều cao và chiều rộng và cùng không gian điểm màu spc.
Nếu trường PColour của khung tiêu đề trang bằng 0 thì trang gốc (BasePage) là trong suốt và chứa các giá trị mẫu của ảnh cơ bản, đã được chuyển đổi sang không gian màu spc.
Nếu trường PColour của khung tiêu đề trang bằng 1 thì các mẫu trang gốc (BasePage) sẽ thể hiện màu trắng trong không gian màu spc.
Nếu trường PColour của khung tiêu đề trang bằng 2 thì các mẫu trang gốc (BasePage) sẽ thể hiện màu đen trong không gian màu spc.
Nếu trường PColour của khung tiêu đề trang bằng 255 thì có một khung màu gốc trong khung trang và tất cả các mẫu trang gốc (BasePage) chứa không gian màu spc được chỉ định bởi các khung màu cơ bản.
Bên trong một khung trang, có nhiều khung đối tượng trình bày như các đối tượng trình bày trên trang. Một khung đối tượng trình bày là tổ hợp khung bao gồm một khung tiêu đề đối tượng trình bày, chứa thông tin chung về đối tượng trình bày, khung tùy chọn chứa dữ liệu đặc tả liên quan đến các đối tượng trình bày, và một hoặc hai đối tượng trình bày - hoặc là một ảnh khung đối tượng và/hoặc khung đối tượng mặt nạ, hoặc một khung đối tượng ảnh/mặt nạ kết hợp.
Mỗi khung đối tượng chứa một khung tiêu đề đối tượng xác định đối tượng thể hiện cho một ảnh, một mặt nạ hoặc một ảnh/mặt nạ kết hợp, xác định vị trí của các dòng mã có liên kết với các đối tượng và chứa thông tin vị trí của đối tượng.
Một đối tượng ảnh điển hình thường có một dòng mã được liên kết với nó, nhưng cũng có thể không liên kết, trong trường hợp trường không liên kết sẽ có dòng mã trong tiêu đề đối tượng ảnh được đặt bằng 1. Một đối tượng ảnh cũng có thể có một liên kết màu không đổi hoặc ảnh màu gốc. Nếu một đối tượng ảnh không có dòng mã Iiên kết, thì nó sẽ có ảnh màu gốc xác định. Một đối tượng mặt nạ hoặc đối tượng ảnh/mặt nạ, nếu có, phải có một dòng mã liên kết với nó và có giá trị trường NoCodestream = 0.
Nếu mội đối tượng có dòng mã liên kết thì khung tiêu đề đối tượng được quy định bởi một khung chia tỷ lệ đối tượng tùy chọn và một khung tiêu đề JP2 chứa khung mô tả dữ liệu đối tượng: trường tiêu đề ảnh, đặc tính màu, tùy chọn tỷ lệ bít trên mỗi phần tử, bảng màu (palette), ánh xạ các phần tử và kênh xác định các khung.
Liên kết với mỗi đối tượng trình bày là một phần tử mặt nạ M mờ đơn lẻ và một ảnh I, với cùng chiều rộng và chiều cao của trong trang chứa nó.
Các ảnh I của các đối tượng trình bày được kết hợp để tạo ra một PageImage (ảnh trang) đều phải sử dụng cùng không gian màu và độ sâu bít (bit-depth). Không gian màu được sử dụng cho các ảnh I của các đối tượng trình bày có thể được quyết định bởi bộ thực thi và không được quy định trong tiêu chuẩn này.
Các phương pháp chung để tạo ra các mặt nạ M và ảnh I được liên kết với một đối tượng trình bày được mô tả trong Điều 5.2.3.2 và 5.2.3.4.
Điều 5.2.3.1 mô tả các trường hợp đặc biệt tao ra một mặt nạ M và một ảnh I từ một dòng mã JBIG 2 với ITU-T 45 về mã hóa các thẻ màu.
5.2.3.1 Đối tượng trình bày gắn thẻ màu JBIG 2
Nếu khung đối tượng trình bày chứa một khung đối tượng ảnh với kiểu nén theo ITU-T T.45 Run Length (Mã chạy), thì việc mã phải chứa một khung đối tượng mặt nạ với kiểu nén theo ITU-T T.88 (JBIG 2), và cả hai đều phải có trường NoCodestream trong các khung tiêu đề đối tượng có giá trị đặt bằng 0. Ngoài ra, các trường sau đây phải có giá trị giống nhau với các đối tượng ảnh và mặt nạ:
- Các trường OVoff và OHoff trong các khung tiêu đề đối tượng;
- Các trường VRN, VRD, HRN, VRD trong các khung chia tỷ lệ;
- Các trường HEIGHT và WIDTH trong khung tiêu đề ảnh trong các khung tiêu đề JP2.
Tại Điều 5.2.3.3.1, m_orig là ảnh thu được bằng cách giải nén dòng mã JBIG 2 được kết hợp với khung đối tượng mặt nạ.
Tại Điều 5.2.3.4.1, i_orig là ảnh thu được bằng cách áp dụng các thẻ màu được kết hợp với khung đối tượng ảnh các các lần xuất hiện ký hiệu trong dòng mã mặt nạ JBIG 2 như mô tả trong ITU-T T.45.
5.2.3.2 Mặt nạ M của đối tượng trình bày
Nếu khung đối tượng trình bày không chứa khung đối tượng mặt nạ hay khung đối tượng ảnh/mặt nạ kết hợp, thì mặt nạ M của đối tượng trình bày được xác định bằng một độ sâu bít bằng 1 và phải có giá trị bằng 1 ở tất cả các vị trí mẫu, chẳng hạn là M [0] [x,y] = 1.
Điều 5.2.3.3.1 - 5.2.3.3.5 quy định M khi một dòng mã được liên kết với một khung mặt nạ hoặc một khung đối tượng ảnh/mặt nạ kết hợp trong các khung đối tượng trình bày.
1. Giai đoạn đầu trong việc tạo ra mặt nạ M, mô tả trong Điều 5.2.3.3.1, để giải mã các mặt nạ đối tượng, việc chuyển đổi sang độ sâu bít 8 bít nếu mặt nạ có một độ sâu bít thấp hơn, và đảm bảo rằng các mẫu sử dụng thể hiện là “min in white”.
2. Giai đoạn thứ hai, mô tả trong Điều 5.2.3.3.2, mở rộng mặt nạ.
3. Giai đoạn thứ ba, mô tả trong Điều 5.2.3.3.3, chia mặt nạ từ trên xuống, từ trái sang.
4. Giai đoạn thứ tư, mô tả trong Điều 5.2.3.3.4, vị trí của mặt nạ trên trang.
5. Giai đoạn thứ năm và giai đoạn cuối cùng, mô tả trong Điều 5.2.3.3.5, là chia mặt nạ vào cửa sổ trình bày.
Các giai đoạn được mô tả một cách riêng biệt để phân biệt rõ ràng và để có bộ giải mã JPM hiệu quả có thể kết hợp một hoặc nhiều các giai đoạn trên.
Hình 3 minh họa năm giai đoạn của ví dụ tạo mặt nạ. Màu trắng trong ảnh biểu thị một giá trị 0.
Hình 3 - Ví dụ tạo ra mặt nạ M
5.2.3.2.1 Giải mã mặt nạ
Nếu một khung đối tượng mặt nạ được sử dụng cho thông số m_orig là ảnh thu được bằng cách giải nén dòng mã liên quan, mặt khác để m_orig là ảnh chỉ chứa các phần tử mờ của ảnh thu được bằng cách giải nén dòng mã liên quan. Đặt thông số m_orig_width và thông số m_orig_height là chiều rộng và chiều cao của mặt nạ gốc m_orig và đặt b bằng độ sâu bít của mặt nạ m_orig.
Nếu b bằng 1, trừ khi chỉ định khác bởi dòng mã, thì các mẫu có giá trị 0 được giải định thể hiện màu trắng trong khi các mẫu có giá trị 1 được giả định thể hiện màu đen.
Nếu b lớn hơn 1, trừ khi chỉ định bởi dòng mã, mẫu giá trị 0 được giải định thể hiện màu đen trong khi các mẫu giá trị 2b - 1 được giả định thể hiện màu trắng.
Để màu xám là một ảnh với độ sâu bít g = max (8, b) và cùng một chiều rộng và chiều cao như m_orig. Màu xám, được xác định như sau:
5.2.3.2.2 Chia tỷ lệ mặt nạ
Nếu một khung tỷ lệ đối tượng được chứa trong các khung đối tượng mặt nạ hoặc khung đối tượng ảnh/mặt nạ kết hợp sau đó để cho m_VRN, m_VRD, m_HRN và m_HRD là các khu vực tỷ lệ chứa trong khung này, mặt khác để m_VRN, m_VRD, m_HRN và m_HRD tất cả bằng 1. Cho m_scaled là kết quả của chia tỷ lệ màu xám theo chiều dọc bởi tỷ lệ và theo chiều ngang bằng tỷ lệ , tạo ra một ảnh với độ sâu bít g và có kích thước:
CHÚ THÍCH: - Phương pháp để chia tỷ lệ một mặt mặt nạ nhị phân hoặc mặt nạ xám lên hoặc xuống được thực hiện chi tiết. Ví dụ, việc chia tỷ lệ có thể sử dụng kỹ thuật kế cận gần nhất (nearest neighbour) hoặc kỹ thuật nội suy song tuyến tính.
5.2.3.2.3 Cắt mặt nạ
Để thông số m_OVoff và m_OHoff là độ lệch đường viền dọc và ngang trong khung đối tượng mặt nạ hoặc khung đối tượng ảnh/mặt nạ kết hợp.
Để thông số m_clipped là một ảnh với độ sâu bít g, độ rộng m_width = max (0, m_scaled_width - m_OHoff) và m_height = max (0, m_scaled_height - m_OVoff). Thông số m_clipped được xác định như sau:
m_clipped[0][x,y] = m_scaled[01][x + m_OHoff, y + m_OVoff] (6)
5.2.3.2.4 Vị trí của mặt nạ
Đặt page_width và page_height là chiều rộng của trang chứa đối tượng trình bày, như được báo hiệu trong khung tiêu đề trang. Đặt LVoff và LHoff là độ lệch chiều dọc và ngang trong các khung tiêu đề đối tượng trình bày.
Đặt m_pos là ảnh có chiều rộng page_width và chiều cao page_height, quy định như sau:
5.2.3.2.5 Cửa sổ cắt mặt nạ
Đặt M là ảnh có chiều rộng page_width và chiều cao page_height. Đặt LWidth và LHeight là chiều rộng và chiều của đối tượng trình bày được quy định trong khung tiêu đề đối tượng trình bày. M được xác định như sau:
5.2.3.3 Ảnh I của một đối tượng trình bày
Cho spc là không gian màu trong đó các ảnh I được kết hợp để tạo ra một PageImage (ảnh trang).
Nếu khung đối tượng trình bày chứa một ảnh hoặc một khung đối tượng ảnh hoặc một khung đối tượng ảnh/mặt nạ kết hợp và cũng chứa khung màu gốc, thì đặt cơ sở thể hiện trong không gian màu spc của màu được chỉ thị bởi khung màu gốc; nếu không đặt cơ sở thể hiện trong không gian màu spc là màu đen.
Nếu khung đối tượng trình bày không chứa khung đối tượng ảnh hoặc một khung đối tượng ảnh/mặt nạ kết hợp, thì ảnh I của các đối tượng trình bày được xác định là một ảnh trong không gian màu spc nơi tất cả các mẫu có màu gốc.
Nếu đối tượng trình bày không chứa một khung đối tượng ảnh hoặc một khung ảnh/mặt nạ đối tượng kết hợp, nhưng không có dòng mã đã liên kết, thì ảnh I của các đối tượng trình bày cũng phải được xác định là một ảnh trong không gian màu spc nơi tất cả các mẫu có màu gốc.
Điều 5.2.3.4.1 - 5.2.3.4.5 quy định I khi một dòng mã được liên kết với một khung đối tượng ảnh hoặc một khung ảnh/mặt nạ đối tượng kết hợp trong khung đối tượng trình bày.
1. Giai đoạn đầu trong việc tạo ra I, mô tả trong điều 5.2.3.4.1, là để giải mã các đối tượng ảnh và chuyển đổi ảnh với không gian màu spc.
2. Giai đoạn thứ hai, mô tả trong điều 5.2.3.4.2, là để chia tỷ lệ ảnh.
3. Giai đoạn thứ ba, mô tả trong điều 5.2.3.4.3, là để chia ảnh từ trên xuống, từ trái sang.
4. Giai đoạn thứ tư, mô tả trong điều 5.2.3.4.4, là để định vị ảnh trên trang.
5. Giai đoạn thứ năm và là giai đoạn cuối cùng, mô tả trong điều 5.2.3.4.5, là để chia ảnh tới lớp cửa sổ.
Các giai đoạn, với những người sử dụng để tạo mặt nạ M, được mô tả riêng cho rõ ràng và một bộ giải mã JPM hiệu quả có thể kết hợp một hoặc nhiều hơn các giai đoạn.
5.2.3.3.1 Giải mã ảnh
Nếu một khung đối tượng ảnh được sử dụng thì đặt i_orig là ảnh thu được bằng cách giải nén dòng mã liên quan, mặt khác để i_orig là ảnh chứa tất cả thành phần cuối của ảnh thu được bằng cách giải nén dùng mã đa liên kết. Đặt chiều rộng i_orig_width và chiều cao i_orig_height là chiều rộng và chiều cao của i_orig.
Để conv là ảnh thu được bằng cách chuyển đổi orig cho spc không gian màu.
5.2.3.3.2 Chia tỷ lệ ảnh
Nếu khung tỷ lệ đối tượng được chứa trong khung ảnh đối tượng hoặc khung ảnh/mặt nạ đối tượng kết hợp thì đặt i_VRN, i_VRD, i_HRN và i_HRD là các hệ số chia tỷ lệ được chứa trong khung này, mặt khác đặt i_VRN, i_VRD, i_HRN và i_HRD tất cả bằng 1. Đặt i_scaled là kết quả của việc chia tỷ lệ theo chiều dọc conv bởi tỷ lệ và theo chiều ngang bằng tỷ lệ , tạo ra một ảnh với các kích thước:
CHÚ THÍCH - Một ảnh có thể được chia tỷ lệ bằng cách sử dụng nội suy song tuyến hoặc, nếu đó là một ảnh riêng, sử dụng nội suy kế cận gần nhất. Một ảnh có thể được chia tỷ lệ lại bằng cách sử dụng kỹ thuật trung bình của mẫu phụ tiếp theo, hoặc nếu đó là một ảnh riêng, sử dụng lấy mẫu phụ. Nếu ảnh được nén bằng JPEG 2000, thì hành động cũng có thể chọn để sử dụng các tính năng giải nén để có được một ảnh độ phân giải suy giảm gấp 2 lần cho việc chia tỷ lệ ảnh.
5.2.3.3.3 Cắt mặt nạ
Đặt m_OVoff và m_OHoff là các đường viền dọc và ngang trong khung đối tượng mặt nạ hoặc góp kết hợp ảnh/mặt nạ đối tượng.
Đặt m_clipped là một ảnh với độ sâu bít g, chiều rộng m_width = max (0, m_scaled_width - m_OHoff) và m_height = max (0, m_scaled_height - m_OVoff). m clipped được xác định như sau:
m_clipped[0][x,y] = m_scaled[0][x + m_OHoff, y + m_OVoff] (10)
5.2.3.3.4 Định vị mặt nạ
Cho chiều rộng trang (page_width) và chiều cao trang (page_height) là chiều rộng của trang chứa đối tượng trình bày, như là bảo hiệu trong khung tiêu đề trang. Đặt LVoff và LHoff được bố trí lệch dọc và ngang trong các khung tiêu đề, đối tượng trang.
Đặt m_pos là một ảnh có chiều rộng và chiều cao của PAGE_WIDTH, xác định như sau:
5.2.3.3.5 Cửa sổ cắt ảnh
Đặt I là một ảnh có chiều rộng (page_width) là chiều rộng trang và chiều cao (page_height) là chiều cao trang. Cho LWidth và LHeight là chiều rộng đối tượng và lớp chiều cao đối tượng như ghi nhận tại khung tiêu đề đối tượng trình bày. I được xác định như sau:
Các ảnh thu nhỏ là một tính năng tùy chọn cho phép một tổng quan của một tài liệu hay một trang được đưa tới cho người sử dụng. Có hai loại hình thu nhỏ: hình thu nhỏ tài liệu và hình thu nhỏ trang.
Một ảnh thu nhỏ tài liệu cung cấp một cái nhìn tổng quan đai diện của toàn bộ tài liệu, giống như trang bìa hoặc gáy của một cuốn sách. Nó có thể đơn giản là một sự lặp lại của ảnh thu nhỏ của trang với trang tiêu đề. Hình thu nhỏ tài liệu có thể là JP2 tương thích hoặc không tương thích.
Tệp tin JPM với một ảnh thu nhỏ tài liệu được tạo ra bằng cách bổ sung một khung tiêu đề JP2 cho ảnh thu nhỏ ngay lập tức sau các loại khung tệp tin. Các dòng mã cho ảnh thu nhỏ phải được chứa trong khung dòng mã liên tục theo khung tiêu đề JP2.
CHÚ THÍCH - Một ảnh thu nhỏ tài liệu JP2 tương thích có thể được sử dụng trong việc xây dựng tệp tin JPM cũng phù hợp với các định dang tệp tin JP2 quy định trong ISO/IEC 15444-1. Một ảnh thu nhỏ tài liệu tương thích JP2 phải sử dụng JPEG 2000 là bộ mã hóa và xuất hiện ở đầu đọc JP2 để tệp tin JP2 hợp lệ. Cờ tương thích JP2 được đặt trong các loại khung tệp tin bằng cách bổ sung chuỗi “jp2\040” vào chuỗi tương thích. Một bộ dọc JP2 thì sẽ tìm một khung tiêu đề JP2 và nhảy qua bất kỳ một khung thì cho đến khi nó tìm thấy một khung dòng mã liên tục nhau. Sau đó nó sẽ truy cập vào ảnh thể hiện bởi các dữ liệu vào ô đó. Khi một ảnh thu nhỏ tài liệu là hiện hành, các tệp tin chứa một khung tiêu đề JP2, và một khung dòng mã gần đầu của tệp tin, một nơi nào đó sau khung tiêu đề ảnh được kết hợp và trước khung trang đầu, thường là trước khung tập trang.
Một trang ảnh thu nhỏ chỉ đơn giản là các đối tượng trình bày trong một trang với mã nhận diện đối tượng trình bày 0. Một đối tượng trình bày của trang ảnh thu nhỏ phải là đối tượng trình bày đầu trong một trang. Sự hiện diện của nó được đánh dấu bằng một cờ trong bảng trang mà chỉ ra rằng một trang chỉ đến từ bảng trang chứa một ảnh thu nhỏ trang. Hình thu nhỏ trang là tùy chọn.
CHÚ THÍCH - hình thu nhỏ trang cho phép một tổng quan về mỗi trang riêng sẽ được hiển thị. Điều này có thể được sử dụng trong khi điều hướng, ví dụ để làm một biểu tượng nhỏ gần mỗi node của một bảng hình thư mục cây giống bàng mục lục. Nó cũng có thể được sử dụng để cho phép hiển thị một ảnh ban đầu hữu ích hơn lên một trang mới đơn giản hơn màu nền của trang trong khi chờ đợi cho nội dung bổ sung đến.
5.2.5 Dòng mã liên tục và dòng mã đã phân mảnh
Dữ liệu dòng mã của các đối tượng của một trang có thể là dòng mã đơn lẻ liên tục, hoặc có thể bao gồm một hoặc nhiều mảnh dòng mã. Một dòng mã bao gồm các phân mảnh được truy cập thông qua một khung bảng phân mảnh. Một khung danh sách phân mảnh liệt kê các vị trí trong tệp tin, hoặc các con trỏ ra ngoài tới tệp tin khác, tới những mảnh dòng mã. Mỗi mảnh dòng mã được chứa trong một khung dữ liệu truyền thông. Nếu dòng mã không bị phân mảnh thì đối tượng phải chứa vị trí của một khung dòng mã liên tục chứa dữ liệu dòng mã. Chi tiết đầy đủ các khung có thể được tìm thấy trong Phụ lục B.5.
Cơ chế bảng phân mảnh cho phép bất kỳ dòng mã bị bẻ thành danh sách có thứ tự của các phân mảnh, theo cách riêng của nó và tham chiếu dữ liệu. Một chỉ số tham chiếu dữ liệu vào bảng tham chiếu dữ liệu và tạo ra một chuỗi danh sách các tên tệp tin hoặc URI của tệp tin bên ngoài, nơi các phân mảnh được tìm thấy. Nếu tham chiếu dữ liệu bằng 0, mảnh được định vị trong tệp tin hiện thời. Cơ chế này cho phép các phân mảnh được đặt ở một vị tri tối ưu để hỗ trợ trực tuyến của dữ liệu đến một ứng dụng khách từ một máy chủ, hoặc cho phép sàng lọc nhiều dòng mã đồng thời.
Các phân mảnh có thể bắt đầu hoặc dừng lại ở bất kỳ byte ranh giới của dòng mã. Độ dài của mỗi mảnh được xác định bởi các thông số chiều dài lấy từ bảng của mảnh. Nếu một mảnh không kết thúc tại một điểm trong dòng mã nơi một khối mã đầy đủ hoặc đường mành đầy đủ có thể được giải mã, ứng dụng giải mã chứa thông tin bổ sung này cho đến khi mảnh tiếp theo đã được lấy ra. Mảnh tiếp theo của dòng byte sau đó được nối vào dữ liệu còn sót lại từ mảnh trước và sau đó giải mã được nối lại. Các dòng mã có kiểu nén bất kỳ có thể được giải mã theo cách này.
Các danh mục bảng phân mảnh luôn luôn trỏ đến dòng mã. Tất cả các thông tin tiêu được yêu cầu để giải mã dòng mã, như chiều rộng và chiều cao, kiểu nén hoặc bít độ sâu được lưu trữ trong các trường trong khung đối tượng.
Tệp tin có thể chứa nhiều khung hoặc các phân mảnh chứa dữ liệu nhận dạng. Kích thước tệp tin có thể được giảm bằng cách chia sẻ các khung, bao gồm bởi tham chiếu tới một khung hoặc mảnh xuất hiện trong một phần của tệp tin JPM trong một phần khác nhau của cùng tệp tin hoặc tệp tin JPM khác nhau. Hai cơ chế để chia sẻ các khung trong tệp tin JPM là một khung tham chiếu dữ liệu chia sẻ và một khung tham chiếu chéo. Bất kể chỗ nào tham chiếu dữ liệu chia sẻ hoặc một khung tham chiếu chéo xuất hiện trong tệp tin, dữ liệu mà nó tham chiếu được coi là nếu nó tồn tại tại các điểm trong tệp tin nơi các tham chiếu dữ liệu được định vị. Tham chiếu có thể là bởi chính hoặc là một bộ nhận diện, trong trường hợp một khung tham chiếu dữ liệu chia sẻ (Điều B.1.8), hoặc là một tham chiếu dữ liệu bao gồm một độ lệch và chiều dài, trong trường hợp của một khung tham chiếu chéo (Điều B.6.4).
Một khung tham chiếu dữ liệu chia sẻ trong tệp tin sử dụng một bộ nhận diện được xác định trong cùng tệp tin; Do đó, cơ chế này chỉ được sử dụng để dữ liệu chia sẻ trong tệp tin. Khung tham chiếu chéo sử dụng một tham chiếu dữ liệu và do đó có thể được sử dụng để dữ liệu chia sẻ trên các tệp tin. Trong trường hợp của một tham chiếu đến một độ lệch từ đầu của tệp tin và độ dài, độ lệch được áp dụng. Một hành động thay thế dữ liệu được chia sẻ sẽ không được hiểu bởi một bộ chỉ đọc JP2, để tệp tin JPM- tương thích JP2 phải bao gồm trực tiếp khung bất kỳ có sự hiện diện trong các tệp tin cần thiết cho JP2 tương thích.
Tiêu chuẩn này cho phép dữ liệu đặc tả được gắn vào bất kỳ phần tử cấu trúc của tệp tin JPM, bao gồm cả các tệp tin hoặc tài liệu riêng của nó, các tập trang, các trang, các đối tượng trình bày và các đối tượng. Điều này được chỉ định trong các khung quy định trong Phụ lục B bao gồm của một khung “Metadata” trong trường dữ liệu của khung chứa. Bất cứ khi nào có một tham chiếu đến một dữ liệu đặc tả trong một khung xác định, nó được hiểu rằng khung có thể chứa một khung XML hoặc một khung UUID với dữ liệu đặc tả. Những khung “dữ liệu đặc tả” được quy định tại Phụ lục C.
Dữ liệu đặc tả văn bản ẩn dùng cho việc thể hiện văn bản, các phần tử văn bản và dòng văn bản được kết hợp vào ảnh. Trong tiêu chuẩn này, văn bản ẩn liên quan đến khu vực cụ thể của một trang trong tài liệu JPM.
Các mục đích sử dụng nói chung cho việc sử dụng văn bản ẩn bao gồm tìm kiếm, đánh dấu, cắt dán, và xử lý văn bản thành giọng nói. Văn bản ẩn để mô tả các dòng văn bản cũng như thể hiện các phần tử văn bản trên một trang.
Tệp tin JPM cho phép thể hiện hình ảnh một cách phong phú, thể hiện nhiều loại nội dung của một tài liệu. Trong mỗi vùng của một trang có thể được mã hóa với một kỹ thuật nén phù hợp nhất với đặc điểm của nó. Trong các vùng chứa văn bản, để tái tạo độ trung thực cao của nguồn ảnh được giữ lại bằng cách không thay thế các vùng văn bản với một kỹ thuật kết xuất ảnh bằng OCR, nhưng thay vì bằng cách sử dụng phương pháp mã hóa tiên tiến như JBIG2.
5.4.1 Tệp tin tự chứa và các tệp tin tham chiếu bên ngoài
Điều 5.2 ở trên đã chỉ ra cấu trúc của tệp tin JPM. Trong cục bộ tệp tin, điển hình là tất cả các nội dung ảnh và khung thông số được chứa trong tệp tin đơn để dễ dàng cho việc truy vết, duy trì, lưu trữ cục bộ được và băng thông mạng đã khá cao.
Mô hình nhiều đối tượng trình bày là một phương pháp thể hiện và xây dựng các tài liệu ảnh, cho phép truy cập dựa trên mô hình các đối tượng ngoài việc cung cấp lợi thế nén do áp dụng phương pháp nén tối ưu cho từng đối tượng. Ngoài ra, ảnh phức hợp có cấu trúc nội bộ bao hàm một thứ tự đọc, không giống như các ảnh chụp, để phá vỡ chúng thành lớp các đối tượng trình bày có thể mang lại lợi thế trực tuyến, nơi chỉ có các khu vực nhỏ của trang (một cột, giọng nói, hoặc một đoạn văn) là quan tâm được đưa ra và tìm lại.
Bảng phân mảnh và các tính năng tham chiếu chéo của định dạng tập JPEG 2000 quen thuộc cung cấp sự linh hoạt rất lớn trong việc xây dựng các tệp tin, có nội dung được phân phối trên nhiều tệp tin, một số trong đó có thể được đặt từ xa trên mạng như Internet. Điều này xem xét một số các tổ chức tệp tin kích hoạt các tính năng này.
Các tệp tin JPM hữu dụng hướng về các khung thông tin có cấu trúc tại dòng mã đầu và lớp các đối tượng ở dưới cùng của tệp tin hoặc từ vị trí xa hoặc cả hai. Điều này cho phép phân tích nhanh và tìm kiếm trong những bộ phận cấu thành của tệp tin bằng cách nhận được thông tin đầu cấu trúc cần thiết và sau đó tìm cách số hiệu quy định trong các tệp tin cục bộ hoặc từ xa.
Thông tin cấu trúc bao gồm các thông tin như khung bảng trang, khung tập trang, khung nhãn và khung bảng phân mảnh.
Trang khung bảng là một cấu trúc quan trọng. Chúng tham chiếu đến khung trang thông qua tham chiếu dữ liệu trang. Các tham chiếu dữ liệu chứa thông tin độ lệch (offset), chiều dài và tham chiếu dữ liệu cho các khung liên kết với mỗi trang trong các tệp tin hoàn chỉnh. Mỗi tham chiếu dữ liệu có thể bằng không, điều này chỉ ra tham chiếu dữ liệu trang với một khung trang trong các tệp tin hiện tại, hoặc không bằng không sẽ chỉ ra giá trị tham chiếu dữ liệu được sử dụng như một chỉ số vào khung tham chiếu dữ liệu. Khung tham chiếu dữ liệu chứa một danh sách liệt kê các chuỗi, mỗi chuỗi là một tên tệp tin hoặc một con trỏ URI vào tệp tin Internet.
5.4.2 Tệp tin chuẩn bị để sử dụng trên Internet
Các tệp tin JPM chuẩn bị để sử dụng trên Internet thường đã được phân tách ra thành các lớp và có thể cũng phân thành các đối tượng trình bày riêng biệt. Những bước chuẩn bị sẽ đưa ra một phương pháp cải thiện khả năng trình duyệt tệp tin JPM từ xa.
Những tệp tin chuẩn bị để sử dụng trên Internet như vậy có khả năng có thông tin cấu trúc đặt ở gần đầu của tệp tin, với các dòng mã xuất hiện sau đó. Các dòng mã và tập con của các dòng mã có thể truy cập trực tiếp bằng cách tìm kiếm đến một điểm trong các tệp tin được chỉ định bởi mục trong bảng mảnh phức hợp với dòng mã đó.
Tập trang chính của một bộ sách lớn, nhiều tập như một bách khoa toàn thư không phải chỉ đến từng trang riêng lẻ; một cấu trúc dữ liệu như vậy sẽ là quá lớn để được đưa tới một khách hàng ngay cả trước khi trang đầu tiên có thể được hiển thị. Thay vào dó, tập trang chính có thể phục vụ như những gì trong tổng số mục lục của bảng trang chỉ đến các trang chủ trước một cách riêng rẽ, sau đó đến các tập trang mà mỗi chúng bao gồm toàn bộ các tập: Tập A, tập B và tiếp tục như vậy. Mỗi tập (“Volume”) trang sẽ than chiếu tới “phần” tập trang đó sẽ tham chiếu tới “Điều”. Tập trang, và tiếp tục như vậy, mỗi tập trang có thể có một nhãn thích hợp áp dụng bằng chính của các nhãn khung trong các khung tập trang của chúng.
Một tìm kiếm dữ liệu đặc tả cho một thuật ngữ xuất hiện trên một số trong các trang trả về một “kết quả tím kiếm” tệp tin JPM mới chứa một tập “kết quả tìm kiếm” chính trang duy nhất chỉ vào một số ít các trang. Mục đầu trong tập khung trang này sẽ chỉ trực tiếp đến trang kết quả tìm kiếm đầu. Điều này thực sự sẽ chỉ đến một trong các trang web trong bách khoa toàn thư trên trên máy chủ thông qua một tham chiếu ngoài. Bằng cách điều hướng các “kết quả tìm kiếm” tập trang, các ứng dụng có thể cho phép người dùng đi đến tìm kiếm nhấn tiếp theo và trước kết quả tìm kiếm. Nếu người dùng sau đó tìm thấy bài viết quan tâm và muốn tiếp tục đọc trên một trang sau trong từ điển bách khoa từ xa, nơi không tìm kiếm kết quả, sau đó họ sẽ cần một chức năng trang tiếp theo.
Phần mềm máy khách sẽ đi đến khung PPCLoc tìm thấy trong khung trang của trang đó. Mục này có một con trỏ tới khung tập trang cơ sở trở lại trong tệp tin JPM chính. Khung tập trang cơ sở này sẽ được sử dụng bởi các phần mềm máy khách để đầu tiên tìm thấy mục trang hiện hành trong tập trang đó bằng đa phương tiện của vị trí Plx của khung PPCLoc. Mục Plx + 1 trong đó tập trang sẽ là trang tiếp theo. Bởi đó có nghĩa là, các trang trước và tiếp theo có thể được tìm thấy.
5.4.4 Tập trang trong một ngữ cảnh máy khách/máy chủ
Các định dạng tập tin JPM đặt khung trang và khung tập trang ở cấp độ tệp tin (không nằm trong tổ hợp siêu khung khác) để hỗ trợ cho trình duyệt của các trang. Trang mới hoặc tập trang tải xuống từ máy chủ có thể được thêm vào cuối của bản sao cục bộ (không đầy đủ) của tệp tin.
Trong một môi trường máy khách/máy chủ như trang web, nó sẽ được phổ biến cho một người dùng của một ứng dụng máy khách để duyệt chỉ trang nhất định của tệp tin JPM nhiều trang trên một máy chủ. Một liên kết ban đầu có thể chỉ ứng dụng khách hàng đến một trang cụ thể trong tệp tin JPM của máy chủ. Các ứng dụng khách hàng sẽ tạo ra tệp tin JPM cục bộ mới và có thể chọn để liên tục cập nhật nó như là một phần của tệp tin máy chủ được lấy ra. Điều này sẽ đảm bảo rằng bộ nhớ cache trình duyệt luôn luôn chứa tệp tin JPM hợp lệ khi duyệt chấm dứt.
Tệp tin cục bộ này sẽ có một tập trang chính. Tập trang chính ban đầu sẽ chỉ chứa một trang. Khi người sử dụng bắt đầu lấy các trang khác, những sẽ được nối thêm vào các tệp tin cục bộ và bản trang tập trang của chính cập nhật để trỏ đến mỗi bản sao cục bộ mới của một trang chủ. Ở cuối của trình duyệt, tệp tin độc lập không có kết nối rõ ràng để các tệp tin máy chủ có thể tồn tại trên máy khách.
Một cách tốt hơn để thực hiện bước duyệt này sẽ được sao chép tập trang chính của máy chủ cho khách hàng trước khi tải về bất kỳ trang nào. Tập trang này sẽ được cố định lên để trỏ đến các bản máy chủ của các trang bằng cách tạo ra một tham chiếu dữ liệu để URL của máy chủ. Sau đó, khi trang đầu được đưa xuống cho khách hàng, tập trang chính được cập nhật để trỏ đến các trang cục bộ, trong khi tiếp tục để trỏ đến các máy chủ cho tất cả các trang khác.
5.4.5 Ví dụ về tương tác máy khách/máy chủ
Trong một hệ thống máy khách/máy chủ, người dùng có thể muốn trình duyệt tệp tin JPM nhiều trang trên một máy chủ, và bắt đầu trên một trang ở giữa tệp tin từ xa đó. Có lẽ một công cụ tìm kiếm tìm thấy một khám phá trên tệp tin siêu dữ liệu JPM liên quan đến trang đó. Liên kết URI sẽ đưa ra thông tin bởi công cụ tìm kiếm trỏ đến tệp tin JPM và có thể chứa một xây dựng như http://webimaging.org/test.jpm?page=page17.
Điều này sẽ giúp các hệ thống bộ giải mã JPM phụ của trình duyệt có thể hủy bỏ việc tải xuống của các tệp tin JPM ngay sau khi các khung cấu trúc chính ở trên cùng của hộp đã hoàn tất tải về. Sau đó, các giao thức byte (byte serving) nào được sử dụng để truy xuất ra dải các byte cần thiết cho việc chuyển đổi/kết xuất dữ liệu trọng khung trang được kết hợp thông qua khung nhãn tới nhãn “trang 17”. Mỗi khung đối tượng trong mỗi khung đối tượng trình bày của một khung trang cho trước có thể chứa một bảng phân mảnh tham chiếu tới một khung banger mảnh. Bằng việc truy xuất vừa đủ của mỗi mảnh của đối tượng trình bày để kết xuất sang một bản khởi đầu của trang, một chuyển đổi đầy đủ của tất cả các đối tượng trình bày có để là khác nhau. Người dùng đầu cuối phải bắt đầu di con trỏ chuột trên cửa sổ vùng hiển thị của trình duyệt để chỉ thị các đối tượng trình bày có thể có chất lượng tốt hơn tiếp theo, dựa trên các hiển thị đã có như tùy thích.
Trong suốt tiến trình trình duyệt tương tác, các phân mảnh (fragment) là luồng dữ liệu tới bản sao máy khách của tệp tin JPM theo một thứ tự mà hơi khác so với thứ tự bản sao trong máy chủ. Trang 17 đến đầu tiên trong bản sao máy khách, nơi trang 1 đầu tiên giống trong bản sao tại máy chủ. Tương tự, các đối tượng trình bày bên trong trang 17 sẽ có một thứ tự khác trong phiên bản máy khách của trang, sau đó việc di chuyển con trỏ chuột của người sử dụng sẽ được xác định thông tin cần chọn. Phiên bản máy khách vẫn có thể tạo một thay thế hoàn toàn tương đương cho phiên bản trên máy chủ, bởi vì các bảng trang và các bảng phân mảnh trong bản sao máy khách sẽ phải có thông tin bắt đầu chỉ ra toàn bộ các phân mảnh trên máy chủ. Như một phần luồng dữ liệu của các phân mảnh đoạn và các khung trang chuyển tới máy khách, các số liệu đầu vào phù hợp trong các khung bảng trang và các khung bảng phân mảnh được cập nhật tới điểm có các đoạn phù hợp của bản sao ở máy khách của tệp tin cho dù đó chỉ trong bộ nhớ tạm tệp tin (cache) hay đã được lưu lại.
Khi có các thay đổi lớn tới bảng phân mảnh đoạn, thì con trỏ của bảng phân mảnh có thể bị chuyển sang một điểm mới, bảng phân mảnh chuyển tạm ở cuối của tệp tin, và bảng phân mảnh đoạn cũ có thể được chuyển vào khung tự do.
Tất cả các phân mảnh đoạn của dữ liệu trong tệp tin phải được truy xuất từ một tệp tin nằm trên máy chủ web bên ngoài tới bản sao tại máy chủ của tệp tin JPM hay từ một tệp tin đặt tại một máy chủ web khác, hay từ một tệp tin bên ngoài đặt tại một máy khách bất kỳ. Cơ chế tham chiếu mảnh đoạn hỗ trợ tất cả những nguồn thông tin này của các phân mảnh đoạn dữ liệu bên ngoài tới tệp tin JPM chính.
Tương tự, cơ chế tham chiếu chéo cung cấp một cơ sở cho các khung JPM (vì trái ngược với các phân mảnh đoạn dữ liệu) được đặt trong bất kỳ nơi nào có thể. Khung tham chiếu chéo có một chỉ số độ lệch, chiều chài và tham chiếu dữ liệu trỏ tới vị trí bên trong hay bên ngoài để có thể tìm được một khung. Với các tham chiếu chéo nội bên trong tệp tin chính, các khung tham chiếu dữ liệu được chia sẻ cho phép lặp lại các khung chỉ xuất hiện một lần, với các trường hợp thứ 2 và tiếp theo được bao gồm bằng việc tham chiếu tới trường hợp đầu tiên. Sự khác biệt chính giữa bảng phân mảnh và các tham chiếu chiếu là các tham chiếu chéo trỏ tới vị trí bắt đầu của khung tham chiếu, trong khi đó các danh mục của bảng phân mảnh đoạn trỏ trực tiếp tới byte đầu tiên của mảnh đoạn luồng dữ liệu, mặt khác việc bắt đầu của bất kể khung dữ liệu đa phương tiện được chứa hay các khung khác.
5.4.6 Ví dụ về thu hình máy quét (scanner capture)
Ngoài việc hỗ trợ một loạt các tuyến và các hành vi duyệt web từ xa, định dạng tệp tin có thể hỗ trợ các dòng dữ liệu đến từ máy quét tài liệu tốc độ cao, nơi mà các ảnh chưa được tối ưu hóa để xem nhưng phải đáp ứng những hạn chế nghiêm ngặt khác, chẳng hạn như thời gian. Những tệp tin này không nặng nề xử lý ở thời gian quét, nhưng thay vì nắm bắt tất cả các dữ liệu ảnh có sẵn (có thể có nhiều ảnh trên một trang) đến từ các máy quét và phần mềm chụp và lưu dữ liệu này để làm cho nó có sẵn cho tải xuống các phần mềm sau xử lý có thể chuyển đổi nó thành một dạng web được tối ưu hóa.
Tệp tin quét có thể có dữ liệu đặc tả cụ thể cho quá trình quét. Điều này có thể bao gồm các dữ liệu máy quét như biểu đồ, đo góc nghiêng, hoặc thông số kỹ thuật cắt xén hình chữ nhật. Dữ liệu đặc tả khác có thể mô tả mô kiểu máy quét hoặc ngày và thời gian quét.
Tệp tin quét chưa được chuẩn bị cho các trình duyệt hiệu quả qua mạng. Chúng đang có xu hướng liên quan đến cố gắng xử lý mã hóa tối thiểu để đáp ứng các hạn chế áp đặt bởi tốc độ quét tốc độ cao.
Tệp tin JPM đến từ một hệ thống quét phụ thường sẽ không được tách thành các lớp hoặc các đối tượng trình bày, nhưng thay vào đó có thể bao gồm một mục nén màu chất lượng cao toàn bộ hoặc ảnh tỷ lệ màu xám thích hợp cho sử dụng bởi một hệ thống tách tiếp theo. Nếu hệ thống quét cũng có khả năng tạo ra một ảnh bitonal (bít độ sâu 1) nguyên bản, nó có thể bao gồm cả ảnh này và ảnh đầy đủ màu sắc trong tệp tin JPM để hỗ trợ xử lý tách dòng tải xuống. Hai ảnh quét khác nhau của cùng một nội dung mà không được xử lý trước theo mô hình MCR có thể được đặt vào tệp tin JPM như sau: vị trí ảnh màu như một đối tượng trình bày trên một trang và ảnh bitonal như một đối tượng trình bày trên một trang khác và kết hợp hai trang bằng cách đặt chúng lại với nhau trong một tập trang. Khung nhãn thích hợp có thể làm rõ mối quan hệ giữa hai ảnh và chỉ ra rằng chúng thể hiện cho cùng một trang.
Phụ lục này mô tả cấu trúc và tổ chức của tệp tin JPM. Tệp tin JPM sử dụng cấu trúc định dạng tệp tin quy định trong ISO/IEC 15444-1. Vì vậy, tệp tin JPM là dòng mã liên tục các khung trang. Phụ lục này định nghĩa một khung và mô tả ký hiệu được sử dụng cho việc định nghĩa khung trong tiêu chuẩn này. Phụ lục này cũng liệt kê các khung được sử dụng trong tệp tin JPM.
A.1 Nhận dạng tệp tin
Tên mã hiệu của mã nén của các tệp tin quy định theo tiêu chuẩn này phải ký hiệu là 'jpm\040'; Tên mã hiệu quy định tại Phụ lục I của ISO/IEC 15444-1. Các tệp tin JPM là các tệp tin phù hợp với tiêu chuẩn này. Tệp tin JPM có thể được xác định bằng cách sử dụng một số cơ chế. Khi được lưu trữ trong hệ thống tệp tin máy tính truyền thống, các tệp tin phù hợp với phần mở rộng là .jpm (bộ đọc phải hiểu được tệp tin này). Trong các hệ thống tệp tin máy tính Macintosh, các loại mã nén cũng xác định là 'jpm\040'. Các định dạng MIME là image/jpm.
A.2 Tổ chức tệp tin
Tệp tin JPM sử dụng cấu trúc định dạng tệp tin quy định trong ISO/IEC 15444-1. Cấu trúc nhị phân của tệp tin là chuỗi liên tiếp các khung. Bắt đầu của khung đầu sẽ là byte đầu của tệp tin và cuối của khung sẽ là byte cuối cùng của tệp tin. Cấu trúc nhị phân của khung trong tệp tin JPM là giống với định nghĩa trong các định dạng tệp tin JP2 (điều I.4 của ISO/IEC 15444-1).
Tiêu chuẩn này định nghĩa các khung bắt buộc phải có trong tệp tin JPM, cũng như một số khung tùy chọn khác. Các khuyến nghị | Tiêu chuẩn quốc tế khác có thể định nghĩa các khung khác nhau cũng có thể được tìm thấy trong tệp tin JPM. Trong mọi trường hợp, các thông tin chứa trong tệp tin JPM sẽ ở định dạng khung; dòng byte không ở trong định dạng khung sẽ không được tìm thấy trong tệp tin JPM.
Một tệp tin JPM có thể là loại tệp tin khép kín (độc lập), trong đó chỉ chứa các dữ liệu cần thiết để đủ tổng hợp trang hoặc các trang trong tệp tin. Tệp tin JPM cũng có thể tham chiếu ảnh và dữ liệu trong các tệp tin bên ngoài. Tham chiếu dữ liệu đến nội dung của tệp tin bên ngoài là khung tham chiếu dữ liệu (Phụ lục B.1.5) hoặc các khung tham chiếu chéo (phụ lục B.6.4).
Lược đồ, tổ chức phân cấp của các khung trong tệp tin JPM được thể hiện trong hình A.1. Khung với viền nét đứt là tùy chọn trong tệp tin JPM. Tuy nhiên, khung tùy chọn có thể xác định các khung bắt buộc. Trong trường hợp đó, nếu có khung tùy chọn thì cũng có có những khung bắt buộc trong khung tùy chọn. Hình minh họa này quy định cụ thể mối quan hệ giữa các khung chứa trong tệp tin. Thứ tự cụ thể của những khung trong các tệp tin thông thường không được bao gồm. Việc định nghĩa một khung phải bao gồm thông tin về việc khung đó có được yêu cầu phải được tìm thấy tại một vị trí cụ thể trong tệp tin hoặc trong khung khác hay không.
Hình A.1 - Khái niệm cấu trúc của tệp tin JPM
Khung ký số JPEG 2000 xác định các tệp tin là một phần của dòng chuẩn JPEG 2000 về định dạng tệp tin.
Khung loại tệp tin quy định loại tệp tin, phiên bản và tính tương thích, trong đó có quy định cả nếu tệp tin này là phù hợp với tệp tin JPM hoặc cả nếu nó có thể được đọc bởi bộ đọc tệp tin theo dạng JP2 hay JPX, ít nhất là trong tiêu chuẩn này.
Khung tiêu đề JP2 tùy chọn có thể sau khung loại tệp tin, mô tả ảnh thu nhỏ tài liệu cho các tệp tin JPM.
Khung tiêu đề ảnh phức hợp chứa thông tin tổng hợp mô tả tệp tin ảnh phức hợp.
Khung tập trang chứa khung bảng trang để định vị trang riêng lẻ của tệp tin JPM.
Khung trang mô tả các trang mà trên đó các đối tượng trình bày phần tử của khung được kết hợp lại bằng cách sử dụng mô hình ảnh. Nó cũng có thể chứa tham chiếu đến dữ liệu đặc tả liên quan đến trang, khung trang cũng chứa một hoặc nhiều đối tượng trình bày.
Tệp tin ảnh phức hợp phải có khung ký số JPEG 2000, khung loại tệp tin và khung tiêu đề ảnh phức hợp. Các tệp tin có hoặc không chứa dữ liệu ảnh. Hình A.1 cho thấy dữ liệu được lưu trữ với các tệp tin ảnh phức hợp.
Định dạng JPM cho phép dòng mã trong các lớp ảnh không liên tục. Điều này cho phép các phân mảnh dòng mã đan xen giữa các ảnh và quá trình chuyển đổi liên ảnh, trong đó nhiều ảnh được chuyển đổi dần dần vào cùng một thời điểm.
Định dạng JPM cũng cho phép dòng mã trong các lớp ảnh được lưu trữ bên ngoài nhưng được tham chiếu từ các tệp tin ảnh phức hợp. Điều này có nghĩa rằng các ảnh được sử dụng trong ảnh phức hợp có thể được lưu trữ riêng rẽ với ảnh phức hợp của họ hoặc tệp tin JPM.
A.3 Định nghĩa khung
Về lý tính, mỗi thành phần trong tệp tin JPM được đóng khung trong một cấu trúc nhị phân được gọi là một khung. Cấu trúc nhị phân được định nghĩa trong điều I.4 của ISO/IEC 15444-1.
Phụ lục B quy định các khung được sử dụng trong tiêu chuẩn này. Mỗi khung được mô tả bằng cách sử dụng các chú giải quy định tại điều I.3.6 của ISO/IEC 15444-1.
Thông tin bổ sung sau đây được quy định trong các định nghĩa khung.
Loại khung: bốn mã ký tự và mã thập lục phân xác định cho loại khung
Ngăn chứa (Container): tên khung mẹ hoặc tệp tin chứa khung
Trường bắt buộc (Madatory): phải có hoặc không
Số lượng: số các khung trong ngăn chứa
Vị trí: vị trí của khung.
Loại khung là giá trị của trường Tbox của khung. Trường bắt buộc xác định các khung được yêu cầu phải xuất hiện trong các khung chứa nó. Ngăn chứa xác định khung chứa các khung được xác định. Số lượng là số các khung được xác định có thể xuất hiện trong các ngăn chứa.
A.4 Các khung được sử dụng trong tệp tin ảnh phức hợp
Bảng A.1 Liệt kê các khung được sử dụng trong tệp tin JPM và các xác định tham chiếu trong tiêu chuẩn này.
Bảng A.1- Khung xác định hoặc tham chiếu trong tiêu chuẩn này
Tên khung |
Loại |
Siêu khung |
Thông tin |
Khung màu gốc (Base colour) |
'bclr' (0x6263 6C72) |
Có |
Khung này chứa tất cả thông tin quy định màu của trang hoặc của một đối tượng mà không có sẵn dữ liệu ảnh. |
Khung giá trị màu gốc |
'bcvl' |
Không |
Khung này quy định các giá trị thành phần cho màu của trang hoặc của một đối tượng cho ảnh không có dữ liệu có sẵn. |
Khung quy định màu |
'colr' (0x636F 6C72) |
Không |
Khung này quy định không gian màu của ảnh. |
Khung tiêu đề ảnh phức hợp |
'mhdr' (0x6D68 6472) |
Không |
Khung này chứa thông tin chung về các tệp tin ảnh phức hợp, ví dụ như nhật ký và phiên bản. |
Khung dòng mã liên tục |
'jp2c' (0x6A70 3263) |
Không |
Khung này chứa một dòng mã JPEG 2000 hợp lệ và đầy đủ. |
Khung tham chiếu chéo |
'cref' (0x6372 6566) |
Không |
Khung này chỉ ra rằng khung tìm thấy ở một vị trí khác (trong tệp tin JPM hoặc trong tệp tin khác) cần được xem xét như thể nó đã được chứa ở vị trí này trong các tệp tin JPM. |
Khung tham chiếu dữ liệu |
'dtbl' (0x6474 626C) |
Không |
Khung này chứa tập các liên kết đến các tệp tin hoặc các dòng dữ liệu không chứa trong các tệp tin JPM chính nó. |
Khung loại tệp tin |
'ftyp' (0x6674 7970) |
Không |
Khung này quy định loại tệp tin, phiên bản và thông tin tương thích, bao gồm xác định tệp tin này là tệp tin JPM phù hợp. |
Khung danh sách phân mảnh |
'flst' (0x666C 7374) |
Không |
Khung này quy định danh sách các phân mảnh tạo nên dòng mã xác định trong các tệp tin. |
Khung bảng phân mảnh |
'ftbl' (0x6674 626C) |
Có |
Khung này mô tả cách thức dòng mã đã tách ra hoặc phân mảnh và sau đó lưu trữ trong các tệp tin. |
Khung tự do |
'free' (0x6672 6565) |
Không |
Khung này chứa dữ liệu không còn được sử dụng và có thể được bổ sung khi tệp tin được cập nhật. |
Khung dữ liệu đặc tả văn bản ẩn |
'htxb' |
Có |
Khung tùy chọn này chứa văn bản ẩn và chú thích. |
Khung tham chiếu HTX |
'phtx' |
Không |
Khung tùy chọn này được sử dụng để trỏ đến nội dung khung văn bản ẩn dữ liệu đặc tả mức tệp tin đầu. |
Khung tiêu đề ảnh |
'ihdr' (0x6968 6472) |
Không |
Khung này quy định kích thước của ảnh và các trường liên quan khác. |
Khung tiêu đề JP2 |
'jp2h' (0x6A70 3268) |
Có |
Khung này chứa loạt các khung có tiêu đề dạng thông tin của tệp tin chứa ảnh duy nhất. |
Khung ký số JPEG 2000 |
'jP\040\040' (0x6A50 2020) |
Không |
Khung này quy định duy nhất các tệp tin là một phần của tệp tin JPEG 2000. |
Khung nhãn |
'lbl\040' (0x6C62 6C20) |
Không |
Khung này quy định nhãn văn bản cho khung trang hoặc khung tập trang. |
Khung đối tượng trình bày |
'lobj' (0x6C6F 626A) |
Có |
Khung này chứa thông tin và dữ liệu ảnh cần thiết để nén cặp đối tượng ảnh mặt nạ. |
Khung tiêu đề đối tượng trình bày |
'lhdr' (0x6C68 6472) |
Không |
Khung này mô tả các thuộc tính của đối tượng trình bày và gán một định danh duy nhất trong trang. |
Khung dữ liệu truyền thông |
'mdat' (0x6D64 6174). |
Không |
Khung này chứa dữ liệu đa phương tiện chung, được tham chiếu thông qua khung danh sách phân mảnh. |
Khung đối tượng |
'objc' (0x6F62 6A63) |
Có |
Khung này chứa tất cả các dữ liệu ảnh và thông tin của đối tượng trong đối tượng trình bày. |
Khung tiêu đề đối tượng |
'ohdr' (0x6F68 6472) |
Không |
Khung này mô tả các tính chất của một đối tượng, xác định nó như là mặt nạ, ảnh hoặc đối tượng nén ảnh mặt nạ và gán cho từng đối tượng định danh duy nhất trong các tệp tin.
|
Khung chia tỷ lệ đối tượng |
'scal' (0x7363 616C) |
không |
Khung này mô tả rộng cho đối tượng trước khi áp dụng nó về trang. |
Khung trang |
'page' (0x7061 6765) |
Có |
Khung này chứa tất cả thông tin cần thiết về ảnh một trang có tham chiếu đến dữ liệu dòng mã. |
Khung tập trang |
'pcol' (0x7063 6F6C) |
Không |
Khung này nhóm với nhau các vị trí của tập các trang được xem là có liên quan và liên kết với nhau.
|
Khung tiêu đề trang |
'phdr' (0x7068 6472) |
Không |
Khung này mô tả các thuộc tính của trang và cung cấp số lượng các đối tượng trình bày trong trang. |
Khung bảng trang |
'pagt' (0x7061 6774) |
Không |
Khung này xác định các vị trí của các trang trong tập trang và cho phép truy cập ngẫu nhiên của các trang trong tệp tin. |
Khung bộ định vị trí tập trang cơ sở |
'ppcl' (0x7070 636C) |
Không |
Khung này xác định vị trí của tập chính trang cho tập trang. |
Khung nhập dữ liệu chia sẻ (Shared-data entry) |
'sdat' (0x7364 6174) |
Có |
Khung này chứa khung có thể được tham chiếu bởi thông tin nhận dạng từ nhiều vị trí bên trong tệp tin. |
Khung tham chiếu chia sẻ dự liệu (Shared-data reference) |
'sref' (0x7372 6566) |
Không |
Khung này có thể được sử dụng để chèn khung trong tệp tin tham chiếu đến sự xuất hiện trước của khung trong cùng tệp tin. |
Khung UUID |
'uuid' (0x7575 6964) |
Không |
Khung này chứa thông tin cụ thể nhà cung cấp. |
Khung thông tin UUID |
'uinf' (0x7569 6E66) |
Có |
Khung này chứa thông tin bổ sung kết hợp với một mã UUID. |
Khung XML |
'xml\040' (0x786D 6C20) |
Không |
Khung này chứa thông tin cụ thể nhà cung cấp ở định dạng XML. |
Phụ lục này quy định các khung được sử dụng phù hợp định dạng tệp tin JPM và các bộ đọc tin phải hiểu được. Mỗi khung phù hợp với cấu trúc khung tiêu chuẩn theo quy định tại Điều A.3.
B.1 Các khung cấp độ tệp tin
B.1.1 Khung ký số JPEG 2000
Loại khung: “JP¥040¥040 '(0x6A502020)”
Ngăn chứa: Tệp tin
Trường bắt buộc: phải có
Số lượng: đúng bằng 1
Vị trí: khung đầu trong tệp tin
Định dạng và cấu trúc của khung ký số JPEG 2000 được quy định tại điều I.5.1 của ISO/IEC 15444-1.
Trường BR trong khung tệp tin này phải ký hiệu là 'jpm\040' được quy định trong tiêu chuẩn này. Ngoài ra, tệp tin phù hợp với tiêu chuẩn này phải có ít nhất một trường CLI trong loại khung tệp tin, phải chứa giá trị 'jpm\040' trong các trường CLi của khung loại tệp tin.
B.1.3 Khung tiêu đề JP2 (siêu khung) sau khung loại tệp tin
Loại khung: 'jp2h' (0x6A703268)
Ngăn chứa: tệp tin
Trường bắt buộc: phải có
Số lượng khung: nhiều nhất bằng 1
Vị trí: tùy chọn sau kiểu tên khung
Định dạng và cấu trúc của khung tiêu đề JP2 được quy định tại phụ lục B.6.2.
Tệp tin đầu tiên cấp độ khung tiêu đề JP2 theo sau khung loại tệp tin mô tả ảnh thuộc cấp độ ảnh thu nhỏ tệp tin JPM. Các dòng mã đầu tiên liên tục sau khung JP2 thuộc cấp độ tiêu đề tệp tin phải có các dòng mã thu nhỏ liên quan. Nếu khung tiêu đề JP2 và khung dòng mã liên tục tương thích với JP2 thì tệp tin JPM là tương thích với JP2 và 'jp2\040' được xuất hiện trong danh sách tương thích trong khung loại tệp tin. Xem Điều 5.2.5 để biết thêm chi tiết.
B.1.4 Khung tiêu đề ảnh phức hợp
Loại khung: 'mhdr' (0x6D686472)
Ngăn chứa: tệp tin
Trường bắt buộc: phải có
Số lượng: nhiều nhất bằng 1
Vị trí: bất kể vị trí nào sau khung loại tệp tin
Khung tiêu đề ảnh phức hợp chứa thông tin chung về các ảnh phức hợp. Yêu cầu đặt ngay sau loại khung tệp tin và tệp tin cấp độ khung tiêu đề JP2.
Loại khung tiêu đề ảnh phức hợp là 'mhdr' 0x6D686472. Khung này chứa các trường sau đây:
Hình B.1 - Cấu tạo các trường khung tiêu đề ảnh phức hợp
NP: Trường số lượng trang. Tham số này quy định cụ thể số lượng các trang trong các tệp tin ảnh phức hợp nó được lưu trữ như là kiểu lưu trữ số nguyên đầu to (big endian integer) 4-byte . Nếu không biết số lượng trang thì giá trị này bằng 0
P: Trường nhận diện Profile; Profile ứng dụng hoặc chế độ phải hỗ trợ đọc tệp tin này. Giá trị này được lưu lại như số nguyên không dấu 1 byte. Giá trị định nghĩa trong trường này được quy định trong Bảng B.1. Xem Phụ lục D để biết chi tiết.
Bảng B.1. Giá trị hợp lệ
Giá trị |
Ý nghĩa |
0 |
Không có profile quy định |
1 |
Profile web |
Giá trị khác |
Sử dụng tiêu chuẩn IOS |
SC: Trường lưu trữ: Giá trị này được lưu trữ là số nguyên không dấu 1 byte. Nếu giá trị bằng 1 thì tệp tin là khép kín và không có tham chiếu để mở rộng dữ liệu, ngược lại nó sẽ có giá trị 0.
MPCOff: Trường độ lệch tập trang chính. Trường này quy định khoảng cách từ điểm bắt đầu của tệp tin và byte đầu của khung tập trang chính. Trường này được mã hóa theo kiểu lưu trữ số nguyên đầu to không dấu 8-byte.
MPCLen Trường chiều dài tập trang chính. Trường này quy định chiều dài của khung tập trang chính. Phần này được mã hóa theo kiểu số nguyên đầu to không dấu 4-byte.
MC: Trường bộ mã mặt nạ: bộ mã hoặc nhiều bộ mã có thể được sử dụng để nén các đối tượng mặt nạ của các đối tượng trình bày trong tệp tin này. Trường này chứa thể là một hay nhiều các byte dài, với các giá trị được đặt theo dạng bít như được quy định trong Bảng B.2. Bít số 7, bít mở rộng, phải được thiết đặt khi bổ sung byte khác vào các mã bổ sung phù hợp., ví dụ như 8, mà phải được gán nhận vào bít số 8.
Bảng B.2 - Bộ mã mặt nạ
Giá trị (các bít) MSB LSB |
Các cờ bộ mã mặt nạ |
xxxx xxx0 xxxx xxx1 |
Không gian chiều theo ITU-T T.4 (MH) việc mã không được sử dụng Không gian một chiều theo ITU-T T.4 (MH) việc mã được sử dụng |
xxxx xx0x xxxx xx1x |
Không gian hai chiều theo ITU-T T.4 (MR) việc mã không được sử dụng Không gian hai chiều theo ITU-T T.4 (MR) việc mã được sử dụng |
xxxx x0xx xxxx x1xx |
Theo ITU-T T.6 (MMR) việc mã không được sử dụng Theo ITU-T T.6 (MMR) việc mã được sử dụng |
xxxx 0xxx xxxx 1xxx |
Theo ITU-T T.82 (JBIG) việc mã không được sử dụng Theo ITU-T T.82 (JBIG) việc mã được sử dụng |
xxx0 xxxx xxx1 xxxx |
Theo ITU-T T.800 (JPEG 2000) việc mã không được sử dụng Theo ITU-T T.800 (JPEG 2000) việc mã được sử dụng |
xx0x xxxx
xx1x xxxx |
Theo ITU-T T.88 (JBIG2) việc mã áp dụng Theo ITU-T T.89 không được sử dụng Theo ITU-T T.88 (JBIG2) việc mã áp dụng Theo ITU-T T.89 được sử dụng |
0xxx xxxx 1xxx xxxx |
Byte cuối cùng quy định bộ mã được sử dụng Mở rộng một byte quy định bộ mã có thể được sử dụng |
Giá trị khác |
Dành cho việc sử dụng theo tiêu chuẩn ISO |
IC: Trường các bộ mã ảnh: bộ mã hoặc các bộ mã sử dụng để nén các đối tượng ảnh của các đối tượng trình bày trong tệp tin. Trường này chứa có thể là một hoặc nhiều byte dài, với giá trị được quy định trong Bảng B.3. Bít 7 mở rộng sẽ được đặt khi bổ sung một byte phù hợp với bộ mã bổ sung, ví dụ như thứ byte tám, mà phải được thiết đặt cho bít số 8.
Bảng B.3 - Bộ mã ảnh
Trường (các bít) MSB LSB |
Cờ bộ mã ảnh |
xxxx xxx0 xxxx xxx1 |
Theo ITU-T T.81 (JPEG) việc mã áp dụng Theo ITU-T T.81 (JPEG) việc mã được sử dụng |
xxxx xx0x xxxx xx1x |
Theo ITU-T T.82 (JBIG) việc mã áp dụng Theo ITU-T T.43 không sử dụng Theo ITU-T T.82 (JBIG) việc mã áp dụng Theo ITU-T T.43 không sử dụng |
xxxx x0xx
xxxx x1xx |
Theo ITU-T T.45 Run-Length Colour Encoding (Mã hóa màu loạt dài) không sử dụng Theo ITU-T T.45 Run-Length Colour Encoding (Mã hóa màu loạt dài) việc mã được sử dụng |
xxxx 0xxx xxxx 1xxx |
Theo ITU-T T.87 (JPEG-LS) việc mã không được sử dụng Theo ITU-T T.87 (JPEG-LS) việc mã được sử dụng |
xxx0 xxxx xxx1 xxxx |
Theo ITU-T T.800 (JPEG 2000) việc mã không được sử dụng Theo ITU-T T.800 (JPEG 2000) việc mã được sử dụng |
0xxx xxxx 1xxx xxxx |
Byte cuối cùng quy định bộ mã được sử dụng Việc mở rộng một byte khác quy định các bộ mã có thể được sử dụng |
Giá trị khác |
Dành cho việc sử dụng theo tiêu chuẩn ISO |
IPR: Trường sở hữu trí tuệ. Tham số này quy định tệp tin JPM chứa thuộc tính thông tin sở hữu trí tuệ. Giá trị này được lưu trữ theo kiểu số nguyên không dấu 1-byte. Nếu giá trị của trường này bằng 0 thì tệp tin này và các tệp tin ảnh chứa thông tin bản quyền, vì vậy tệp tin không chứa khung IPR. Nếu giá trị bằng 1, thì tệp tin chứa thông tin bản quyền và do vậy nó chứa khung IPR theo quy định tại Điều C.1. Các giá trị khác được dành riêng cho sử dụng tiêu chuẩn ISO.
Bảng B.4 - Định dạng các nội dung của khung tiêu đề ảnh phức hợp
Tên trường |
Kích thước (các bít) |
Giá trị |
NP |
32 |
0 – (232–1) |
P |
8 |
Xem bảng B.1 |
SC |
8 |
0 or 1 |
MPCOff |
64 |
12 – (264–1) |
MPCLen |
32 |
0 – (232–1) |
MC |
Giá trị |
Xem bảng B.2 |
IC |
Giá trị |
Xem bảng B.3 |
IPR |
8 |
0–1 |
B.1.5 Khung tham chiếu dữ liệu
Loại khung: 'mhdr' (0x6D686472)
Ngăn chứa: tệp tin
Trường bắt buộc: phải có
Số lượng: nhiều nhất bằng 1
Vị trí: bất kể chỗ nào sau khung tiêu đề ảnh phức hợp
Khung tham chiếu dữ liệu chứa một loạt các URL được tham chiếu bởi tệp tin này. Khung tham chiếu dữ liệu không phải là siêu khung bởi vì nó không chỉ chứa khung.
Khung tham chiếu dữ liệu được sử dụng cho các khung bảng trang, khung tiêu đề đối tượng và khung danh sách phân mảnh tham chiếu đến dữ liệu bên ngoài của các tệp tin JPM.
- Trong khung bảng trang, tham chiếu dữ liệu và độ lệch tham chiếu tới một khung trang bên ngoài hoặc khung tập trang.
- Trong khung tiêu đề đối tượng, tham chiếu dữ liệu và độ lệch tham chiếu đến một khung bảng phân mảnh bên ngoài.
- Trong khung danh sách phân mảnh, tham chiếu dữ liệu và độ lệch tham chiếu tới một mảnh dòng mã bên ngoài.
- Trong khung danh sách phân mảnh bên trong khung tham chiếu chéo, tham chiếu dữ liệu và độ lệch tham chiếu đến tiêu đề chia sẻ bên ngoài hoặc mảnh dữ liệu đặc tả.
Loại khung tham chiếu dữ liệu là 'dtbl (0x6474626C). Khung này chứa các trường sau:
Hình B.2 - Tổ chức các nội dung của khung tham chiếu dữ liệu
NDR: Trường số tham chiếu dữ liệu. Trường này quy định cụ thể số tham chiếu dữ liệu, và do vậy số các khung URL trong khung tham chiếu dữ liệu này.
Dri: Trường tham chiếu dữ liệu URL: trường này chứa khung URL nhập dữ liệu theo quy định tại Điều I.7.3.2 của ISO/IEC 15444-1. Tuy nhiên, trong trường hợp này, các trường vị trí trong khung là không thể hiện thông tin khung UUID. Ý nghĩa của URL được quy định trong trường khung tham chiếu tới nhập đầu vào cụ thể trong khung tham chiếu dữ liệu. Các chỉ số của các phần tử trong dải trường DRI bằng 1; tham chiếu dữ liệu của trường DRI trong một khung danh sách phân mảnh hoặc khung bảng trang quy định tham chiếu dữ liệu đầu tiên chứa trong khung tham chiếu dữ liệu URL. Với giá trị tham chiếu dữ liệu bằng 0 là một trường hợp đặc biệt xác định các tham chiếu dữ liệu là dữ liệu chứa trong tệp tin chính nó.
Bảng B.5 - Định dạng các nội dung của khung tham chiếu dữ liệu
Tên trường |
Kích thước (các bít) |
Giá trị |
NDR |
16 |
0 - 65 535 |
DRi |
Giá trị khác |
Giá trị khác |
B.1.6 Khung tập trang (Siêu khung)
Loại khung: 'mhdr' (0x6D686472).
Ngăn chứa: Tệp tin.
Trường bắt buộc: Không.
Số lượng: ít nhất bằng 1.
Vị trí: Bất kể chỗ nào tại tệp tin tại máy (file level) sau khung loại tệp tin.
CHÚ THÍCH : Để truy cập hiệu quả, một tệp tin tối ưu hóa phải có khung tập trang đầu tiên trang nằm sau khung tham chiếu dữ liệu, nếu nó tồn tại, mặt khác nếu phải ngay sau khung tiêu đề ảnh phức hợp.
Một khung tập trang là tổ hợp khung chứa khung tập trang cơ sở mà được yêu cầu ngoại trừ khi tập trang cơ sở là một tập trang chính không có tập trang cơ sở được mô tả trong Điều 5.2.1.2, một khung nhãn tùy chọn, các khung dữ liệu đặc tả tùy chọn, và một khung bảng trang bắt buộc. Khung tập trang kết hợp với một tập các trang, mà các vị trí của nó có được sử dụng khung bảng trang với một nhãn tùy chọn và dữ liệu đặc tả tùy chọn.
Tệp tin JPM sẽ có ít nhất một tập trang. Mỗi trang trong tệp tin JPM sẽ thuộc về những gì được gọi là tập trang cơ sở tùy chọn. Vai trò của tập trang cơ sở tùy chọn được trình bày chi tiết tại Điều 5.2.1.
Loại của khung tập trang sẽ phải ký hiệu là 'pcol' (0x70636F6C). Khung này chứa các trường sau đây:
Hình B.3 - Tổ chức các nội dung của khung tập trang
PPCLoc: Trường Khung bộ định vị trí tập trang cơ sở. Khung này chứa khung tập trang tùy chọn như quy định tại Điều B.1.6.1.
Label Trường Khung nhãn. Trường tùy chọn này chứa khung nhãn theo quy định tại Điều B.6.3. Khung này chứa nhãn được liên kết với một tập trang; khung này là tùy chọn.
Metadata Các khung dữ liệu đặc tả tùy chọn.
PTable: Trường Khung bảng trang. Trường này chứa khung bảng trang theo quy định tại Điều B.1.6.2.
B.1.6.1 Khung bộ định vị tập trang cơ sở
Loại khung: 'ppcl (0x7070636C)'.
Ngăn chứa: khung tập trang hoặc khung trang.
Trường bắt buộc: phải có, trừ trường hợp trang đơn, tệp tin JPM khép kín, mà nó là tùy chọn trong khung trang.
Số lượng: nhiều nhất bằng một.
Vị trí: bất kể đâu.
Mỗi khung tập trang phải có khung bộ định vị tập trang cơ sở. Khung tập trang cơ sở chứa các trường được sử dụng để xác định vị trí “Tập trang cơ sở” của trang hay của tập trang. Vai trò của tập trang cơ sở chi tiết tại Điều 5.2.1.
Loại của khung bộ định vị tập trang cơ sở phải ký hiệu là ‘ppcl’ (0x7070636C). Khung này chứa các trường sau đây:
Hình B.4 - Việc tổ chức các nội dung của khung bộ định vị tập trang cơ sở
PPCOff: Trường Độ lệch tập trang cơ sở. Trường này quy định cụ thể độ lệch từ điểm bắt đầu của tệp tin tới các byte đầu tiên của khung tập trang cơ sở thuộc trang hoặc tập trang. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu đầu to 8-byte.
PPCLen: Trường Chiều dài tập trang cơ sở. Trường này quy định chiều dài tập trang cho khung trang này. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu đầu to 4-byte.
PPCDR: Trường Tham chiếu dữ liệu trang cơ sở. Trường này quy định tệp tin dữ liệu, nguồn chứa các tập trang cơ sở hoặc chứa tập trang thuộc. Nếu giá trị trường này là không thì khung tập trang cơ sở chứa trong tệp tin này. Nếu giá trị khác không, thì các trang được chứa trong các tệp tin sẽ được chỉ định bởi chỉ số vào khung tham chiếu dữ liệu. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu đầu to 2-byte.
PIx: Trường Bảng chỉ số tập trang cơ sở. Trường này quy định một giá trị trong trang cơ sở hoặc chứa tập trang thuộc. Mục nhập các chỉ số quy định trang bảng sẽ tham chiếu trong các trang hoặc tập các trang có trong tập trang cơ sở. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu đầu to 4-byte.
Bảng B.6 - Định dạng nội dung khung bộ định vị tập trang cơ sở
Tên trường |
Kích thước (các bít) |
Giá trị |
PPCOff |
64 |
0 – (264–1) |
PPCLen |
32 |
0 – (232–1) |
PPCDR |
16 |
0 – 65 535 |
PIx |
32 |
0 – (232–1) |
B.1.6.2 Khung bảng trang
Loại khung: 'pagt (0x70616774)
Ngăn chứa: khung tập trang
Trường bắt buộc: phải có
Số lượng: chọn một trong mỗi khung trang
Vị trí: bất kể đâu.
Khung bảng trang chứa các độ lệch của các khung trang và khung tập trang trong tập trang.
Dữ liệu khung chứa số lượng các mục trong trang bảng. Mỗi mục trong bảng sẽ tham chiếu đến khung trang hoặc khung tập trang.
Cờ trong mỗi mục bảng quy định loại khung đang được tham chiếu.
Loại khung bảng trang là 'pagt' (0x70616774). Khung này chứa các trường sau đây:
Hình B.5 - Cấu tạo nội dung của khung bảng trang
NE: Trường số các mục trong bảng trang. Số {OFF, LEN, DR, FL} trong khung bảng trang phải có cùng một giá trị của trường NE. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu đầu to 4 byte.
OFFi: Trường Độ lệch. Trường này quy định cụ thể byte độ lệch đầu tiên của trang tham chiếu hoặc khung tập trang. Độ lệch tương ứng với các byte đầu của tệp tin (byte đầu tiên của trường chiều dài của khung ký số JPEG 2000). Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu đầu to 8 byte.
LENi Trường Chiều dài trang. Trường này quy định độ dài của khung trang. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu đầu to 4 byte.
Dri: Trường Tham chiếu dữ liệu. Trường này quy định tệp tin dữ liệu hoặc tài nguyên chứa trong trang. Trường hợp có giá trị bằng không thì các trang sẽ chứa tệp tin này. Nếu giá trị khác không thì trang được chứa trong tệp tin được quy định bởi chỉ số này vào trong khung tham chiếu dữ liệu. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu đầu to 2 byte.
Fli Trường Cờ. Trường này quy định loại mục nhập. Được mã hóa theo kiểu lưu trữ số nguyên không dấu đầu to 1 byte. Các giá trị hợp lệ của trường này như sau:
Bảng B.7 - Giá trị hợp lệ trường cờ FL
Giá trị (các bít) MSB LSB |
Ý nghĩa |
xxxx x001 |
Độ lệch tới khung trang |
xxxx x011 |
Độ lệch tới khung trang chứa hình thu nhỏ |
xxxx x000 |
Độ lệch tới khung tập trang không thể phụ trợ |
xxxx x100 |
Độ lệch tới khung tập trang phụ trợ |
xxxx 0xxx |
Độ lệch tới trang hoặc khung tập trang không chứa dữ liệu đặc tả. |
xxxx 1xxx |
Độ lệch tới trang hoặc khung tập trang chứa dữ liệu đặc tả. |
Giá trị khác |
Dành cho việc sử dụng tiêu chuẩn ISO. |
Bảng B.8 - Định dạng các nội dung của khung bảng trang
Tham số |
Kích thước (các bít) |
Giá trị |
NE |
32 |
1 – (232–1) |
OFFi |
64 |
12 – (264–1) |
LENi |
32 |
0 – (232–1) |
DRi |
16 |
0 – 65 535 |
FLi |
8 |
Xem bảng B.7 |
B.1.7 Khung nhập dữ liệu chia sẻ
Loại khung: 'SDAT (0x73646174)
Ngăn chứa: Tệp tin
Trường bắt buộc: Không
Số lượng: Bất kể số nào
Vị trí: bất kể vị trí nào sau khung tiêu đề ảnh phức hợp
Khung nhập dữ liệu chia sẻ chứa một trường nhận dạng và dữ liệu chia sẻ, có thể lặp lại nhiều lần trong tệp tin. Một ví dụ về dữ liệu chia sẻ là khung tiêu đề JP2. Không sao chép khung mỗi khi nó được sử dụng, tham chiếu đến khung được sử dụng. Tham chiếu dữ liệu có trong khung tham chiếu dữ liệu chia sẻ. Khi tham chiếu này được đếm, khung được thay thế bởi khung dữ liệu chia sẻ với ký hiệu nhận biết được sử dụng trong khung tham chiếu dữ liệu chia sẻ.
Loại khung tham chiếu dữ liệu chia sẻ phải ký hiệu là 'SDAT (0x73646174). Khung này chứa các trường sau:
Hình B.6 - Sắp xếp các nội dung của khung nhập chia sẻ dữ liệu
ID: Trường Nhận dạng. Trường này quy định nhận dạng cho các dữ liệu được chia sẻ trong khung và được mã hóa theo kiểu số nguyên không dấu 2-byte.
SharedData: Trường này chứa khung được sử dụng nhiều nơi trong tệp tin.
Bảng B.9 Định dạng nội dung của khung trường chia sẻ
Tên trường |
Kích thước (các bít) |
Giá trị |
ID |
16 |
0 - 65 535 |
Dữ liệu chia sẻ |
Tùy biến |
Tùy biến |
B.1.8 Khung tham chiếu dữ liệu chia sẻ
Loại khung: 'sref' (0x73726566)
Ngăn chứa: không giới hạn
Trường bắt buộc: Không
Số lượng: Bất kể số nào
Vị trí: bất kể vị trí sau khung nhập dữ liệu chia sẻ với cùng ID
Khung tham chiếu dữ liệu chia sẻ chứa một tham chiếu đến các dữ liệu được chia sẻ để được sử dụng hoặc chèn tại điểm trong tệp tin nơi khung tham chiếu dữ liệu chia sẻ xuất hiện. Khi gặp phải một khung tham chiếu dữ liệu chia sẻ, nó được thay thế bởi các dữ liệu được chia sẻ từ khung nhập dữ liệu chia sẻ với một giá trị số nhận dạng (ID).
Bất kỳ độ lệch trong tệp tin hiểu được được áp dụng trước khi bất kỳ hàm ý thay thế bởi tham chiếu dữ liệu chia sẻ. Loại khung tham chiếu dữ liệu chia sẻ phải ký hiệu là 'sref' (0x73726566). Khung này chứa các trường sau đây:
ID
Hình B.7 - Tổ chức các nội dụng của khung tham chiếu dữ liệu chia sẻ
ID: Trường nhận dạng. Trường này quy định một số để nhận dạng duy nhật việc dữ liệu chia sẻ được sử dụng. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu 2 byte. Điều này là một tham chiếu tới dữ liệu chia sẻ trong khung nhập dữ liệu chia sẻ có cùng giá trị trường ID.
Bảng B.10 - Định dạng các nội dung của khung tham chiếu dữ liệu chia sẻ
Tên trường |
Kích thước (các bít) |
Giá trị |
ID |
16 |
0 - 65 535 |
B.2 Khung cấp độ trang
B.2.1 Khung trang (Siêu khung)
Loại khung: 'page' (0x70616765)
Ngăn chứa: Tệp tin
Trường bắt buộc: phải có
Số lượng: tối thiểu bằng 1
Vị trí: bất kể vị trí nào sau khung tiêu đề ảnh phức hợp
Khung trang là siêu khung chứa thông tin về trang trong đó các đối tượng trình bày đã được kết xuất, tiếp theo là các đối tượng trình bày tạo nên các nội dung của trang.
Loại khung trang là (0x70616765). Khung này chứa trường sau:
Hình B.8 - Tổ chức các nội dung của một khung trang
PHDR: Trường Khung tiêu đề trang. Trường này chứa khung tiêu đề đối tượng trình bày theo quy định tại Điều B.2.1.1
PPCLoc: Trường Khung bộ định vị tập trang cơ sở. Khung này chứa khung bộ định vị tập trang theo quy định tại Điều B.1.6.1. Đây là trường bắt buộc, ngoại trừ trong trường hợp một trang đơn, tệp tin JPM khép kín thì khi đó không bắt buộc.
Res: Trường Khung phân giải. Trường này chứa thể chứa khung phân giải theo quy định tại Điều I.5.3.7 của ISO/IEC 15444-1. Khung này đưa ra độ phân giải của bộ lưới tọa độ trang. Cùng với chiều cao và chiều rộng trang trong khung tiêu đề trang, khung phân giải quy định kích thước vật lý của trang.
BCLR Trường Khung màu gốc. Trường tuỳ chọn này có thể chứa khung màu gốc như quy định tại Điều B.6.1. Khung màu gốc được quy định trong khung trang khi giá trị của trường PColour của khung tiêu đề trang bằng 255. Trong khung trang thì khung màu gốc quy định màu được ứng dụng trước khi kết xuất bất kỳ đối tượng vào trong trang.
Metadata Trường Khung dữ liệu đặc tả tùy chọn.
Label Trường Nhãn khung. Trường này chứa thể chứa khung nhãn theo quy định tại Điều B.6.3. Khung này chứa nhãn liên kết với trang; khung này là tùy chọn.
Lobj Trường Khung Đối tượng trình bày i, tại i = 0, NLobj-1; khung đối tượng trình bày được quy định tại Điều B.3.1. NLobj là số các đối tượng trình bày trong trang này và được quy định trong khung tiêu đề trang chứa trong khung này.
B.2.1.1 Khung tiêu đề trang
Loại khung: 'phdr (0x70686472)
Ngăn chứa: Trang khung
Trường bắt buộc: phải có
Số lượng: Đúng bằng một
Vị trí: khung đầu tiên trong khung trang
Khung tiêu đề trang quy định số các đối tượng trình bày trên trang và mô tả chiều cao, chiều rộng, định hướng và màu của trang.
Loại khung tiêu đề trang là 'phdr' (0x70686472). Khung này chứa các trường sau đây:
Hình B.9 - Cấu tạo nội dung của khung tiêu đề trang
Nlobj: Trường Số lượng các đối tượng trên trang này. Giá trị này được lưu trữ theo kiểu số nguyên không dấu bít đầu to 2-byte.
PHeight: Trường Chiều cao trang. Trường này chỉ ra chiều cao, trong các bộ lưới tọa độ trang và trước khi bất kỳ việc quay trang, của vùng trên các đối tượng trình bày trên trang này sẽ được kết xuất (rendered). Giá trị này được lưu trữ theo kiểu số nguyên không dấu bít đầu to 4-byte.
PWidth: Trường Chiều rộng trang. Trường này chỉ ra chiều rộng, trong các bộ lưới tọa độ trang và trước khi bất kỳ việc xoay trang, của vùng trên các đối tượng trình bày trên trang này sẽ được kết xuất. Giá trị này được lưu trữ theo kiểu số nguyên không dấu bít đầu to 4-byte.
OR: Trường Định hướng trang. Trường này quy định việc định hướng trang. Giá trị bằng kiểu lưu trữ số nguyên không dấu bít đầu to 2-byte. Các giá trị được quy định trong bảng sau đây:
Bảng 11: Giá trị hợp lệ OR
Giá trị |
Ý nghĩa |
0 |
Không quy định việc định hướng |
1 |
Xoay 0 ° theo chiều kim đồng hồ với một ảnh đọc đúng |
2 |
Xoay 90 ° theo chiều kim đồng hồ với một ảnh đọc đúng |
3 |
Xoay 180 ° theo chiều kim đồng hồ với một ảnh đọc đúng |
4 |
Xoay 270 ° theo chiều kim đồng hồ với một ảnh đọc đúng |
Giá trị khác |
Tất cả các giá trị khác được cho trước |
PColour: Trường Màu trang. Trường này chỉ thị màu bất kể trang này là trong suốt, trong trường hợp các đối tượng trình bày được tạo ảnh vào bất kể những gì có sẵn trong các vùng bao của trang hoặc bất kể trang có một màu, trong trường hợp này, màu trang được áp dụng ở mọi nơi trong các vùng bao của trang và sau đó các đối tượng trình bày được tạo ảnh lên trang. Giá trị của trường này là kiểu lưu trữ số nguyên không dấu bít đầu to 2-byte. Giá trị được quy định trong bảng như sau:
Bảng B.12 - Giá trị trường Pcolor (màu trang) hợp lệ
Giá trị |
Ý nghĩa |
0 |
Trang trong xuốt |
1 |
Trang màu trắng |
2 |
Trang màu đen |
255 |
Trang màu được quy định dựa trên khung màu gốc (Điều B.6.1) |
Giá trị khác |
Tất cả các giá trị khác được đặt trước |
Bảng B.13 - Định dạng các nội dung của khung tiêu đề trang
Tên trướng |
Kích thước (các bít) |
giá trị |
NLobj |
16 |
0 - 65 535 |
PHeight |
32 |
1 - (232-1) |
PWidth |
32 |
1 - (232-1) |
OR |
16 |
Xem bảng B.11 |
PColour |
16 |
Xem bảng B.12 |
B.3 Khung cấp độ đối tượng trình bày
B.3.1 Khung đối tượng trình bày (siêu khung)
Loại khung: 'lobj (0x6C6F626A)'
Ngăn chứa: Khung trang
Trường bắt buộc: phải có
Số lượng: Số bất kỳ
Vị trí: bất kể vị trí nào sau khung tiêu đề trang
Khung đối tượng trình bày chứa các thông tin cần thiết để xác định vị trí và tổng hợp một ảnh và mặt nạ tùy chọn vào trên một trang. Khung đối tượng trình bày chứa các khung tiêu đề đối tượng trình bày, dữ liệu đặc tả (metadata) tùy chọn, và khung tiêu đề đối tượng (dữ liệu ảnh) và khung tiêu đề đối tượng tùy chọn (cho dữ liệu mặt nạ).
Loại khung đối tượng trình bày phải có giá trị 'lobj' (0x6C6F626A). Khung này chứa các trường sau đây:
Hình B.10 - Tổ chức các nội dung của khung đối tượng trình bày
LHDR: Trường Khung tiêu đề đối tượng trình bày. Trường này chứa một khung tiêu đề đối tượng trình bày theo quy định tại điều B.3.1.1.
Metadata: Trường Khung dữ liệu đặc tả tùy chọn.
Label: Trường Khung nhãn. Trường này chứa thể chứa khung nhãn theo quy định tại điều B.6.3. Khung này chứa một nhãn kết hợp với một trang; khung nhãn là tùy chọn.
OBJ0: Trường Khung đối tượng; khung đối tượng đầu tiên. Trường này chứa khung đối tượng theo quy định tại điều B.4.1.
OBJ1: Trường Khung đối tượng; khung đối tượng thứ hai. Trường này chứa khung đối tượng theo quy định tại điều B.4.1; khung này là tùy chọn.
B.3.1.1 Khung tiêu đề đối tượng trình bày
Loại khung: 'lhdr (0x6C686472)
Ngăn chứa: khung đối tượng trình bày
Trường bắt buộc: phải có
Số lượng: Đúng bằng một
Vị trí: khung đầu tiên trong khung đối tượng trình bày
Khung này đưa ra trường nhận dạng đối tượng trình bày (duy nhất trong trang), chiều cao (trong bộ lưới tọa độ trang), chiều rộng (trong bộ lưới tọa độ trang), độ lệch tương ứng với trang và kiểu đối tượng trình bày.
Loại Khung tiêu đề đối tượng trình bày phải ký hiệu là 'lhdr' (0x6C686472). Khung này chứa các trường sau:
Hình B.11 - Tổ chức các nội dung Khung tiêu đề đối tượng trình bày
LObjID: Trường Nhận dạng đối tượng trình bày. Mỗi đối tượng trình bày trong một khung trang cho trước có giá trị LObjID duy nhất và đối tượng trình bày bên trong khung trang phải sắp xếp theo thứ tự tăng giá trị LObjID. Nếu trang không chứa hình thu nhỏ của trang thì dải các giá trị trường LObjID từ 1 đến Nlobj, với NLobj được xác định trong khung tiêu đề trang trong khung trang. Nếu trang chứa hình thu nhỏ của trang thì các giá trị LObjID cho việc chứa các khung đối tượng trình bày có dải từ 0 đến NLobj-1, với một giá trị LObjID bằng 0 thì xác định đối tượng hình thu nhỏ của trang (xem điều 5.2.4). Giá trị này được lưu trữ theo kiểu số nguyên không dấu đầu to 2-byte.
LHeight: Trường Chiều cao đối tượng trình bày. Trường này chỉ ra chiều cao, trong các bộ lưới tọa độ trang, các đối tượng trình bày trước khi xoay trang. Giá trị này được lưu trữ theo kiểu số nguyên không dấu đầu to 4-byte.
LWidth: Trường Chiều rộng đối tượng trình bày. Trường này chỉ ra chiều rộng, theo bộ lưới tọa độ trang các đối tượng trình bày trước khi xoay trang. Giá trị này được lưu trữ theo kiểu số nguyên không dấu đầu to 4-byte.
LVoff: Trường Trình bày độ lệch dọc. Trường này chỉ ra độ lệch dọc bắt đầu trong bộ lưới tọa độ trang của đối tượng trình bày. Giá trị này được lưu trữ theo kiểu số nguyên không dấu đầu to 4-byte.
LHoff: Trường trình bày độ lệch ngang. Trường này chỉ ra độ lệch ngang bắt đầu trong bộ lưới tọa độ trang của đối tượng trình bày. Giá trị này được lưu trữ theo kiểu số nguyên không dấu đầu to 4-byte.
Style Trường Loại đối tượng trình bày. Trường này chỉ ra các loại đối tượng trình bày. Đối tượng trình bày bao gồm ảnh cả đơn hay một cặp đơn ảnh và một mặt nạ. Ảnh và mặt nạ của đối tượng trình bày có thể bao gồm hai đối tượng riêng biệt, mặt nạ có thể là thành phần cuối cùng của đối tượng ảnh. Giá trị bằng số nguyên không dấu 1 byte. Giá trị được định nghĩa trong bảng như sau:
Bảng B.14 - Giá trị kiểu hợp lệ
Giá trị |
Ý nghĩa |
0 |
Các đối tượng riêng biệt cho các thành phần ảnh và mặt nạ. |
1 |
Đối tượng đơn cho các thành phần ảnh và mặt nạ. |
2 |
Đối tượng đơn cho các thành phần ảnh (không có mặt nạ). |
3 |
Đối tượng đơn đối với mặt nạ thành phần (không có ảnh). |
255 |
Đối tượng trình bày được người dùng quy định. |
Giá trị khác |
Tất cả các giá trị khác được đặt trước |
Bảng B.15 - Định dạng nội dung của lớp khung tiêu đề đối tượng trình bày
Tên trường |
Kích thước (các bít) |
Giá trị |
LObjID |
16 |
0 – 65 535 |
LHeight |
32 |
0 – (232–1) |
LWidth |
32 |
0 – (232–1) |
LVoff |
32 |
0 – (232–1) |
LHoff |
32 |
0 – (232–1) |
Style |
8 |
Xem bảng B.14 |
B.4 Khung cấp độ đối tượng
B.4.1 Khung đối tượng (siêu khung)
Loại khung: 'objc' (0x6F626A63)
Ngăn chứa: khung đối tượng trình bày
Trường bắt buộc: phải có
Số lượng: ít nhất là một trình bày trong mỗi khung đối tượng trình bày
Vị trí: bất kể vị trí nào sau khung tiêu đề đối tượng trình bày
Khung đối tượng là một siêu khung chứa thông tin về các đối tượng.
Loại khung đối tượng phải ký hiệu là 'objc' (0x6F626A63). Khung này chứa các trường sau đây:
Hình B.12 - Tổ chức các nội dung của khung đối tượng
OHDR: Trường Khung tiêu đề đối tượng. Trường này chứa Khung tiêu đề đối tượng theo quy định tại điều B.4.1.1.
BCLR Trường Khung màu gốc tùy chọn. Trường tùy chọn này có thể chứa khung màu gốc theo quy định tại điều B.6.1. Khung màu gốc nằm trong khung đối tượng được sử dụng để quy định các giá trị được sử dụng trong vùng bao của đối tượng trình bày thuộc vùng nơi không có trong ảnh được xác định. Trường này gồm trường hợp trường NoCodestream đối tượng bằng 1, khi ảnh đối tượng đã chia tỷ lệ và đã định vị trí có kích thước nhỏ hơn so với đối tượng trình bày.
Metadata: Trường Khung dữ liệu đặc tả tùy chọn.
Label: Trường Khung nhãn tùy chọn. Trường tùy chọn này có thể chứa khung nhãn theo quy định tại điều B.6.3. Khung này chứa nhãn liên kết với trang.
Scale: Trường Khung chia tỷ lệ đối tượng tùy chọn. Trường tùy chọn này có thể chứa khung chia tỷ lệ đối tượng theo quy định tại điều B.4.1.2. Nó quy định việc chia tỷ lệ cho các đối tượng trước khi áp dụng vào trang.
JP2HDR: Trường Khung tiêu đề JP2 tùy chọn. Luôn tồn tại nếu trường NoCodestream trong Khung tiêu đề đối tượng bằng 0. Trường tùy chọn này có thể chứa khung tiêu đề JP2 theo quy định tại điều B.4.1.3.
B.4.1.1 Khung tiêu đề đối tượng
Loại khung: 'ohdr' (0x6F686472)
Ngăn chứa: Khung đối tượng
Trường bắt buộc: Phải có
Số lượng: Đúng bằng một
Vị trí: Khung đầu tiên trong khung đối tượng
Khung này chứa các trường mô tả các tính thuộc tính chung của đối tượng. Các trường gồm: ObjType (nếu đối tượng này chỉ được sử dụng cho mặt nạ loại '0', chỉ cho ảnh có giá trị bằng '1', cho cả ảnh và mặt nạ có giá trị bằng '2'), NoCodestream (Nếu giá trị của tham số này bằng '1' thì đối tượng này là một màu duy nhất được quy định bởi khung màu gốc trong khung đối tượng), OHoff (độ lệch ngang theo bộ lưới tọa độ trang), OVoff (độ lệch dọc theo độ phân giải bộ lưới tọa độ trang) và tham chiếu đến dữ liệu dòng mã cho các đối tượng và chiều dài của bảng phân mảnh hoặc khung dòng mã liên tục.
Loại của khung tiêu đề đối tượng phải ký hiệu là 'ohdr' (0x6F686472). Khung này chứa các trường sau đây:
Hình B.13 Tổ chức các nội dung của đối tượng khung tiêu đề
ObjType: Trường Loại đối tượng. Trường này quy định đối tượng mặt nạ hoặc đối tượng ảnh trong các đối tượng trình bày. Giá trị theo kiểu số số nguyên không dấu bít đầu to 1-byte. Giá trị được quy định trong bảng sau:
Bảng B.16 Giá trị trường ObjType (loại đối tượng) hợp lệ
Giá trị |
Ý nghĩa |
0 |
Đối tượng chứa mặt nạ của đối tượng trình bày |
1 |
Đối tượng chứa ảnh của đối tượng trình bày |
2 |
Đối tượng chứa ảnh và mặt nạ của đối tượng trình bày |
Giá trị khác |
Tất cả các giá trị khác được dành riêng |
NoCdstrm: Trường này xác định bất kể đối tượng có chứa hay không một dòng mã nén. Nếu đối tượng không chứa dòng mã, không có ảnh cho đối tượng này và một "ảnh" với một giá trị màu đơn sắc đồng nhất như được quy định trong khung màu gốc. Giá trị theo kiểu lưu trữ số nguyên không dấu bít đầu to 1 byte. Giá trị được mô tả trong bảng sau:
Bảng B.17 - Giá trị trường NoCdstm hợp lệ
Giá trị |
Ý nghĩa |
0 |
Các đối tượng chứa một dòng mã |
1 |
Đối tượng không chứa dòng mã |
Giá trị khác |
Tất cả các giá trị khác được đặt trước |
OVoff: Trường Độ lệch dọc trong đối tượng đã định tỷ lệ; độ lệch dọc trong đối tượng đã định tỷ lệ trong bộ lưới tọa độ trang. Trường này theo kiểu lưu trữ số nguyên không dấu bít đầu to 4-byte. Nếu trường NoCodestream có giá trị bằng 1, trường này được bỏ qua.
OHoff: Trường Độ lệch ngang trong đối tượng đã định tỷ lệ; Độ lệch ngang trong đối tượng đã định tỷ lệ trong bộ lưới tọa độ trang. Trường này theo kiểu lưu trữ số nguyên không dấu bít đầu to 4-byte. Nếu trường NoCodestream có giá trị bằng 1 trường này được bỏ qua.
OFF: Trường Độ lệch. Trường này quy định độ lệch tệp tin từ bắt đầu của dòng mã liên tục hoặc khung bảng phân mảnh được liên kết với ảnh của đối tượng này. Các dòng mã hoặc khung bảng phân mảnh liên tục được sử dụng để truy cập vào dòng mã hiện tại. Độ lệch là giá trị tương quan đến các byte đầu của tệp tin. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu bít đầu to 8-byte. Nếu trường NoCodestream có giá trị bằng 1, trường này sẽ bị bỏ qua.
LEN: Trường Độ dài của dòng mã liên tục hay của khung bảng phân mảnh. Giá trị này chỉ bao gồm các dữ liệu hiện tại và không có bất kỳ tiêu đề của việc khung đóng (encapsulating). Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu bít đầu to 4-byte. Nếu giá trị bằng 0, thì chiều dài của dòng mã liên tục hoặc khung bảng phân mảnh được bỏ qua. Nếu trường NoCodestream có giá trị bằng 1, trường này được bỏ qua.
DR Trường Tham chiếu dữ liệu. Trường này quy định tệp tin dữ liệu hoặc tài nguyên chứa các khung bảng phân mảnh. Nếu giá trị của trường này bằng 0, thì mảnh chứa trong tệp tin này dữ liệu sẽ được chứa trong khung dòng mã liên tục trong tệp tin. Nếu giá trị khác không, thì các khung mảnh được chứa trong các tệp tin được quy định bởi chỉ số này vào khung tham chiếu dữ liệu. Trường này được mã hóa theo kiểu số nguyên không dấu bít đầu to 2-byte. Nếu trường NoCodestream có giá trị bằng 1, trường này được bỏ qua.
Bảng B.18 - Định dạng nội dung của Khung tiêu đề đối tượng
Tên trường |
Độ lớn (các bít) |
Giá trị |
ObjType |
8 |
Xem bảng B.16 |
NoCdstrm |
8 |
Xem bảng B.17 |
OVoff |
32 |
0 – (232–1) |
OHoff |
32 |
0 – (232–1) |
OFF |
64 |
0 – (264–1) |
LEN |
32 |
0 – (232–1) |
DR |
16 |
0 – 65 535 |
B.4.1.2 Khung chia tỷ lệ đối tượng
Loại khung: 'scal' (0x7363616C)
Ngăn chứa: khung đối tượng
Trường bắt buộc: không
Số lượng: Tối đa là một trong mỗi khung đối tượng
Vị trí: bất kể vị trí nào sau Khung tiêu đề đối tượng
Khung đối tượng tùy chọn tồn tại khi trường NoCodestream của Khung tiêu đề đối tượng trong các khung chứa đối tượng bằng 0. Nếu khung chia tỷ lệ đối tượng không tồn tại trong khung đối tượng thì tỷ số chia đối tượng của chiều dọc và ngang được giả định bằng 1, tức là, không chia tỷ lệ. Khung này mô tả yêu cầu chia tỷ lệ từ đơn vị đối tượng sang các đơn vị lưới tọa độ trang. Chia tỷ lệ này này phải được sử dụng trước khi áp dụng các đối tượng vào trang.
Chia tỷ lệ dọc là bởi tỷ lệ , và chia tỷ lệ ngang là bởi tỷ lệ . Xem điều 5.2.3 mô tả đầy đủ về chia tỷ lệ
Loại đối tượng quy mô khung phải ký hiệu là ‘scal’ (0x7363616C). Khung này chứa các trường sau đây:
VRN VRD HRN VRD
Hình B.14 - Tổ chức các nội dung của khung tiêu đề đối tượng
VRN: Trường Tử số tỷ lệ dọc; tham số này được mã hóa theo kiểu số nguyên không dấu bít đầu to 2-byte.
VRD: Trường Mẫu số tỷ lệ dọc; tham số này được mã hóa theo kiểu số nguyên không dấu bít đầu to 2-byte.
HRN: Trường Tử số tỷ lệ ngang; tham số này được mã hóa theo kiểu số nguyên không dấu bít đầu to 2-byte.
HRD: Trường Mẫu số tỷ lệ ngang; tham số này được mã hóa theo kiểu số nguyên không dấu bít đầu to 2-byte.
Bảng B.19 - Định dạng các nội dung của khung chia tỷ lệ đối tượng
Tên trường |
Độ lớn (các bít) |
Giá trị |
VRN |
16 |
1 - 65 535 |
VRD |
16 |
1 - 65 535 |
HRN |
16 |
1 - 65 535 |
HRD |
16 |
1 - 65 535 |
B.4.1.3 Khung tiêu đề JP2 trong khung đối tượng
Loại khung: 'jp2h' (0x6A70 3268')
Ngăn chứa: khung đối tượng
Trường bắt buộc: không
Số lượng: tối đa bằng một; luôn luôn tồn tại nếu trường NoCodestream trong khung tiêu đề đối tượng bằng 0.
Định dạng và tổ chức của khung tiêu đề JP2 được quy định tại điều B.6.2.
Khung tiêu đề JP2 tồn tại trong khung đối tượng khi trường NoCodestream của Khung tiêu đề đối tượng trong khung chứa đối tượng bằng 0. Trong khung đối tượng của tệp tin JPM, có một và duy nhất khung tiêu đề JP2.
B.5 Khung phần tử dòng mã JP2
B.5.1 Khung bảng phân mảnh (superbox)
Loại khung: 'scal' (0x7363616C)
Ngăn chứa: tệp tin
Trường bắt buộc: không
Số lượng: số tùy chọn
Vị trí: bất kể vị trí nào sau khung tệp tin
Khung bảng phân mảnh quy định vị trí của một trong những dòng mã trong tệp tin JPM. Tệp tin có thể chứa số không hay nhiều khung bảng phân mảnh. Với mục đích đánh số các dòng mã, khung bảng phân mảnh sẽ được coi là tương đương với một khung dòng mã. Khung bảng phân mảnh sẽ được tìm thấy chỉ ở mức đỉnh của các tệp tin, và sẽ không được tìm thấy trong dữ liệu đặc tả.
Loại Khung bảng phân mảnh phải ký hiệu là 'ftbl' (0x6674626C). Khung này chứa trường sau đây:
flst: Trường Danh sách phân mảnh. Trường này chứa khung danh sách phân mảnh như quy định tại điều B.5.2.
Hình B.15 - Tổ chức nội dung của khung bảng phân mảnh
B.5.1.1 Khung danh sách phân mảnh
Loại khung: 'flst (0x666C7374)
Ngăn chứa: khung Tham chiếu chéo và khung bảng phân mảnh
Trường bắt buộc: phải có
Số lượng: Đúng bằng một
Vị trí: bất kể ví trị nào
Khung danh sách phân mảnh quy định vị trí, chiều dài và trật tự của mỗi mảnh đó, sự kết hợp, tạo thành dòng dữ liệu hợp lệ và đầy đủ. Tùy thuộc vào khung đó chứa danh sách phân mảnh cụ thể, dạng dòng dữ liệu hoặc là dòng mã (nếu khung danh sách phân mảnh được chứa trong khung bảng phân mảnh) hoặc chia sẻ các tiêu đề hoặc dữ liệu đặc tả (nếu khung danh sách phân mảnh được chứa trong khung tham chiếu chéo).
Nếu khung danh sách phân mảnh này chứa trong khung bảng phân mảnh (do chúng xác định vị trí của dòng mã), sau đó độ lệch danh sách phân mảnh đầu sẽ trỏ trực tiếp đến các byte đầu của dữ liệu dòng mã; nó không chỉ là tiêu đề của khung mà còn chứa mảnh dòng mã đầu tiên.
Nếu khung danh sách phân mảnh này được chứa trong khung tham chiếu chéo (do nó xác định vị trí của tiêu đề chia sẻ hoặc dữ liệu đặc tả), thì độ lệch trong danh sách phân mảnh sẽ trỏ đến các byte đầu của nội dung của khung tham chiếu; điều này sẽ không trỏ tới tiêu đề của khung được tham chiếu. Tuy nhiên, nếu khung được tham chiếu là tổ hợp khung thì độ lệch mảnh đầu trỏ đến khung tiêu đề của khung đầu tiên được chứa trong tổ hợp khung đó.
Với tất cả các độ lệch khác trong khung danh sách phân mảnh, độ lệch sẽ trỏ trực tiếp đến các byte đầu của dữ liệu mảnh và loại các tiêu đề của khung chứa mảnh.
Loại khung danh sách phân mảnh phải ký hiệu là 'flst' (0x666C7374). Khung này chứa các trường sau đây:
Hình B.16 - Tổ chức các nội dung của khung danh sách phân mảnh
NF: Trường Số lượng mảnh. Trường này chỉ định số mảnh được dùng để chứa các dòng dữ liệu. Số các tuples {OFF, LEN, DR} trong khung danh sách phân mảnh sẽ bằng số lượng giá trị của trường NF.
OFFi: Trường Độ lệch. Trường này quy định độ lệch tới tiêu đề của mảnh trong tệp tin. Độ lệch tương ứng với các byte đầu của tệp tin (byte đầu của trường chiều dài của khung ký số JPEG 2000). Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu bít đầu to 8-byte. Chỉ mảnh đầu tiên trong danh sách phân mảnh chứa trong khung tham chiếu chéo sẽ trỏ đến các byte đầu tiên của khung tiêu đề.
LENi: Trường Chiều dài của mảnh. Trường này quy định chiều dài của mảnh. Giá trị này bao gồm một dữ liệu hiện tại và không phải tiêu đề của khung đóng gói. Trường này được mã hóa theo kiểu lưu trữ số nguyên không dấu bít đầu to 4-byte..
DRi: Trường Tham chiếu dữ liệu. Trường này quy định các tệp tin dữ liệu hoặc nguồn tài nguyên chứa mảnh. Nếu giá trị của trường này bằng 0 thì các phân mảnh được chứa trong tệp tin này. Nếu giá trị khác không thì các phân mảnh được chứa trong các tệp tin được quy định bởi chỉ số này trong khung tham chiếu dữ liệu. Trường này được mã hóa theo kiểu số nguyên không dấu bít đầu to 2-byte.
Bảng B.20 - Định dạng các nội dung của khung danh sách phân mảnh
Tham số |
Độ lớn (các bít) |
Giá trị |
NF |
16 |
0 – 65 535 |
OFFi |
64 |
12 – (264–1) |
LENi |
32 |
0 – (232–1) |
DRi |
16 |
0 – 65535 |
B.5.2 Khung dữ liệu truyền thông
Loại khung: 'mdat' (0x6D646174)
Ngăn chứa: tệp tin
Trường bắt buộc: phải có
Số lượng: số bất kỳ
Vị trí: bất kể vị trí nào sau loại khung loại tệp tin
Khung dữ liệu truyền thông chứa mảnh dòng mã JPEG 2000 hoặc dữ liệu truyền thông khác. Trong mọi trường hợp, điều này phải có các khung khác trong tệp tin mà quy định ý nghĩa của dữ liệu trong khung dữ liệu truyền thông. Các ứng dụng này không truy cập các khung dữ liệu truyền thông trực tiếp, nhưng thay vì sử dụng bảng phân mảnh để xác định những phần trong khung dữ liệu truyền thông thể hiện một dòng mã JPEG 2000 hợp lệ hoặc dòng truyền thông khác.
Loại khung dữ liệu truyền thông phải ký hiệu là ‘mdat' (0x6D646174). Nội dung của khung dữ liệu truyền thông không quy định bởi tiêu chuẩn này.
B.5.3 Khung dòng mã liên tục
Loại khung: 'jp2c' (0x6A703263)
Ngăn chứa: tệp tin
Trường bắt buộc: không
Số lượng: số bất kỳ
Vị trí: bất kể vị trí nào sau loại khung loại tệp tin
Định dạng và cấu trúc của khung dòng mã liên tục được quy định trong điều I.5.4 của ISO/IEC 15444-1.
B.6 Khung tổng quát
B.6.1 Khung màu gốc (siêu khung)
Loại khung: 'bclr'(0x62636C72)
Ngăn chứa: khung trang hoặc khung đối tượng
Trường bắt buộc: không
Số lượng: nhiều nhất bằng một
Vị trí: bất kể ví trị nào trong khung trang sau khung tiêu đề trang hoặc trong khung đối tượng sau khung tiêu đề đối tượng.
Khung màu gốc là siêu khung quy định màu gốc cho đối tượng ảnh hoặc trang.
Loại khung màu gốc 'bclr' (0x62636C72). Trường khung dữ liệu là:
Hình B.17 - Cấu tạo nội dung của khung màu gốc
BCVL: Trường Khung giá trị màu gốc. Khung này quy định các giá trị thành phần riêng lẻ cho màu cơ bản cùng với một số thông tin bổ sung.
COLR: Trường Khung đặc tính màu. Khung này quy định không gian màu của màu gốc. Cấu trúc của khung màu được quy định tại điều B.6.2.2.
BPCC: Trường Khung số bít trên mỗi thành phần. Khung này quy định độ sâu bít trong mỗi thành phần trong ảnh. Trường này bao gồm khung số bít trên mỗi thành phần theo quy định tại Điều I.5.3.2 của ISO/IEC 15444-1 của tiêu chuẩn này. Nếu độ sâu bít của tất cả thành phần trong ảnh là như nhau (trong cả hai dấu hiệu và độ chính xác), thì khung này không tìm thấy được. Trường hợp khác, khung này quy định độ sâu bít của mỗi thành phần riêng biệt.
B.6.1.1 Khung giá trị màu gốc
Loại khung: 'bcvl'(0x6263766C)
Ngăn chứa: khung màu gốc
Trường bắt buộc: phải có
Số lượng: đúng bằng một
Vị trí: bất kể ví trị nào
Khung giá trị màu gốc quy định giá trị thành phần riêng lẻ cho các màu gốc cùng với thông tin liên quan đến độ sâu bít cho các thành phần.
Loại của Khung màu gốc phải ký hiệu là 'bcvl' (0x6263766C). Khung chứa các trường sau đây:
Hình B.18 - Cấu tạo nội dung khung giá trị màu gốc
NC: Trường Số thành phần. Tham số này quy định số lượng các thành phần trong dòng mã và được lưu trữ theo kiểu số nguyên không dấu bít đầu to 2-byte.
BPC: Trường Số bít trên mỗi thành phần. Tham số này quy định độ sâu bít của các thành phần trong ảnh, và được lưu trữ như là trường 1-byte. Nếu độ sâu bít và các dấu hiệu là giống nhau với tất cả các thành phần, thì tham số này quy định độ sâu bít. Nếu các thành phần khác nhau về độ sâu bít hoặc dấu hiệu, thì giá trị của trường này sẽ bằng 255 và khung màu gốc cũng sẽ chứa khung bít trên mỗi phần tử quy định độ dài của thành phần (theo quy định tại điều I.5.3.2 của ISO/IEC 15444-1). Nếu 7-bít giá trị thấp chỉ thị độ sâu bít của các thành phần. Bít cao sẽ chỉ thị bất kể các thành phần là có dấu hoặc không dấu. Nếu bít cao bằng 1, thì các thành phần chứa giá trị có dấu. Nếu bít cao bằng 0, thì các thành phần chứa giá trị dấu. Các giá trị hợp lệ của trường này được mô tả trong bảng B.22:
Bảng B.21 - Giá trị hợp lệ BPC
Giá trị (các bít) MSB LSB |
Ý nghĩa |
x000 0000 – x000 1111 |
Thành phần độ sâu bít = giá trị + 1. Từ 1 đến 16 bít (đếm dấu hiệu, nếu hợp lý). |
0xxx xxxx |
Các thành phần là các giá trị không dấu. |
1xxx xxxx |
Các thành phần là các giá trị có dấu. |
1111 1111 |
Các thành phần thay đổi theo chiều sâu số và/hoặc có dấu |
Giá trị khác |
Dành riêng cho việc sử dụng tiêu chuẩn ISO |
Valuei: Trường Giá trị của các thành phần màu gốc riêng biệt. Mỗi giá trị được thể hiện bởi 2-byte lớn về cuối ký nguyên.
Bảng B.22 - Định dạng các nội dung của khung giá trị màu gốc
Tên trường |
Độ lớn (bít) |
Giá trị |
NC |
16 |
1 – 16 384 |
BPC |
8 |
Xem bảng B.21 |
Valuei |
16 |
0 – 65 535 |
DRi |
16 |
0 – 65 535 |
B.6.2 Khung tiêu đề JP2 (siêu khung)
Loại khung: 'jp2h' (0x6A703268)
Vị trí: tệp tin hoặc khung đối tượng
Định dạng và cấu trúc của khung tiêu đề là giống nhau quy định trong điều I.5 của ISO/IEC 15444 - 1.
Khung tiêu đề JP2 trong tệp tin JPM có thể được tìm thấy ngay sau khung loại tệp tin, điều B.1.2, hoặc trong khung đối tượng, điều B.4.1.
Hình B.19 - Định dạng các nội dung của khung giá trị màu cơ bản
ihdr: Trường Khung tiêu đề ảnh. Khung này quy định các thông tin về đối tượng, như chiều cao và chiều rộng của khung. Cấu trúc của khung được quy định tại điều B.6.2.1. Khung này phải là trường đầu tiên trong khung tiêu đề JP2.
bpcc: Trường Khung số bít trên mỗi thành phần. Khung này quy định độ sâu bít thành phần trong ảnh. Trường này chứa khung bít trên mỗi phần tử theo điều I.5.3.2 của ISO/IEC 15444-1. Nếu độ sâu bít thành phần trong ảnh là như nhau (trong cả hai dấu hiệu và độ chính xác), thì khung này sẽ không được tìm thấy. Nếu không, khung này quy định độ sâu bít của mỗi thành phần riêng lẻ. Khung này có thể tìm thấy dễ dàng trong khung tiêu đề JP2 với điều kiện là phía sau khung tiêu đề ảnh.
colri: Trường Khung đặc tính màu. Khung này quy định các không gian màu của ảnh nén. Cấu trúc của khung được quy định tại điều B.6.2.2. Khung này có thể được thấy ở bất cứ đâu trong khung tiêu đề JP2 cung cấp đi kèm sau khung tiêu đề ảnh.
pclr: Trường Khung bảng màu. Khung này xác định các bảng màu được sử dụng để tạo ra đa thành phần từ một thành phần duy nhất. Trường này chứa khung bảng màu theo quy định tại điều I.5.3.4 của ISO/IEC 15444-1. Khung này có thể được thấy trong khung tiêu đề JP2 cung cấp đi kèm sau khung tiêu đề ảnh
cmap: Trường Khung ánh xạ thành phần. Trường này chứa khung ánh xạ thành phần theo quy định tại điều I.5.3.5 của ISO/IEC 15444-1. Khung này có thể được tìm thấy trong khung tiêu đề JP2 để cung cấp đi kèm sau khung tiêu đề ảnh.
cdef: Trường Khung xác định kênh. Trường này chứa khung xác định kênh quy định tại điều I.5.3.6 của ISO/IEC 15444-1. Khung này có thể được tìm thấy trong khung tiêu đề JP2 cung cấp đi kèm sau khung tiêu đề ảnh.
res: Trường Khung phân giải. Khung này là tùy chọn và được dùng để xác định độ phân giải của ảnh chụp hoặc lưới tọa độ hiển thị mặc định của đối tượng. Trường này chứa khung phân giải theo quy định tại điều I.5.3.7 của ISO/IEC 15444-1. Khung này có thể được hiện thị tùy chọn trong khung tiêu đề JP2 và cung cấp đi kèm sau khung tiêu đề ảnh.
Khung tiêu đề JP2 là siêu khung trong tệp tin JPM, nó phải chứa khung tiêu đề ảnh và khung đặc tính kỹ thuật màu, và có thể chứa khung số bít trên mỗi thành phần, khung bảng màu, khung ánh xạ thành phần, khung xác định kênh và khung độ phân giải.
B.6.2.1 Khung tiêu đề ảnh
Loại khung: 'ihdr' (0x69686472)
Ngăn chứa: khung tiêu đề JP2000
Trường bắt buộc: phải có
Số lượng: đúng bằng một
Vị trí: khung đầu trong khung tiêu đề JP2
Khung này có chiều dài mặc định thông tin chung về đối tượng, ví dụ như kích thước ảnh và số thành phần. Nội dung của khung tiêu đề JP2 sẽ bắt đầu tại khung tiêu đề ảnh. Đối tượng chứa thông tin liên quan giữa khung tiêu đề ảnh và dòng mã đối tượng không phù hợp với tệp tin.
Khung tiêu đề ảnh phải ký hiệu là 'ihdr' (0x69686472) và các nội dung của khung có cấu tạo như sau:
Hình B.20 - Cấu tạo nội dung của khung tiêu đề ảnh
HEIGHT: Trường Độ cao vùng ảnh (Image area height). Giá trị của tham số này chỉ ra độ cao của vùng ảnh. Trường này được lưu trữ theo kiểu số nguyên không dấu bít đầu to 4-byte. Trường này được quy định tại Điều I.5.3.2 của ISO/IEC 15444-1.
WIDTH: Trường Độ rộng vùng ảnh (Image area width). Giá trị của tham số này nêu lên độ rộng của vùng ảnh. Trường này được lưu trữ theo kiểu số nguyên không dấu bít đầu to 4-byte. Trường này được xác định trong Điều I.5.3.2 của ISO/IEC 15444-1.
NC: Trường Số thành phần (Number of components). Tham số này quy định cụ thể số lượng các thành phần trong dòng mã và được lưu trữ theo kiểu số nguyên không dấu bít đầu to 2-byte. Trường này được quy định tại Điều I.5.3.2 của ISO/IEC 15444-1.
BPC: Trường Số bít trên mỗi thành phần. Tham số này quy định độ sâu bít của các thành phần trong ảnh, và được lưu trữ như là trường 1-byte. Nếu độ sâu bít và các dấu hiệu là giống nhau cho tất cả các thành phần, thì tham số này quy định độ sâu bít. Nếu các thành phần khác nhau về độ sâu bít hoặc dấu hiệu, thì giá trị của trường này sẽ bằng 255 và khung màu gốc cũng sẽ chứa khung bít trên mỗi phần tử quy định độ dài của thành phần (theo quy định tại Điều I.5.3.2 của ISO/IEC 15444-1). Nếu 7-bít thấp chỉ thị độ sâu bít của các thành phần. Bít cao chỉ thị độ sâu bít cho dù bất kể thành phần là số có dấu hoặc số không dấu. Nếu bít cao bằng 1, thì các thành phần chứa giá trị có dấu. Bít cao bằng 0, thì các thành phần chứa giá trị không dấu. Các giá trị hợp lệ của trường này được mô tả trong bảng B.21.
C: Trường Loại nén (Compression type). Tham số này quy định các thuật toán nén được sử dụng để nén các dữ liệu ảnh. Loại nén được mã hóa một số nguyên không dấu 1 byte. Xem Bảng B.24 cho các giá trị hợp lệ của loại nén.
UnkC: Trường Không rõ không gian màu. Trường này quy định nếu không gian màu của ảnh được biết đến. Trường này được mã hóa là số nguyên không dấu 1 byte. Giá trị hợp lệ cho trường này bằng 0, nếu không gian màu của ảnh được biết đến và đúng loại được quy định trong khung đặc tính không gian màu trong tệp tin, hoặc bằng 1, nếu không gian màu của ảnh chưa biết đến. Một giá trị bằng 1 sẽ được sử dụng trong các trường hợp như chuyển mã các ảnh kế thừa mà không gian màu hiện tại của dữ liệu ảnh là chưa biết. Giá trị khác 0 và 1 được dành riêng cho việc sử dụng theo tiêu chuẩn ISO. Trường này là giống với quy định tại điều I.5.3.2 của ISO/IEC 15444-1.
IPR: Trường Quyền sở hữu (Intellectual property). Tham số này quy định tệp tin này chứa thông tin quyền sở hữu. Nếu giá trị của trường này bằng 0, ảnh này không chứa thông tin quyền sở hữu. Nếu giá trị bằng 1, thì ảnh phải kết hợp với thông tin quyền sở hữu và do đó chứa khung sở hữu theo quy định tại điều C.2.1. Các giá trị khác được sử dụng cho sử dụng theo tiêu chuẩn ISO. Trường này được quy định tại điều I.5.3.2 của ISO/IEC 15444-1.
Bảng B.23 - Định dạng nội dung của khung tiêu đề ảnh
Tên trường |
Độ lớn (các bít) |
Giá trị |
HEIGHT |
32 |
1-(232–1) |
WIDTH |
32 |
1-(232–1) |
NC |
16 |
1-16 384 |
BPC |
8 |
Theo bảng B.21 |
C |
8 |
Theo bảng B.24 |
UnkC |
8 |
0-1 |
IPR |
8 |
0-1 |
Bảng B.24 - Quy định giá trị khung tiêu đề ảnh
Giá trị |
Ý nghĩa |
0 |
Ứng với không nén. Dữ liệu ảnh được lưu trữ ở định dạng xen kẽ thành phần, mã hóa ở độ sâu bít theo quy định của trường BPC. Giá trị này chỉ cho phép các dòng mã nơi mà tất cả các thành phần được mã hóa cùng một độ sâu bít. Khi độ sâu bít của mỗi thành phần khác 8, các giá trị mẫu phải được đóng thành byte để không bít nào được sử dụng lại giữa các mẫu. Tuy nhiên, mỗi mẫu sẽ bắt đầu trên byte vùng bao và Và các bít đệm có giá trị không phải được chèn vào sau mẫu cuối cùng củng dòng quét là cần thiết để điền vào byte cuối của dòng quét. Các giá trị mẫu xuất hiện theo một thứ tự các thành phần xen kẽ. Khi nhiều giá trị mẫu được đóng gói vào trong một byte, mẫu đầu tiên phải xuất hiện trong các bít có trọng số lớn nhất của byte. Khi một mẫu lớn hơn một byte, bít trọng số lớn nhất của nó phải xuất hiện trong các byte đầu. |
1 |
Ứng với ITU-T T.4, các thuật toán cơ bản được gọi là MH (Modified Huffman). Giá trị này chỉ cho ảnh hai mức nhị phân. |
2 |
Ứng với ITU-T T.4, được gọi là MR (Modified READ). Giá trị này chỉ được cho ảnh hai mức. |
3 |
Ứng với ITU-T T.6, được gọi là MMR (Modified READ). Giá trị này chỉ được cho ảnh hai mức. |
4 |
Ứng với ITU-T T.82 | ISO/IEC 11544. Được gọi là JBIG. Giá trị này chỉ được cho ảnh hai mức. |
5 |
Ứng với ITU-T T.81 | ISO/IEC 10918-1 hay ITU-T T.84 | ISO/IEC 10918-3. Được gọi là chuẩn nén JPEG. Luồng ảnh nén này phải phù hợp với cú pháp của định dạng trao đổi dữ liệu ảnh nén như quy định trong các tiêu chuẩn nói trên. Giá trị này chỉ có được phép cho ảnh đa sắc màu, ảnh xám màu hoặc ảnh màu. |
6 |
Ứng với ITU-T T.87 (JPEG-LS). |
7 |
Ứng với ISO/IEC 15444-1 (JPEG 2000 Part 1). |
8 |
Ứng với ITU-T T.88 (JBIG2) coding. |
9 |
Ứng với ITU-T T.82 | ISO/IEC 11544. Được gọi là JBIG. Giá trị này cho phép cho bất kỳ ảnh được cấp phép bởi các tiêu chuẩn JBIG. |
Giá trị khác |
Ứng với Dành riêng cho Sử dụng theo ISO. |
B.6.2.2 Khung đặc tính màu
Loại khung: 'colr' (0x636F6C72)
Trường bắt buộc: không
Vị trí: bất kể vị trí nào sau khung tiêu đề ảnh trong khung tiêu đề JP2.
Một khung đặc tính màu quy định phương pháp mà ứng dụng của nó có thể giải thích các không gian màu của dữ liệu ảnh nén. Đặc tính màu này được áp dụng cho các dữ liệu ảnh sau khi đã được giải nén và sau thành phần giải tương quan chuyển đổi đã được áp dụng cho dữ liệu.
Khung tiêu đề JP2 trong tệp tin JPM chứa nhiều khung đặc tính màu, nhưng phải có ít nhất một bộ đọc JPM phù hợp sẽ bỏ qua tất cả các khung đặc tính màu sau khung đầu tiên.
Khung đặc tính màu phải ký hiệu là 'colr' (0x636F6C72). Khung này chứa các trường sau đây:
Hình B.21 - Cấu tạo nội dung của khung kỹ thuật màu trong JPM
METH: Trường thuật toán đặc tính (Specification method). Trường này quy định các phương pháp được sử dụng bởi khung đặc tính màu để quy định không gian màu của ảnh. Trường này được mã hóa như số nguyên không dấu 1-byte. Giá trị cho trường này trong tệp tin JPM sẽ bằng 1 hoặc 2, theo quy định tại điều I.5.3.3 của ISO/IEC 15444-1.
PREC: Trường Ưu tiên (Precedence). Trường này được dành riêng cho Sử dụng theo ISO và giá trị sẽ được mặc định bằng 0; Tuy nhiên, bộ đọc phù hợp sẽ bỏ qua giá trị của trường này. Trường này được quy định theo dạng số nguyên không dấu 1 byte.
APPROX: Trường Không gian màu tương đối (approximation). Trường này quy định cụ thể mức độ mà phương pháp mô tả màu gần giống với định nghĩa “chính xác” về không gian màu. Giá trị của trường này sẽ được thiết lập bằng 0; Tuy nhiên, bộ đọc tuân theo sẽ bỏ qua các giá trị của trường này. Các giá trị khác không sẽ dành riêng cho sử dụng tiêu chuẩn ISO khác. Trường này được quy định như một số nguyên không dấu 1 byte.
EnumCS: Trường Không gian màu đã đánh số. Trường này quy định không gian màu của ảnh bằng cách sử dụng mã số nguyên. Để giải thích một cách chính xác màu của ảnh bằng cách sử dụng một đánh số không gian màu, ứng dụng phải hiểu định dạng của không gian màu bên trong. Trường này chứa giá trị theo kiểu số nguyên không dấu bít đầu to 4 byte để chỉ ra các không gian màu của ảnh. Các giá trị trường EnumCS được quy định tại Bảng B.26. Một đối tượng mặt nạ phải sử dụng đánh số không gian màu thang ảnh xám hoặc ảnh hai mức.
EP: Trường Các thông số đã đánh số (Enumerated parameters); Trường này chứa một dãy các thông số làm rõ thêm các khái niệm không gian màu chung được quy định bởi trường EnumCS. Cùng với trường EnumCS và các trường EP mô tả không gian màu và làm thế nào để không gian màu đã được mã hóa trong các tệp tin JPM. Nếu giá trị của trường EP không được xác định với giá trị cụ thể của EnumCS, thì độ dài của của trường EP cho giá trị EnumCS phải bằng không, điều này chỉ ra giá trị trường EnumCS đơn lẻ mô tả không gian màu hoặc các giá trị mặc định được sử dụng như được xác định theo tham chiếu không gian màu. Trường này sẽ không tồn tại nếu giá trị của trường METH bằng 2.
PROFILE: Trường hồ sơ ICC (ICC profile). Trường này chứa hồ sơ hợp lệ của ICC, như quy định định dạng đặc tính kỹ thuật của hồ sơ ICC, trong đó có quy định việc chuyển đổi dữ liệu ảnh đã giải nén vào trong trường PCS. Trường này sẽ không tồn tại nếu giá trị của trường METH bằng 1. Nếu giá trị của trường METH bằng 2, thì hồ sơ ICC phải phù hợp với loại hồ sơ đầu vào đơn sắc hoặc loại hồ sơ đầu vào dạng ma trận ba thành phần theo quy định tại ICC.1 :1998-09.
Bảng B.25 - Giá trị METH hợp lệ
Giá trị |
Ý nghĩa |
1 |
Trường đánh số không gian màu. Khung đặc tính màu có giá trị đánh số không gian màu của ảnh. Giá trị đánh số được tìm thấy trong trường EnumCS trong khung này. Nếu giá trị của trường METH bằng 1, sau đó các EnumCS sẽ tồn tại trong khung này ngay sau trường APPROX. |
2 |
Trường giới hạn hồ sơ ICC (Hiệp hội màu quốc tế - International Colour Consortium). Khung đặc tính màu này có một hồ sơ ICC trong trường PROFILE. Hồ sơ này sẽ xác định chuyển đổi cần thiết để chuyển đổi dữ liệu ảnh đã giải nén vào không gian PCSXYZ, và phù hợp với đầu vào đơn sắc hoặc lớp ba thành phần dựa trên ma trận đầu vào lớp hồ sơ, và chứa tất cả các yêu cầu thẻ được chỉ rõ ở đây, như được quy định trong ICC.1:1998-09. Như vậy, giá trị của hồ sơ trường không gian kết nối trong tiêu đề hồ sơ trong hồ sơ nhúng sẽ là 'XYZ\040' (0x5859 5A20) chỉ ra rằng không gian màu đầu ra của cấu hình là trong không gian màu XYZ. Bất kỳ thẻ riêng trong hồ sơ ICC sẽ không thay đổi hình thức xem của một ảnh xử lý bằng cách sử dụng hồ sơ ICC này. Các thành phần từ dòng mã có thể có một dải lớn hơn dải đầu vào của đường cong tái tạo sắc độ (TRC) của hồ sơ ICC. Bất kỳ giá trị được giải mã phải được cắt bớt để giới hạn TRC trước khi xử lý ảnh thông qua hồ sơ ICC. Ví dụ, các giá trị mẫu âm của thành phần ký số có thể được cắt bớt để về không trước khi xử lý dữ liệu ảnh thông qua hồ sơ. Xem điều J.9 của ISO/IEC 15444-1 mô tả chi tiết hơn về biến đổi không gian màu hợp lệ, làm thế nào những biến đổi được lưu trữ trong các tệp tin, và làm thế nào để xử lý một ảnh bằng cách sử dụng các biến đổi đó mà không cần sử dụng dụng cụ quản lý màu ICC. Nếu giá trị của METH bằng 2, sau đó trường PROFILE sẽ ngay lập tức theo trường APPROX và trường PRO-FILE sẽ là trường cuối trong khung. |
Các giá trị khác |
Dành riêng cho sử dụng ISO. Nếu giá trị của METH không phải bằng 1 hoặc 2, có thể có các trường trong khung này theo trường APPROX, và đầu đọc JPM phù hợp sẽ bỏ qua toàn bộ khung kỹ thuật màu. |
Bảng B.26 - Giá trị EnumCS
Giá trị |
Ý nghĩa |
0 |
Trường Hai mức (Bi-Level): Giá trị này được sử dụng để chỉ ra ảnh hai mức. Mỗi ảnh mẫu là một bít: 0 = trắng, 1 = đen. |
3 |
YCbCr(2): Đây là các định dạng phổ biến nhất được sử dụng cho dữ liệu ảnh ban đầu hiển thị trong RGB (định dạng không kiểm định). Không gian màu dựa trên Khuyến nghị ITU-R BT.601-5. Phạm vi hợp lệ của các thành phần YCbCr trong không gian này là [0,255] cho Y, và [–128,127] cho Cb và Cr (được lưu trữ với một độ lệch của 128 sang dải chuyển đổi sang [0,255]). Các dải này là khác nhau so với các dải được quy định trong Khuyến nghị ITU-R BT.601-5. Khuyến nghị ITU-R BT.601-5 chỉ quy định một ma trận chuyển đổi 3 x 3 mà có thể được sử dụng để chuyển đổi các mẫu vào RGB. |
14 |
CIELab: không gian màu CIE 1976 (L * a * b *). Một không gian màu được quy định bởi CIE (Commission Internationale de l' Eclairage), có thể quan sát thấy sự khác biệt tương đối bằng nhau giữa các điểm cách bằng nhau trong không gian. Ba thành phần là L *, hoặc độ sáng, và a * và b * trong thành phần màu. Với không gian màu này, các thông số đếm bổ sung được quy định trong trường EP theo quy định tại điều B.6.2.2.1 |
16 |
sRGB như được quy định trong IEC 61966-2 |
17 |
Thang độ xám (GrayScale): Một không gian thang độ xám nơi ảnh chói có liên quan đến giá trị mã bằng cách sử dụng sRGB không tuyến tính được đưa ra trong phương trình (2) tới (4) của IEC 61966-2-1 (sRGB) đặc tính kỹ thuật: (B.1)
Trong đó Ylin là giá trị độ chói ảnh tuyến tính trong phạm vi 0.0 đến 1.0. Giá trị độ sáng của ảnh phải được hiểu tương đối so với các điều kiện tham chiếu dữ liệu trong phần 2 của IEC 61966-2-1. |
18 |
sRGB YCC như được quy định bởi IEC 61966-2-1 Amd. 1. Không khuyến nghị sử dụng ICT hoặc RCT quy định tại Rec ISO/IEC 15444-1 phụ lục G với dữ liệu ảnh sYCC. Xem điều J.15 của ISO/IEC 15444-1 cho hướng dẫn về xử lý dòng mã YCC. |
Bảng B.27 - Định dạng nội dung của khung đặc tính màu
Tên trường |
Độ lớn (các bít) |
Giá trị |
METH |
8 |
1 -2 |
PREC |
8 |
0 |
APPROX |
8 |
0 |
EnumCS |
32 if METH = 1 |
Xem bảng B.26 |
0 if METH = 2 |
không có giá trị |
|
PROFILE |
tùy biến |
tùy biến |
EP |
tùy biến |
tùy biến |
B.6.2.2.1 Định dạng trường EP cho không gian màu CIELab
Nếu giá trị của trường EnumCS bằng 14, xác định các hình ảnh được mã hóa trong không gian màu CIELab, thì các định dạng của EP trường phải như sau:
Hình B.22 - Tổ chức các nội dung của trường EP cho không gian màu CIELab (EnumCS = 14)
Các trường RL, OL, RA, OA, RB, và OB mô tả việc chuyển đổi các giá trị không dấu NL, Na, Nb, như được xác định trong ITU-T T.42, đó là gửi tới bộ nén hay được nhận từ bộ giải nén và các giá trị trường CIELab có dấu L*, a*, b* như được xác định bởi CIE. Theo khuyến nghị Recommendation. ITU-T T.42, việc tính toán từ các giá trị số thực L* a* b* sang các bít số nguyên nL na nb, được diễn tả bởi NL Na Nb được thực hiện như sau:
Trường IL quy định dữ liệu nguồn sáng được sử dụng trong việc tính toán các giá trị CIELab.
RL: Dải của L*. Trường này quy định dải giá trị RL từ phương trình B.4. Nó được mã hóa theo kiểu số nguyên không dấu bít đầu to 4 byte.
OL: Độ lệch của L*. Trường này quy định dải giá trị OL từ phương trình B.4. Nó được mã hóa theo kiểu số nguyên không dấu bít đầu to 4 byte.
RA: Dải của a*. Trường này quy định dải giá trị RA từ phương trình B.5. Nó được mã hóa theo kiểu số nguyên không dấu bít đầu to 4 byte.
OA: Độ lệch của a*. Trường này quy định dải giá trị OA từ phương trình B.5. Nó được mã hóa theo kiểu số nguyên không dấu bít đầu to 4 byte..
RB: Dải của b*. Trường này quy định dải giá trị RB từ phương trình B.6. Nó được mã hóa theo kiểu số nguyên không dấu bít đầu to 4 byte..
OB: Độ lệch của b*. Trường này quy định dải giá trị OB từ phương trình B.6. Nó được mã hóa theo kiểu số nguyên không dấu bít đầu to 4 byte.
IL: Đô sáng. Trường này quy định dữ liệu nguồn sáng trong việc tính toán các giá trị CIELab. Hơn nữa quy định các giá trị XYZ của nguồn sáng thông thường, mà được sử dụng trong việc tính toán CIELab, đặc tính kỹ thuật của dữ liệu nguồn sáng tuân thủ theo khuyến nghị Recommendation ITUT T.4 Phụ lục E. Dữ liệu nguồn sáng bao gồm 4 byte, để xác định nguồn sáng. Trong trường hợp nguồn sáng chuẩn, 4 byte này là một trong các giá trị trong Bảng B.28.
Bảng B.28 - Các giá trị nguồn sáng chuẩn cho trường ClELab
Giá trị trường IL chuẩn |
Nguồn sáng |
0x0044 3530 |
CIE Illuminant D50 |
0x0044 3635 |
CIE Illuminant D65 |
0x0044 3735 |
CIE Illuminant D75 |
0x0000 5341 |
CIE Illuminant SA |
0x0000 5343 |
CIE Illuminant SC |
0x0000 4632 |
CIE Illuminant F2 |
0x0000 4637 |
CIE Illuminant F7 |
0x0046 3131 |
CIE Illuminant F11 |
Khi nguồn sáng được quy định bởi nhiệt độ màu, thì 4 byte bao gồm các chuỗi CT, theo sau bởi hai byte không dấu thể hiện cho nhiệt độ của nguồn sáng theo độ Kelvin theo kiểu số lưu trữ nguyên không dấu bít đầu to 2-byte. Ví dụ, một nguồn sáng 7500K được theo hiện bởi 4 byte 1D4C 0x4354.
Khi trường EP bị bỏ qua với không gian màu CIELab, thị các giá trị mặc định theo sau phải được sử dụng. Các thông số dải mặc định L*, a*, b* là 100, 170 và 200. Các giá trị độ lệch mặc định L*, a* và b* bằng 0, 2Na–1 và 2Nb–2 + 2Nb–3. Các mặc định tương ứng với việc mã hóa CIELab trong Recommendation ITU-T T.42. Giá trị mặc định của trường IL bằng 0x0044 3530, quy định CIE Illuminant D50.
Các ứng dụng khác có thể sử dụng những dải giá trị khác bằng việc xác định các giá trị trường EP. Ví dụ, việc mã hóa CIELab trong định dạng hồ sơ đặc tính ICC, ICC.1:20001-11 quy định các dải và các độ lệch cho việc mã hóa CIELab khác so với các định dạng mặc định đã cho trước ở đây. Nếu các giá trị quy định việc mã hóa CIELab trong định dạng hồ sơ đặc tính ICC, ICC.1:2001-11 được sử dụng, thì chúng phải được thể hiện rõ ràng trong các trường EP đã cho.
Bảng B.29 - Định dạng các nội dung của trường EP cho trường CIELab (EnumCS = 14)
Tên trường |
Kích thước (bít) |
Giá trị |
RL |
32 |
0 – (232–1) |
OL |
32 |
0 – (232–1) |
RA |
32 |
0 – (232–1) |
OA |
32 |
0 – (232–1) |
RB |
32 |
0 – (232–1) |
OB |
32 |
0 – (232–1) |
IL |
32 |
Xem bảng B.28 |
B.6.3 Khung nhãn
Loại khung: 'lbl\040'(0x6C626C20)
Ngăn chứa: Đối tượng trình bày, đối tượng, khung trang hoặc khung tập trang
Trường bắt buộc: phải có
Số lượng: số tùy chọn
Vị trí: bất kể ví trị nào
Khung nhãn phải ký hiệu là 'lbl\040' (0x6C626C20). Nội dung của khung nhãn là như sau:
Hình B.23 - Cấu tạo nội dung của khung nhãn
S: Trường chuỗi nhãn (Label string). Nhãn văn bản được kết hợp với đối tượng trình bày, đối tượng, trang hoặc tập trang. Giá trị này được lưu trữ dưới dạng ký tự ISO 10646 trong mã hóa UTF-8. Các ký tự trong dải bao gồm từ U + 0000 tới U + 001F, và bao gồm từ U + 007F đến U + 009F, như là các ký tự ‘/’, ’:’, ‘?’, ‘:’, và ‘#’, không được phép sử dụng trong chuỗi nhãn. Như các chuỗi nhãn không có kết cuối hay được bổ sung bằng mọi cách; các ký tự quan trọng.
B.6.4 Khung tham chiếu
Loại khung: 'cref' (0x63726566)
Ngăn chứa: xem chi tiết bên dưới
Trường bắt buộc: phải có
Số lượng: số tùy chọn
Vị trí: bất kể ví trị nào
Nếu tệp tin JPM chứa nhiều dòng mã hoặc các đối tượng trình bày, nó được sử dụng để chia sẻ tiêu đề và thông tin dữ liệu đặc tả để giảm thiểu kích thước tệp tin. Một cơ chế dữ liệu chia sẻ như vậy sử dụng tham chiếu chéo tiêu đề hiện tại hoặc khung dữ liệu đặc tả ở vị trí của dữ liệu hiện tại. Cơ chế này được thực hiện bằng cách sử dụng khung tham chiếu chéo. Tệp tin JPM có thể chứa số không hoặc nhiều khung tham chiếu chéo và khung tham chiếu chéo không được trỏ đến khung của tham chiếu chéo khác.
Loại khung tham chiếu chéo phải ký hiệu là ‘cref’ (0x63726566) và có nội dung sau đây:
Hình B.24: Cấu tạo nội dung khung tham chiếu chéo
Rtyp: Trường Loại khung tham chiếu (Referenced box type). Trường này quy định cụ thể các loại hiện tại (phải tìm thấy trong trường TBox trong tiêu đề khung hiện tại) của khung tham chiếu chéo này. Tuy nhiên, bộ đọc sẽ không cố gắng để xác định vị trí một khung lưu trữ vật lý tiêu đề cho khung được thể hiện bởi khung tham chiếu chéo này, như một hợp lệ sử dụng khung tham chiếu chéo để tạo ra khung mới không liên tục kế nhau chứa trong các địa điểm khác trong này hoặc các tệp tin khác, và do đó các khung tiêu đề có thể không tồn tại. Trường này được mã hóa như giá trị 4-byte.
Bảng B.30 - Định dạng tệp tin khung tham chiếu
Tên trường |
Độ lớn (các bít) |
Giá trị |
Rtyp |
32 |
0-(232-1) |
flst |
tùy biến |
tùy biến |
B.6.5 Khung dữ liệu đặc tả văn bản ẩn
Loại khung: 'htxb' (0x68747862)
Ngăn chứa: khung trang hoặc tệp tin
Trường bắt buộc: không
Số lượng: Nhiều nhất bằng 1 nếu khung là khung trang, bất kỳ số nếu khung là tệp tin
Vị trí: bất kể ví trị nào trong khung trang sau tiêu đề trang khung nếu container là khung trang, hoặc bất kể vị trí nào sau nếu container là các tệp tin.
Khung dữ liệu đặc tả văn bản ẩn ('htxb') phục vụ chứa dữ liệu văn bản ẩn. Là khung mà chứa Khung nhãn tùy chọn và phải chứa một trong hai loại khung. Nó có thể chứa một khung XML chứa văn bản ẩn dữ liệu đặc tả, hoặc nó có thể chứa khung UUID chứa văn bản ẩn dữ liệu đặc tả theo quy định tại Điều F.2.
Các loại khung dữ liệu đặc tả htxb (0x68747862). Nội dung khung dữ liệu đặc tả thực hiện như trong hình B.25:
Hình B.25 - Cấu tạo nội dung của khung dữ liệu đặc tả
B.6.6 Khung tham chiếu HTX
Loại khung: 'phtx' (0x70687478)
Ngăn chứa: khung trang
Trường bắt buộc: không
Vị trí: bất kể ví trị nào trong khung trang sau khung tiêu đề trang
Nếu văn bản ẩn trang được chứa Khung dữ liệu đặc tả trong khung trang tương ứng, khung sẽ ẩn đi. Nếu văn bản ẩn cho trang được chứa trong một loạt các một hoặc nhiều ẩn khung văn bản dữ liệu đặc tả ở cấp độ tệp tin, một HTX tham chiếu khung đã bao gồm trong khung trang tương ứng.
Một dạng HTX khung tham chiếu 'phtx' (0x70687478). Nội dung của khung tham chiếu HTX trong hình B.26:
Hình B.26 - Cấu tạo nội dung của khung tham chiếu HTX
Rtyp: Trường Loại khung tham chiếu. Trường này quy định các loại khung hiện tại (để tìm thấy trong các trường TBox trong một tiêu đề khung thực tế) của khung được tham chiếu bởi khung tham chiếu HTX này. Tuy nhiên, một bộ đọc sẽ không cố gắng xác định vị trí một tiêu đề khung đã được lưu trữ dưới dạng vật lý cho việc khung đã được thể hiện bởi khung HTX tham chiếu này, bởi vì điều này hợp lý sử dụng một khung tham chiếu HTX để tạo ra một khung mới mà không được chứa liên tục trong các vị trí khác trong tập tin này hoặc các tệp tin khác, và do đó tiêu đề khung sẽ không tồn tại.
flst: Trường khung danh sách phân mảnh. Khung này xác định vị trí hiện tại của các phân mảnh trong phần tử tham chiếu HTX. Khi những mảnh được kết hợp lại, theo thứ tự, như được quy định bởi khung danh sách phân mảnh, dòng byte kết quả phải là nội dung của thành phần HTX tham chiếu, mà chứa dữ liệu văn bản ẩn, và không bao gồm các trường tiêu đề khung. Định dạng của khung danh sách phân mảnh được quy định tại Điều B.5.1.1. Nếu trường Rtyp là ‘uuid’ và các tín hiệu UUID nén giảm phát như quy định tại Điều F.2, số các phân mảnh của khung danh sách phân mảnh phải bằng một.
label: Trường khung nhãn. Khung tùy chọn này có thể chứa một khung nhãn mà quy định nhãn hay tên văn bản ẩn của trang tương ứng. Cấu trúc của khung nhãn được quy định tại Điều B.6.3.
Bảng B.31 - Giá trị cấu trúc dữ liệu của các nội dung khung tham chiếu HTX
Tham số |
Độ lớn (các bít) |
Giá trị |
Rtyp |
32 |
Xam bảng B.32 |
flst |
Tùy biến |
Tùy biến |
label |
Tùy biến |
Tùy biến |
Bảng B.32 - Giá trị hợp lệ của trường Rtyp
Giá trị |
Ý nghĩa |
xml\40 |
Dữ liệu HTX tham chiếu sẽ được chứa trong một khung XML như mô tả trong phụ lục F. Khung XML được xác định tại điều I.7.1 của ISO/IEC 15444-1:2004. |
uuid |
Dữ liệu HTX tham chiếu sẽ được chứa trong một khung UUID như mô tả trong phụ lục F. Khung UUID được quy định tại điều I.7.2 của ISO/IEC 15444-1:2004. |
Các giá trị khác |
Tất cả các giá trị khác được dành riêng |
B.6.7 Khung tự do (Free box)
Loại khung: ‘free’ (0x66726565)
Ngăn chứa: bất kể vị trí nào
Số lượng: số tùy chọn
Khung tự do quy định một phần của tệp tin JPM mà hiện tại không được sử dụng và có thể được ghi đè khi chỉnh sửa các tệp tin. Bộ đọc sẽ bỏ qua tất cả khung tự do.
Loại khung tự do phải ký hiệu là ‘free’ (0x66726565), Nội dung của khung tự do không được định nghĩa trong tiêu chuẩn này.
Tệp tin JPM có thể chứa khung dữ liệu đặc tả với thông tin quyền sở hữu trí tuệ hoặc thông tin cụ thể nhà cung cấp, theo quy định tại phụ lục này. Khung dữ liệu đặc tả tùy chọn trong tệp tin JPM và có thể lược bỏ bởi bộ đọc. Ngoài ra, tệp tin JPM có thể chứa Khung dữ liệu khác không quy định tại phụ lục này.
C.1 Bổ sung thông tin sở hữu trí tuệ vào tệp tin JPM
ISO 15444-1 quy định cụ thể một loại khung được dành cho việc mang thông tin quyền sở hữu trí tuệ. Việc quy định cụ thể loại khung cho phép các ứng dụng nhận biết được sự tồn tại của thông tin sở hữu trong tệp tin JPM. Sử dụng và diễn giải về phạm vi của tiêu chuẩn này. Bao gồm các thông tin trong tệp tin JPM là tùy chọn các tệp tin phù hợp. Định nghĩa về định dạng các nội dung của khung này được dành riêng cho việc sử dụng theo tiêu chuẩn ISO. Loại khung sở hữu trí tuệ phải ký hiệu là 'jp2i (0x6A70 3269).
C.2 Bổ sung thông tin nhà cung cấp cụ thể vào định dạng tệp tin JPM
Các khung sau đây cung cấp bộ công cụ ứng dụng để bổ sung thông tin nhà cung cấp vào định dạng tệp tin JPM. Tất cả các khung sau đây là tùy chọn với các tệp tin phù hợp và có thể được lược bỏ bởi bộ đọc.
C.2.1 Các Khung XML
Khung XML chứa thông tin nhà cung cấp cụ thể (trong định dạng XML) khác với thông tin được chứa trong các khung được định nghĩa của tiêu chuẩn này. Có thể có nhiều khung XML trong tệp tin, và các khung này có thể được tìm thấy trong một khung đối tượng, khung đối tượng trình bày, khung trang, khung tập trang hoặc bất kể đâu tại cấp độ tệp tin, ngoại trừ trước khung loại tệp tin. Khung XML được định nghĩa tại điều I.7.1 của ISO/IEC 15444-1.
C.2.2 Các khung UUID
Một khung UUID chứa thông tin cụ thể nhà cung cấp khác hơn so với thông tin chứa trong các khung được quy định trong tiêu chuẩn này. Có thể có nhiều khung UUID trong tệp tin, và các khung này có thể được tìm thấy trong một khung đối tượng, khung đối tượng trình bày, khung trang, thu tập trang, hay bất cứ đâu tại cấp độ tệp tin trước khung loại tệp tin. Khung UUID được quy định tại Điều I.7.2 của ISO/IEC 15444-1.
C.2.3. Khung thông tin UUID (Tổ hợp khung)
Trong khi UUID dùng để cho phép nhà sản xuất mở rộng các tệp tin JPM bổ sung các thông tin sử dụng khung UUID, cũng sử dùng để cung cấp thông tin theo dãng mẫu chuẩn để sử dụng cho các ứng dụng nhỏ, chứa thông tin bổ sung về các phần mở rộng trong tệp tin. Thông tin này được chứa trong các khung thông tin UUID. Tệp tin JPM có thể không chứa hoặc chứa nhiều khung thông tin UUID. Các khung này phải được tìm thấy ở mức đỉnh của tệp tin (các tổ hợp khung của khung thông tin UUID phải chính là các tệp tin JPM) ngoại trừ trước đó là khung loại tệp tin.
Các khung này, nếu hiện tại, không thể cung cấp một chỉ số đầy đủ trong tệp tin của UUID, có thể tham chiếu UUID không được sử dụng trong các tệp tin, và có thể cung cấp nhiều tham chiếu dữ liệu cho cùng UUID. Thông tin khung UUID được quy định tại Điều I.7.3 của ISO/IEC 15444-1.
Phụ lục này xác định các hồ sơ của tệp tin JPM chuẩn. Đặc biệt, phụ lục này quy định các giá trị của trường P trong khung tiêu để ảnh phức hợp. Một hồ sơ xác định các giá trị hợp lệ của các trường trong tệp tin JPM.
D.1 Hồ sơ JPM
Trường P của khung tiêu đề ảnh phức hợp, quy định tại Điều B.1.4, quy định hồ sơ phù hợp với định dạng tệp tin JPM. Hồ sơ quy định các giá trị hợp lệ của các trường trong tệp tin JPM. Phụ lục này cung cấp cho các giá trị hợp lệ cho giá trị trường P được quy định trong khung tiêu đề ảnh phức hợp.
D.1.1 Hồ sơ web
Giá trị trường hồ sơ cho hồ sơ web bằng 1. Bảng dưới đây đưa ra các giá trị các khung trong tệp tin JPM khi hồ sơ này được sử dụng.
Bảng D.1 - Các giá trị hồ sơ Web
Khung |
Trường |
Giá trị |
Tiêu chuẩn |
Tiêu đề ảnh phức hợp |
MC |
xxxx x1xx |
ITU-T T.6 (MMR) |
xx1x xxxx |
ITU-T T.88 (JBIG2 profile) |
||
xxx1 xxxx |
ITU-T T.800 (JPEG 2000 Part 1) |
||
|
|
xxxx xxx1 |
ITU-T T.81 (JPEG) |
|
IC |
xxx1 xxxx |
ITU-T T.800 (JPEG 2000 Part 1) |
|
|
xxxx x1xx |
ITU-T T.45 |
Tiêu đề ảnh (trong khung đối tượng mặt nạ) |
|
3 |
ITU-TT.6 (MMR) |
C |
7 |
ITU-T T.88 (JBIG2 profile |
|
|
8 |
ITU-T T.800 (JPEG 2000 Part 1) |
|
Tiêu đề ảnh (trong khung đối tượng) |
|
5 |
ITU-T T.81 (JPEG) |
C |
7 |
ITU-T T.800 (JPEG 2000 Part 1 |
|
|
10 |
ITU-T T.45 |
|
|
BPC |
- |
Tất cả ảnh thành phần sẽ có cùng các bít cùng một giá trị thành phần |
Đặc điểm màu (trong khung đối tượng) |
METH |
1 |
Liệt kê không gian màu hồ sơ ICC bị giới hạn |
2 |
|||
|
|
16 |
sRGB |
|
17 |
Greyscale |
|
EnumCS |
14 |
CIELab |
|
|
3 |
YCbCr(2) |
|
|
18 |
sRGBsYCC |
Các đối tượng mặt nạ trong tệp tin JPM phù hợp với hồ sơ web sử dụng nén MMR, JBIG2 hoặc JPEG 2000; chỉ chuẩn nén JPEG 2000 được sử dụng khi mặt nạ có nhiều hơn một bít cho mỗi thành phần. Các đối tượng ảnh trong tệp tin JPM có thể sử dụng chuẩn JPEG hoặc JPEG 2000.
Trong hồ sơ này, tất cả các thành phần của đối tượng ảnh phải có cùng số bít cho mỗi thành phần. Tất cả các đối tượng ảnh bên trong khung trang phải có cùng đặc tính màu; các đối tượng ảnh được bao gồm bằng tham chiếu bên trong một khung trang có hoặc không có cùng các đặc tính màu tương tự như các đối tượng ảnh trực tiếp định vị trong khung trang.
D.2 Hồ sơ giải nén
Ngoài ra, cũng có các hồ sơ quy định việc sử dụng các phương pháp nén được cho phép trong tệp tin JPM. Bảng Q.2 mô tả các hồ sơ giải nén mà phù hợp trong tệp tin JPM.
Bảng D.2 - Giá trị hồ sơ giải nén
Phương pháp nén |
Hồ sơ |
JPEG 2000 |
Profile JPEG 2000 (ITU - T T.800 |) ISO/IEC 15444 - 1), Cclass1 (Rec. ITU - T T.803 |) ISO/IEC 15444-4), với chiều cao và chiều rộng của ảnh tối đa là 16.384. |
JPEG |
Đường cơ sở (Base line) JPEG (ISO 10918-1) |
JBIG2 |
ITU-T T.88 các profile F3, F4, F5, F6 và F7, hay ITU-T T.89, tất cả các profile. Khi sử dụng profile T.88, F6 hoặc F7, hoặc profile của T.89 0x0000101 hoặc 0x00000103, không lẫn lộn các loại trong một dải có thể xảy ra; phải có 2 hoặc nhiều hơn dải mỗi trang. |
Hiện nay, Phụ lục E của theo tiêu chuẩn tham chiếu cơ sở ISO/IEC 15444-6:2013 vẫn đang dự kiến được xây dựng, nên tiêu chuẩn này vẫn dành riêng Phụ lục E tương ứng với tiêu chuẩn tham chiếu để thuận lợi cho việc tham chiếu với tiêu chuẩn tham chiếu cơ sở. Phụ lục E này sẽ được cập nhật bổ sung mới theo bản cập nhật tiêu chuẩn ISO/IEC 15444-6 mà có bổ sung nội dung cho phụ lục E.
Lưu trữ văn bản ẩn và các chú thích
F.1 Lưu trữ của HTX trong JPM
Thành phần văn bản ẩn XML bị giới hạn việc thể hiện văn bản cho một trang đơn. Nó được lưu trữ trong khung dữ liệu đặc tả văn bản ẩn theo quy định tại điều B.6.5. Khung dữ liệu đặc tả văn bản ẩn xuất hiện ở cả trong khung trang tương ứng hoặc được đặt ở mức cao của các tệp tin. Nếu được đặt tại mức cao, một khung tham chiếu HTX được quy định điều B.6.6 phải được đặt trong khung trang tương ứng để trỏ đến các khung dữ liệu đặc tả văn bản ẩn mà để soạn văn bản ẩn của trang
Khi một khung dữ liệu đặc tả văn bản ẩn có kích thước nhỏ, sẽ dễ dàng để đặt trực tiếp vào trong khung trang. Theo cách tiếp cận JPM thông thường, các đối tượng lớn hơn thường được đặt ở mức cao của tệp tin. Trong trường hợp này, nhiều khung tham chiếu dữ liệu HTX nhỏ hơn được đặt trong khung trang và trỏ tới dữ liệu hiện tại. Ngoài ra, trong trường hợp này một khung tham chiếu dữ liệu HTX đơn có thể trỏ đến nhiều khung dữ liệu đặc tả văn bản ẩn mức tệp tin. Việc này có thể được sử dụng để soạn các HTX cho nhiều trang bằng việc kết hợp của các nội dung cố định trong trang (như phần đầu trang và cuối trang) và các nội dung trang thay đổi riêng cho mỗi trang.
Việc thể hiện dữ liệu XML văn bản ẩn và các chú thích được định nghĩa bằng cách sử dụng chuẩn XML 1.0, và phù hợp với các lược đồ trong Phụ lục H. Nó được gọi là “văn bản ẩn XML” hoặc HTX.
HTX sẽ được lưu trữ trong khung dữ liệu đặc tả văn bản ẩn theo quy định tại điều B.6.5.
Việc lưu trữ không nén HTX có thể làm tăng đáng kể kích thước tệp tin. Để giảm thiểu tăng kích thước tệp tin, HTX có thể được nén bằng cách sử dụng các cơ chế quy định tại điều F.2.
F.2 Nén HTX
HTX có thể được nén bằng cách sử dụng định dạng zlib được định nghĩa trong IETF RFC năm 1950 với chuẩn nén DEFLATE được định nghĩa trong RFC IETF 1951.
Các khung UUID phải được sử dụng cho lưu trữ nén HTX trong định dạng tệp tin JPM.
Nén HTX phải được lưu trữ trong một khung UUID, như được quy định tại Điều I.7.3 ISO/IEC 15444-1:2004, với các nội dung sau đây:
ID: Trường này chứa các byte hệ thập lục phân 16 sau:
c2 f3 66 a4 27 ec 40 c4 a0 9a 7e 65 2f 36 eb 59
DATA: Trường này chứa văn bản ẩn XML đã nén thành định dạng DEFLATE, như được quy định tại điều F.1.
Một khung UUID với nội dung trên phải được tham chiếu tới khung UUID văn bản ẩn.
URL sau được sử dụng trong khung nhập dữ liệu UUID, như được quy định tại Điều I.7.3.2 của ISO/IEC 15444-1:2004, để mô tả định dạng của dữ liệu được chứa trong khung văn bản ẩn UUID:
http://www.jpeg.org/hiddentext/htx.html
Văn bản ẩn và các loại chú thích và các phần tử
G.1 Tổng quan
Phần này mô tả mỗi loại HTX và các phần tử, cách chúng được sử dụng và giải nghĩa.
Phụ lục H mô tả các lược đồ văn bản ẩn XML phải tuân thủ. Văn bản này là một mô tả mỗi thành phần, những gì chúng mô tả, chúng liên quan đến mỗi thành phần khác, tần suất chúng có thể xuất hiện, và cách diễn giải chúng.
Văn bản ẩn có thể được mã hóa bằng cách sử dụng phần tử phụ ở các mức khác nhau như được mô tả trong phần này. Điều này được sử dụng để tổ chức văn bản ẩn và biểu thị một luồng văn bản trong các vùng, các đoạn, các đường, các từ,… Bất kể khi nào không có sẵn loại thông tin đã cấu trúc, văn bản ẩn có thể được đưa trực tiếp vào các thành phần phù hợp, việc bỏ qua vị trí cụ thể của các dòng trong đoạn văn, các từ trong đường văn bản, ... Hình ảnh dưới đây chỉ ra tổng quan về các thành phần khác nhau được sử dụng để lưu trữ các văn bản ẩn của trang:
Hình G.1 - Cấu trúc của văn bản ẩn (HTX)
Các lược đồ văn bản ẩn XML (xem H.1) sử dụng một số loại và các phần tử được định nghĩa trong lược đồ XML 1.0 XHTML. Xem tham chiếu XHTML 1.0 để biết chi tiết về các loại và các phần tử của chúng.
Các loại và các phần tử bổ sung sau được quy định như sau:
G.2 Loại
G.2.1 Hình dạng
Loại Shape (Hình dạng) được dùng để mô tả hình dạng của một vùng trong tài liệu và được quy định bằng khai báo lược đồ XML sau đây:
|
G.2.2 Hệ thống tọa độ (Coordinates)
Loại Coords được sử dụng để lưu trữ một dãy dấu phẩy riêng rẽ của các giá trị số nguyên không âm. Loại này tương tự như loại Coords XHTML 1.0 nhưng bao gồm các giá trị âm và tỷ lệ phần trăm. Các thuộc tính quy định vị trí và hình dạng của vùng. Số lượng và thứ tự của các giá trị phụ thuộc vào giá trị của trạng thái hình dạng. Có thể kết hợp:
• rect: left-x, top-y, right-x, bottom-y.
• poly: x1, y1, x2, y2, ..., xN, yN.
Nếu cặp tọa độ x và y đầu tiên và cuối không giống nhau, người sử dụng phải suy ra cặp tọa độ bổ sung để đóng đa giác lại.
Các thành phần Coords được xác định bằng cách khai báo lược đồ XML sau đây:
xs:simpleType name=”Coords”> Comma separated list of integer values.
|
G.2.3 Tỷ lệ phần trăm
Một loại Percentage (Tỷ lệ phần trăm) đơn giản được xác định để lưu trữ dãy ký tự giữ một giá trị phần trăm chỉ ra độ tin cậy của từ văn bản ẩn hoặc kết hợp ký tự. Percentage được xác định như sau:
|
G.2.4 Góc độ
Loại Angle đơn giản được xác định để lưu trữ một dãy ký tự chỉ ra một góc độ cho việc sử dụng văn bản ẩn. Loại Angle được xác định như sau:
|
G.2.5 Độ phân giải
Một loại Resolution đơn giản được quy định để lưu trữ một dãy ký tự chỉ ra độ phân giải cho việc sử dụng với các hệ tọa độ trong văn bản ẩn và cả chú giải. Resolution giải được định nghĩa như sau:
Giá trị độ phân giải theo số điểm ảnh trong mỗi inch (dpi). Một số đơn biểu diễn độ phân giải phương ngang và phương dọc có cùng giá trị. Hai số này có thể được sử dụng để xác định các độ phân giải khác về phương ngang (số thứ nhất) và phương dọc (số thứ hai).
|
G.3 Thuộc tính chung
G.3.1 Thuộc tính lõi
Coreattrs, một tập các thuộc tính lõi chung cho hầu hết các thành phần, được định nghĩa như sau:
core attributes common to most elements (Các trạng thái lõi chung cho hầu hết các thành phần) id document-wide unique id (mã nhận dạng duy nhất cho tài liệu class space separated list of classes (khoảng riêng rẽ danh sách các lớp) lang language code (backwards compatible) (mã ngôn ngữ (tương thích với phía trước)) xml:lang language code (as per XML 1.0 spec) (mã ngôn ngữ (như đặc tính XML1.0)) dir direction for weak/neutral text (hướng cho văn bản ít/trung lập) iref URI of the image corresponding to the region (URI của ảnh tương ứng với vùng)
|
Các thuộc tính sau đây là các thành viên của nhóm Coreattrs:
lang (tùy chọn)
Thuộc tính tùy chọn của loại LanguageCode để chỉ ra ngôn ngữ mặc định của các văn bản trong văn bản ẩn XML. Tham chiếu tiêu chuẩn XHTML 1.0 để biết thêm chi tiết.
• xml:lang (tùy chọn)
Một thuộc tính tùy chọn của loại xml:lang để chỉ ra ngôn ngữ mặc định của văn bản trong văn bản ẩn XML. Tham chiếu tiêu chuẩn kỹ thuật XHTML 1.0 để biết thêm thông tin chi tiết.
• dir (tùy chọn)
Một thuộc tính tùy chọn chứa dãy ký tự rtl hoặc ltr, chỉ ra ngôn ngữ mặc định của các văn bản ẩn XML. Tham chiếu tiêu chuẩn XHTML 1.0 để biết thêm chi tiết.
• dir (tùy chọn)
Thuộc tính tùy chọn chứa dãy rtl hoặc ltr, chỉ ra ngôn ngữ mặc định của văn bản trong các văn bản ẩn XML. Tham chiếu tiêu chuẩn XHTML 1.0 để biết thêm chi tiết.
• id (tùy chọn)
Thuộc tính tùy chọn của loại xs:ID. Chứa một chỉ số ID duy nhất trong phạm vi tài liệu này. Thuộc tính này có thể được sử dụng cho việc tham chiếu tới một thành phần nhất định (ví dụ, trong kiểu bảng tính). Xem các mô tả trong lược đồ XML để biết thêm chi tiết.
• class (tùy chọn)
Thuộc tính này có thể chứa một danh sách tách biệt các khoảng của các lớp. Sử dụng cho các tiện lợi khi sử dụng bảng tính.
• iref (tùy chọn)
URI mà trỏ đến tệp tin ảnh tương ứng với vùng.
G.3.2 Vị trí các thuộc tính
Posattrs, là một tập hợp các thuộc tính vị trí thường gặp với mỗi thành phần ảnh, được định nghĩa như sau:
positioning attributes common to most elements (các trạng thái vị trí chung cho hầu hết các thành phần) shape shape of an element (Hình dạng của thành phần) coords coordinates of an element (hệ thống tọa độ của thành phần) angle angle of text direction (Góc của hướng văn bản) 0 is horizontal to the right, positive values mean counter-clockwise rotation (0 là đúng hướng ngang, giá trị dương có nghĩa là quay ngược chiều kim đồng hồ) baseline angle of the characters in a line of text (góc của các ký tự trong dòng văn bản)
|
Các thuộc tính sau đây là các thành viên của nhóm Posattrs:
• shape (tùy chọn)
Thuộc tính tùy chọn của loại Shape chứa thông tin hình dạng của vùng bao thành phần. Các giá trị có thể là 'rect' với hình chữ nhật và là 'poly' với một đa giác. Giá trị mặc định cho thuộc tính này là rect. Nếu thuộc tính này bị mất thì hình dạng đường bao của thành phần này là hình dạng đường bao của thành phần mẹ (mà là tất cả các trang trong ngăn văn bản ẩn).
• coords (tùy chọn)
Hệ tọa độ logic của dạng được bao văn bản ẩn cho trang này. Đơn vị là pixel. Độ phân giải có thể được xác định theo một thuộc tính trên thành phần HTX. Nếu thuộc tính này bị mất thì hình dạng đường bao của thành phần này là hình dạng đường bao của thành phần mẹ (mà là tất cả các trang trong ngăn văn bản ẩn). Việc chú giải các giá trị lõi phụ thuộc vào thuộc tính hình dạng. Đơn vị của các giá trị tọa độ là điểm ảnh (pixel); không phải là giá trị phần trăm hay bất kỳ đơn vị độ dài nào như inch hay cm.
Gốc (tọa độ '0, 0 ') là góc trái của trang.
• angle (tùy chọn)
Thuộc tính của loại Angle chỉ ra góc độ định hướng của các thành phần, liên quan đến hướng của phần tử mẹ.
Có thể sử dụng đơn vị theo độ (theo sau giá trị này là ký hiệu °) hoặc đơn vị radian (giá trị không có đơn vị). Giá trị bằng 0 có nghĩa là cùng hướng với phần tử mẹ, các giá trị dương nghĩa là quay ngược chiều kim đồng hồ. Giá trị mặc định bằng '0'.
• baseline (tùy chọn)
Một thuộc tính của loại Angle mà chỉ ra hướng tương đối của các thành phần phụ và nội dung trực tiếp chứa trong thành phần tương ứng với hướng đã cho bởi thuộc tính góc độ.
Có thể sử dụng đơn vị theo độ (theo sau giá trị này là ký hiệu °) hoặc đơn vị radian (giá trị không có đơn vị). Giá trị bằng 0 có nghĩa là cùng hướng với phần tử mẹ, các giá trị dương nghĩa là quay ngược chiều kim đồng hồ. Giá trị mặc định bằng '0'.
Các giá trị của thuộc tính hình dạng và tọa độ phải được diễn giải như được mô tả trong HTML 4.01 điều 13.6.1 phần "định nghĩa thuộc tính AREA".
G.4 Phần tử
G.4.1 HTX
Phần tử htx, là ngăn chứa toàn cục và các phần tử gốc của văn bản ẩn và các chú thích, được khai báo như sau:
Global container for hidden text and annotations. Contains language attributes, an optional xhtml head and a mandatory body. (Bộ chứa toàn cục cho văn bản ẩn và các chú giải. Chứa các trạng thái ngôn ngữ, một tiêu đề xhtml tùy chọn và một phần thân bắt buộc)
|
Phần tử gốc này chứa một phần tử tùy chọn xhtml:head, phần tử chú thích và phần tử văn bản ẩn.
Attributes:
Các thuộc tính lõi áp dụng.
• res (tùy chọn)
Thuộc tính tùy chọn của loại Độ phân giải chỉ ra độ phân giải cho bất kỳ tọa độ theo dạng các điểm chấm trên mỗi inch (dpi). Một số đứng đơn cho độ phân giải ngang và dọc có cùng giá trị. Hai con số này có thể được sử dụng để xác định độ phân giải khác nhau cho trục ngang (số đầu) và trục dọc (số thứ hai).
• width (tuỳ chọn)
Chiều dài của trang tính bằng điểm ảnh
• height (tuỳ chọn)
Chiều cao của trang tính bằng điểm ảnh
Elements
• xhtml:head (Nhiều nhất bằng 1)
Một thành phần tùy chọn chứa dữ liệu tiêu đề chung của các phần tử XML văn bản ẩn, bao gồm yêu cầu dữ liệu bảng tính kiểu phân cấp tùy chọn. Xem đặc tính kỹ thuật XHTML 1.0 để biết thêm chi tiết.
• annotations (nhiều nhất bằng 1)
Một thành phần chú thích tùy chọn được sử dụng để đính kèm các ghi chú và để mô tả các khu vực có thể click con trỏ chuột và tô đánh dấu vùng chữ trên trang.
• hiddentext (nhiều nhất bằng 1)
Một tùy chọn văn bản ẩn chứa các dữ liệu văn bản ẩn XML của trang.
Direct content:
• none (không)
G.4.2 Thông số
Các thành phần param được khai báo như sau:
User defined properties for a hidden text and annotations object. (Người sử dụng xác định các đặc tính cho văn bản ẩn và các đối tượng chú giải)
|
Một thành phần param của HTX chứa các đặc tính người dùng cho các phần tử đã kết hợp,… xác định công cụ OCR được sử dụng để tạo ra văn bản ẩn.
Attributes
• name (bắt buộc có)
Một thuộc tính dãy ký tự bắt buộc chứa tên của tham số này.
Elements
• không có
Direct content:
• không có
Một thuộc tính dãy ký tự tùy chọn chứa giá trị cho thông số này.
G.4.3 Văn bản ẩn
Thành phần hiddentext được sử dụng để thể hiện văn bản ẩn của trang và được khai báo như sau:
A hiddentext element contains hidden text for a page. (Một thành phần văn bản ẩn chứa văn bản ẩn cho một trang)
|
Thành phần hiddentext của HTX chứa một dãy các thành phần region (vùng).
Attributes:
Các thuộc tính lõi và vị trí áp dụng.
Elements:
• param (không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần tham sử dụng để xác định các đặc tính người dùng với văn bản ẩn.
• region (một hay nhiều hơn)
Dãy các thành phần chứa văn bản ẩn cho vùng trong trang.
Direct content:
• none (không)
G.4.4 Vùng
Các thành phần region được khai báo như sau:
A region element contains hidden text for a page region. (Một thành phần vùng chứa văn bản ẩn cho một vùng trang)
|
Thành phần region của HTX chứa một dãy tùy chọn của các thành phần paragraph, line, word, char và snippet và văn bản ẩn tùy chọn cho một vùng.
Attributes:
Thuộc tính lõi và vị trí áp dụng.
Elements
• param (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần thông số được sử dụng để xác định đặc tính của người dùng cho vùng này.
• paragraph (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa các văn bản ẩn cho các đoạn văn (paragraph) trong vùng.
• line (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho đường văn bản (line) trong vùng.
• word (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho từ văn bản (word) trong đoạn văn.
• char (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các ký tự (char) trong đoạn văn.
• snippet (số không hoặc nhiều hơn)
Dãy tùy chọn của mỗi thành phần xác định một phần không hiểu của các mành quét (raster).
Direct content:
Văn bản ẩn mức vùng.
G.4.5 Đoạn văn
Thành paragraph được khai báo:
A paragraph element contains hidden text for a paragraph. (Một thành phần đoạn chưa văn bản ẩn cho một đoạn)
|
Một thành phần paragraph của HTX chứa một dãy tùy chọn của các thành phần line, word, char và snippet và văn bản ẩn tùy chọn của đoạn văn.
Attributes:
Thuộc tính lõi và vị trí áp dụng.
Elements
• param (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần thông số phải được sử dụng để xác định các đặc tính người dùng của đoạn văn.
• line (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các lines trong đoạn văn.
• word (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các words trong đoạn văn.
• char (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các characters trong đoạn văn.
• snippet (số không hoặc nhiều hơn)
Dãy tùy chọn của mỗi thành phần xác định mỗi phần xác định các phần không hiểu của mành quét.
Direct content
• Văn bản ẩn mức từ ký tự.
G.4.6 Dòng văn bản
Các phần tử line được khai báo như sau:
A line element contains hidden text for a line. (Một thành phần dòng chứa văn bản ẩn cho một dòng)
|
Thành phần line của HTX chứa dãy tùy chọn của word, char và snippet và tùy chọn văn bản ẩn cho line.
Attributes:
Thuộc tính lõi và vị trí áp dụng.
Elements
• param (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần thông số phải được sử dụng để xác định các đặc tính người dùng của đường văn bản (line).
• word (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các words trong line.
• char (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các chars trong line.
• snippet (số không hoặc nhiều hơn)
Trình tự bắt buộc của các thành phần xác định mỗi phần không được công nhận của các Attributes.
Direct content
Mức dòng văn bản ẩn.
G.4.7 Từ (Word)
Các phần tử word được khai báo như sau:
A word element contains hidden text for a word. (Một thành phần từ chứa văn bản ẩn cho một từ)
|
Thành phần word từ HTX chứa dãy tùy chọn của char, altword and snippet và tùy chọn ấn vào trong văn bản word
Attributes:
Thuộc tính lõi và vị trí áp dụng
• conf (tuỳ chọn)
Một thuộc tính tùy chọn cho thấy sự tin tưởng về độ chính xác của word như một tỷ lệ phần trăm trong khoảng từ 0% đến 100%.
Elements
• param (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần thông số phải được sử dụng để xác định các đặc tính người dùng cho từ ký tự.
• char (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các ký tự trong từ ký tự.
• snippet (số không hoặc nhiều hơn)
Dãy tùy chọn của mỗi thành phần xác định mỗi phần xác định các phần không hiểu của mành quét.
• altword (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các từ ký tự thay thế. Nó xác định một chú giải về việc thay thế của từ ký tự trong ảnh mành quét khi thấy có điều không chắc chắn.
Direct content
• văn bản ẩn mức từ ký tự.
G.4.8 Từ thay thế
Thành phần Altword chứa văn bản ẩn thay thế cho một từ và được khai báo như sau:
A altword element contains hidden text for a alternative word. (Một thành phần từ thay thế chứa văn bản ẩn cho một từ thay thế)
|
Thành phần Altword của HTX chứa một dãy tuỳ chọn thành phần char, snippet và tuỳ chọn văn bản ẩn cho một từ thay thế.
Attributes
Thuộc tính lõi và vị trí áp dụng.
• conf (tùy chọn)
Một thuộc tính tùy chọn chỉ ra sự tin tưởng về độ chính xác của word cho trước từ thay thế như một tỷ lệ phần trăm trong khoảng từ 0% đến 100%.
Elements
• param (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần thông số phải được sử dụng để xác định các đặc tính người dùng cho từ thay thế.
• char (số không hoặc nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các ký tự trong từ thay thế.
• snippet (số không hoặc nhiều hơn)
Dãy tùy chọn của mỗi thành phần xác định mỗi phần xác định các phần không hiểu của mành quét.
Direct content
Văn bản ẩn mức từ quy định một số ký tự thay thế.
G.4.9 Ký tự
Thành phần char chứa ký tự văn bản ẩn và được khai báo như sau:
A char element contains a hidden text character. (Một thành phần ký tự chứa văn bản ẩn cho ký tự văn bản)
|
Một thành phần char của HTX dãy tùy chọn của các thành phần altchar và một ký tự văn bản ẩn tùy chọn. Attributes:
Thuộc tính lõi và vị trí áp dụng.
• conf (tuỳ chọn)
Một thuộc tính tùy chọn chi ra sự tin tưởng về độ chính xác của ký tự đã cho như tỷ lệ phần trăm trong khoảng từ 0% đến 100%.
Elements
• param (số không và nhiều hơn)
Dãy tùy chọn của các thành phần thông số phải được sử dụng để xác định các đặc tính người dùng cho ký tự.
• altchar (số không và nhiều hơn)
Dãy tùy chọn của các thành phần chứa văn bản ẩn cho các từ ký tự thay thế trong từ ký tự thay thế. Nó xác định một chú giải về việc thay thế của từ ký tự trong ảnh mành quét khi thấy có điều không chắc chắn.
Direct content
Văn bản ẩn mức ký tự.
G.4.10 Ký tự thay thế
Các thành phần altchar được khai báo như sau:
A altchar element contains a hidden text alternative character. (Một thành phần ký tự thay thế chứa văn bản ẩn cho ký tự thay thế)
|
Thành phần altchar của HTX chứa dãy tùy chọn của các thành phần snippet và văn bản ẩn tùy chọn cho một ký tự thay thế.
Attributes:
Thuộc tính lõi và vị trí áp dụng.
• conf (tùy chọn)
Một thuộc tính tùy chọn chi ra sự tin tưởng về độ chính xác của ký tự thay thế đã cho như tỷ lệ phần trăm trong khoảng từ 0% đến 100%.
Elements
• param (số không và nhiều hơn)
Dãy tùy chọn của các thành phần thông số phải được sử dụng để xác định các đặc tính người dùng cho ký tự thay thế.
Direct content
• Văn bản ẩn mức từ quy định một số ký tự thay thế.
G.4.11 Snippet
Thành phần snippet được khai báo như sau:
A snippet element identifies an unrecognised portion of the image. (Một thành phần snippet xác định một phần không định kiểu của ảnh)
|
Một thành phần snippet của một HTX xác định một phần không hiểu của ảnh.
Attributes:
Thuộc tính lõi và vị trí áp dụng.
Elements
• param (số không và nhiều hơn)
Dãy tùy chọn của các thành phần thông số phải được sử dụng để xác định các đặc tính người dùng cho snippet.
Direct content
• Không.
G.4.12 Chú giải
Các thành phần Annotations (chú giải) được khai báo như sau
The annotations element represents annotated, clickable and highlighted areas on a page. (Thành phần chú giải thể hiện chú giải, có thể kích chọn và vùng được sáng lên trong một trang)
|
Phần tử annotation của HTX chứa một dãy các thành phần vùng xác định các vùng kích con trỏ đơcj hoặc được tô nổi rõ (highlight) như các ghi chú trong một trang.
Attributes:
Thuộc tính lõi và vị trí áp dụng.
Elements
• area (ít nhất bằng một)
Một dãy các thành phần xác định các các vùng kích con trỏ đơcj hoặc được tô nổi rõ (highlight) trên một trang.
Direct content
• Không.
G.4.13 Vùng
Các thành phần area này được khai báo như sau:
An area element represents a clickable and/or highlighted area on a page. (Một thành phần khu vực biểu diễn khu vực có thể tích chọn hoặc sáng lên trong một trang)
|
Một thành phần area của HTX xác định một khu vực có thể nhấp chuột và/hoặc đánh dấu tô rõ trên một trang. Để xác định một đánh dấu tô rõ, vùng không nhấp chuột được thuộc tính href phải được bỏ qua.
Attributes (Thuộc tính):
Thuộc tính lõi và vị trí áp dụng.
• href (tùy chọn)
URI của các siêu liên kết để sử dụng khi vùng được nhấp chuộc.
• alt (tùy chọn)
Một mô tả văn bản tùy chọn cho các siêu liên kết, có thể để sử dụng như một chú thích. Không được sử dụng nếu không có các thuộc tính href xác định.
• target (tùy chọn)
Khung mà tài liệu có các siêu liên kết trỏ đến phải được hiển thị (Nếu chương trình xem hỗ trợ tất cả các loại khung). Giá trị mặc định là "_self". Xem định nghĩa HTML 4.01 để biết thêm chi tiết. Và không được sử dụng mà không có các thuộc tính href xác định.
Elements
• None (không);
Direct content
• Các ghi chú cho vùng này.
Lược đồ văn bản ẩn và các chú giải
H.1 Lược đồ XML
Sau đây URL tham chiếu lược đồ XML cho HTX: Sau đây URL tham chiếu lược đồ XML cho HTX: http://www.jpeg.org/hiddentext/htx.xsd
Lược đồ XML này sẽ được gọi là lược đồ XML văn bản ẩn.
H.1.1 Phiên bản và mã hóa
Lược đồ HTX sử dụng XML 1.0 và UTF-8 mã hóa:
|
H.1.2 Lược đồ
Lược đồ bao bọc (wrapper) cho HTX được khai báo như sau:
id = "htx" xmlns = "http://www.jpeg.org/hiddentext/htx" xmlns:xs = "http://www.w3.org/2001/XMLSchema" mlns:xhtml = "http://www.w3.org/1999/xhtml" targetNamespace = "http://www.jpeg.org/hiddentext/htx" elementFormDefault = "qualified"> |
Lược đồ sử dụng một số các loại và các thành phần từ lược đồ XHTML 1.0 XML, và đưa vào lược đồ này như sau:
namespace = "http://www.w3.org/1999/xhtml" schemaLocation = "http://www.w3.org/2002/08/xhtml/xhtml1-strict.xsd">
|
Các từ khóa được sử dụng để đóng HTX lược đồ:
|
Các ví dụ về văn bản ẩn và các chú giải
I.1 Ví dụ 1
I.2 Ví dụ 2
Ví dụ này cho thấy ba dòng trong tiếng Nhật được định dạng trong HTX như sau:
CHÚ THÍCH: Nội dung của dòng văn bản tiếng Nhật trên “Công nghệ tự thân nó không có có nhiều ý nghĩa; Việc hiểu rõ khả việc hiểu rõ tính năng và khả năng ứng dụng của công nghệ mới là điều quan trọng”.
I.3 Ví dụ 3
Ví dụ này cho thấy một HTX đã được tự động tạo ra từ một đầu ra XML của quá trình OCR bằng cách sử dụng một biến đổi ngôn ngữ mở rộng dạng bảng (stylesheet) (XSLT). Nó chứa thông tin định văn bản ẩn và ký tự theo quy định của quá trình OCR. Bao gồm tham chiếu dữ liệu tới chuẩn HTX2HTML.xsl cho phép một chuyển đổi tự động từ HTX sang HTML trong trình duyệt web có hỗ trợ XSLT.
Hình I.1 - Ví dụ về một trang tài liệu quét
XSLT sau đây có thể được sử dụng để chuyển dịch HTX cho việc xem trong trình duyệt web. Điều này không phải là chủ ý HTX để thay thế ảnh ban đầu. Việc chuyển dịch sang HTML có thể được sử dụng để xem xét các kết quả OCR, hoặc để giúp trong việc tao ra những bộ hiển thị JPM mà cung cấp các hoạt động sao chép và dán (paste) của các văn bản ẩn phía bên dưới ảnh trang.
Hướng dẫn cấu trúc các nguồn URL cho các tệp tin JPM
Phụ lục thông tin này mô tả làm thế nào để xây dựng các nguồn URL tham chiếu các thành phần phụ của tệp tin JPM. Những thành phần phụ có thể là trang, ảnh hoặc khung dữ liệu đặc tả. Những quy ước có thể được sử dụng khi tạo các liên kết bên trong một file JPM hoặc khi liên kết đến một thành phần bên trong của tệp tin JPM từ một trang web. Khi một ứng dụng giải mã nhận được yêu cầu, nó sẽ chỉ hiển thị phần được yêu cầu của tệp tin JPM. Khuyến nghị Rec ITU-T T.808 | ISO/IEC 15444-9 quy định tiếp tục làm thế nào để truy cập từ xa tệp tin JPM. Việc thực hiện phải tham chiếu Rec ITU-T T.808 | ISO/IEC 15444-9 cho các hướng dẫn bổ sung về xây dựng URL. Các URL này được xây dựng bằng cách gắn thêm một ký tự dấu chấm hỏi ("?") đến tên đường dẫn và tệp tin của tệp tin JPM và sau đó gắn thêm thuộc tính cặp giá trị tham gia bởi các ký tự bằng ("="), ngăn cách bởi ký tự ("&"), mà xác định các thành phần phụ truy cập như mong muốn.
J.1 Các trang và các đối tượng trình bày (Pages and layout objects)
Điều này chỉ ra làm thế nào để tham chiếu tới một đối tượng duy nhất bố trí trên một trang web thông qua trường LObjID của nó.
foo.jpm?page=3&obj=32
page=3 là một trang tham chiếu
obj=32 là một đối tượng trình bày tham chiếu đến một đối tượng trình bày trang 3.
J.2 Khung dữ liệu đặc tả (Metadata boxes)
Khung dữ liệu đặc tả có thể được tham chiếu đến một nguồn URL chứa tệp tin JPM. Trong trường hợp này, các dữ liệu đặc tả XML với cấp độ của tệp tin JPM (bất kể cấp độ trang, cấp độ tập trang, hoặc cấp độ đối tượng trình bày) được chuyển đổi (rendered) để bộ yêu cầu của URL đúng hơn là bất kỳ dữ liệu ảnh nào.
foo.jpm?page=43&type=meta
Trong các trường hợp có nhiều hơn một khung dữ liệu đặc tả xuất hiện tại cùng cấp độ của tệp tin JPM, một tham số chỉ số được sử dụng để chọn khung dữ liệu đặc tả để được sử dụng. "index = 1" tham chiếu đến vị trí đầu khung dữ liệu đặc tả. Nếu không có "index =" tham số được sử dụng, nhưng nhiều khung dữ liệu đặc tả tồn tại ở cấp đó, khung dữ liệu đặc tả đầu được sử dụng.
foo.jpm?page=77&obj=19&type=meta&index=1
Nếu khung dữ liệu đặc tả là một khung XML, các dữ liệu đặc tả phải là loại MIME XML. Nếu khung dữ liệu đặc tả là một khung UUID, thì loại có thể hoặc không thể XML. Các "mtype =" tham số có thể được sử dụng để xác định các loại dữ liệu bằng cách sử dụng tiêu chuẩn MIME loại nhận dạng chuỗi. Nếu không có "mtype =" tham số được sử dụng, thì mtype được coi là XML.
foo.jpm?page=91&type=meta&mtype=text
J.3 Nhãn
Nhãn khung có thể được sử dụng trong tệp tin JPM để đính kèm các nhãn khác tới các khung khác trong tệp tin. Dữ liệu đặc tả, chẳng hạn ví dụ như một khung XML, có thể cũng được gắn liền với các khung tương tự. Trong trường hợp này, các dữ liệu đặc tả được trả về bộ yêu cầu của URL đúng hơn là bất kỳ dữ liệu ảnh nào. Trang XHTML có thể xuất hiện bên trong một khung XML, kể từ khi chúng thể hiện cho dữ liệu XML hợp lệ.
foo.jpm?label=album.html
foo.jpm?label=IPR-info&type=meta&index=2
J.4 Tập trang (Page collections)
Khung tập trang có thể chứa một khung nhãn tùy chọn. Nhãn này có thể được sử dụng để tham chiếu đến một tập trang trong một nguồn URL. Mọi tệp tin JPM có một tập trang chính. Ngay cả nếu nó không chứa nhãn, tập trang chính có thể được tham chiếu đến bởi nhãn dành riêng "main". Nếu "coll =" tham số bị bỏ qua, thì bất kỳ trang nào được tham chiếu để được giả định cho vị trí trong tập trang cơ sở. Cách chạy của các bộ giải mã ở đây là không xác định. Nó có thể cung cấp một danh sách văn bản của các nhãn trang của các trang trong tập, hoặc nó có thể hiển thị hình thu nhỏ trang của các trang.
foo.jpm?coll=toc
foo.jpm?coll=main
foo.jpm?coll=list-of-figs
foo.jpm?coll=list-of-tables foo.jpm?coll=toc&page=31 foo.jpm?coll=main&page=7
foo.jpm?page=7
foo.jpm?
J.5 Hình thu nhỏ của trang (Page thumbnails)
Mỗi trang có thể có một tùy chọn hình thu nhỏ. "type = thumb" giá trị tham số được sử dụng để chỉ định hình thu nhỏ của trang một chứ không phải là trang cơ sở nó. Giá trị thông số "type = img" được sử dụng để xác định trang cơ sở nó được kết xuất (rendered), chứ không phải là hình thu nhỏ.
foo.jpm?page=3&type=img
foo.jpm?page=3&type=thumb
J.6 Hình thu nhỏ tài liệu (Document thumbnail)
Mỗi tệp tin JPM có thể có nhiều nhất bằng 1 tùy chọn tài liệu hình thu nhỏ. Trang dành riêng nhãn "thumb" được và hiển thị hình thu nhỏ tài liệu ngay cả khi không có nhãn khung được sử dụng để nhãn ảnh thu nhỏ của tài liệu. foo.jpm?page=thumb
J.7 Dải byte
Một dải các byte trong tệp tin JPM có thể được quy định cho việc xử lý bởi các bộ giải mã. Cách chạy của các bộ giải mã sau đó phụ thuộc vào những gì loại khung được đặt trong dải byte. Tham số "off =" được sử dụng để chỉ định một đối tượng độ lệch theo byte từ đầu của tệp tin. Tham số "len =" tham số được sử dụng để chỉ định một số lượng byte được trả lại. Đây không phải là một phương pháp đáng tin cậy đến các thành phần phụ của tệp tin JPM, từ khi chúng có thể được di chuyển và sắp xếp lại như tệp tin cải tiến hay thay đổi (Các phương pháp tốt hơn được cung cấp ở trên). Tuy nhiên, nếu các bộ giải mã nhận được đủ thông tin từ tệp tin để biết nơi thành phần phụ ở vị trí như mong muốn, thì đây là một phương pháp hữu ích. Phương pháp này cũng có thể hữu ích để lấy dữ liệu từ mặt trước của các tệp tin theo thứ tự cho các bộ giải mã để hiểu rõ hơn về việc tổ chức của các tệp tin.
foo.jpm?off=12384&len=1024
Ý kiến bạn đọc
Nhấp vào nút tại mỗi ô tìm kiếm.
Màn hình hiện lên như thế này thì bạn bắt đầu nói, hệ thống giới hạn tối đa 10 giây.
Bạn cũng có thể dừng bất kỳ lúc nào để gửi kết quả tìm kiếm ngay bằng cách nhấp vào nút micro đang xoay bên dưới
Để tăng độ chính xác bạn hãy nói không quá nhanh, rõ ràng.