ISO/IEC 15444-1:2019
CÔNG NGHỆ THÔNG TIN - HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 - PHẦN 1: HỆ THỐNG MÃ HÓA LÕI
Information technology - JPEG 2000 image coding system - Part 1: Core coding system
Lời nói đầu
TCVN 11777-1:2020 hoàn toàn tương đương ISO/IEC 15444-1:2019
TCVN 11777-1:2020 do Viện Khoa học Kỹ thuật Bưu điện biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.
CÔNG NGHỆ THÔNG TIN - HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 - PHẦN 1: HỆ THỐNG MÃ HÓA LÕI
Information technology - JPEG 2000 image coding system - Part 1: Core coding system
Tiêu chuẩn này định nghĩa các phương pháp nén không tổn hao (bảo quản bit) và nén tổn hao để mã hóa ảnh hai mức, ảnh xám sắc độ liên tục, ảnh bảng màu hoặc ảnh màu tĩnh kỹ thuật số có sắc độ liên tục.
Tiêu chuẩn:
- Quy định quá trình giải mã để chuyển đổi dữ liệu ảnh nén thành dữ liệu ảnh tái tạo;
- Quy định cú pháp dòng mã chứa thông tin giải thích các dữ liệu ảnh nén;
- Quy định một định dạng tập tin;
- Cung cấp hướng dẫn về quy trình mã hóa để chuyển đổi dữ liệu ảnh gốc thành dữ liệu ảnh nén;
- Cung cấp hướng dẫn cách để thực hiện các quá trình này trong thực tế.
Tài liệu viện dẫn sau rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả sửa đổi, bổ sung (nếu có).
ITU-T T.81 | ISO/IEC 10918-1, Information technology - Digital compression and coding of continuous-tone still images: Requirements and guidelines. (Công nghệ thông tin - Nén số và mã hóa ảnh có sắc độ liên tục: Yêu cầu và hướng dẫn)
ITU-T T.84 | ISO/IEC 10918-3, Information technology - Digital compression and coding of continuous-tone still images: Extensions. (Công nghệ thông tin - Nén số và mã hóa ảnh có sắc độ liên tục: Phần mở rộng)
ITU-T T.84/Amd.1 | ISO/IEC 10918-3/Amd.1, Information technology - Digital compression and coding of continuous-tone still images: Extensions - Amendment 1: Provisions to allow registration of new compression types and versions in the SPIFF header. (Công nghệ thông tin - Nén số và mã hóa ảnh có sắc độ liên tục: Phần mở rộng - Sửa đổi 1: Các quy định cho phép đăng ký loại và phiên bản mới trong tiêu đề SPIFF)
ITU-T T.86 | ISO/IEC 10918-4, Information technology - Digital compression and coding of continuous-tone still images: Registration of JPEG Profiles, SPIFF Profiles, SPIFF Tags, SPIFF colour Spaces, APPn Markers, SPIFF Compression types and Registration Authorities (REGAUT). (Công nghệ thông tin - Nén số và mã hóa ảnh có sắc độ liên tục: Đăng ký JPEG Profile, SPIFF Profile, SPIFF Tag, các không gian màu SPIFF, các nhãn APPn, các loại nén SPIFF và cơ quan đăng ký (REGAUT))
ITU-T T.87 | ISO/IEC 14495-1, Lossless and near-lossless compression of continuous-tone still images - Baseline. (Nén không tổn hao và nén ít tổn hao ảnh có sắc độ liên tục - Cơ sở)
ITU-T T.88 | ISO/IEC 14492, Information technology - Lossy/lossless coding of bi-level images. (Công nghệ thông tin - Mã hóa tổn hao/không tổn hao ảnh đen trắng)
Tiêu chuẩn quốc gia TCVN 11777-11:2018 (ISO/IEC 15444-11:2007 With Amendment 1:2013) Công nghệ thông tin - Hệ thống mã hóa hình ảnh JPEG 2000 - Mạng không dây
ISO/IEC 646, Information technology - ISO 7-bit coded character set for information interchange. (Công nghệ thông tin - Tập ký tự đã mã hóa 7 bit ISO để liên trao đổi thông tin)
ISO 8859-15, Information technology - 8-bit single-byte coded graphic character sets - Part 15: Latin alphabet No. 9. (Công nghệ thông tin - Tập 8 bit ký tự đồ họa đã mã hóa byte đơn - Phần 15: Bảng chữ cái Latin Số 9)
ITU-R BT.601-6, Studio encoding parameters of digital television for standard 4:3 and wide screen 16:9 aspect ratios. (Các thông số mã hóa truyền hình kỹ thuật số đối với màn hình chuẩn 4:3 và màn hình rộng 16:9)
ITU-R BT.709-5, Parameter values for the HDTV standards for production and international programme exchange. (Các giá trị tham số cho các tiêu chuẩn HDTV trong sản xuất và trao đổi chương trình truyền hình quốc tế)
IEC 61966-2-1, Multimedia systems and equipment - Colour measurement and management - Part 2-1: Colour management - Default RGB colour space - sRGB. (Hệ thống và thiết bị đa phương tiện - Kiểm soát và đo màu - Phần 2-1: Kiểm soát màu - Không gian màu RGB mặc định - sRGB)
IEC 61966-2-1/Amd.1, Multimedia systems and equipment - Colour measurement and management - Part 2-1: Colour management - Default RGB colour space - sRGB. (Hệ thống và thiết bị đa phương tiện - Kiểm soát và đo màu - Phần 2-1: Kiểm soát màu - Không gian màu RGB mặc định - sRGB)
IETF RFC 2279, UTF-8, a transformation format of ISO 10646. (UTF-8, một định dạng chuyển đổi của ISO 10646)
ISO 11664-1 (CIE S 014-1/E), Colorimetry - Part 1: CIE standard colorimetric observers. (So màu - Phần 1: Quan sát viên so màu chuẩn CIE)
ISO 14721, Space data and information transfer systems - Open archival information system - Reference model. (Hệ thống chuyển đổi dữ liệu và thông tin không gian - Hệ thống thông tin lưu trữ mở (OAIS) - Mô hình tham chiếu)
ISO 15076-1, Image technology colour management - Architecture, profile format and data structure - Part 1: Based on ICC.1:2010. (Kiểm soát màu của ảnh - Kiến trúc, định dạng và cấu trúc dữ liệu - Phần 1: Dựa trên ICC:1:2010)
ISO 26428-1, Digital cinema (D-cinema) distribution master - Part 1: Image characteristics. (Phim gốc phân phối Điện ảnh kỹ thuật số (D-cinema) - Phần 1: Đặc tính ảnh)
ISO/IEC 11578, Information technology - Open Systems Interconnection - Remote Procedure Call. (Công nghệ thông tin - Kết nối các hệ thống mở - Gọi thủ tục từ xa (PRC))
3.1 ëxû, Hàm giới hạn dưới (floor function)
Trả về giá trị nguyên lớn nhất không lớn hơn x.
3.2 éxù, Hàm giới hạn trên (ceiling function)
Trả về giá trị nguyên nhỏ nhất không nhỏ hơn x.
3.3 Bộ lọc khả đảo 5-3 (5-3 reversible filter)
Một cặp bộ lọc đặc biệt sử dụng trong phép biến đổi sóng con. Cặp bộ lọc khả đảo này gồm lọc thông thấp 5 phần tử và lọc thông cao 3 phần tử.
3.4 Bộ lọc không khả đảo 9-7 (9-7 irreversible filter)
Một cặp bộ lọc đặc biệt sử dụng trong phép biến đổi sóng con. Cặp bộ lọc không khả đảo này có gồm lọc thông thấp 9 phần tử và lọc thông cao 7 phần tử.
3.5 Đơn vị truy cập (access unit)
Biểu diễn mã hóa của một khung video.
3.6 AND
Toán tử logic nhị phân AND.
3.7 Bộ mã hóa số học (arithmetic coder)
Bộ mã hóa entropy chuyển đổi các chuỗi dữ liệu có độ dài thay đổi thành các mã có độ dài thay đổi (mã hóa) và ngược lại (giải mã).
3.8 Kênh phụ (auxiliary channel)
Kênh được sử dụng bởi các ứng dụng nằm ngoài phạm vi chuyển đổi không gian màu. Ví dụ, kênh mờ đục của ảnh và kênh độ sâu của ảnh đều là các kênh phụ.
3.9 Bit (bit)
Cách viết ngắn gọn của thuật ngữ “binary digit”, là đơn vị của thông tin được biểu diễn bởi 0 hoặc 1.
3.10 Mặt phẳng bit (bit-plane)
Tổ chức bit dạng mảng hai chiều. Trong tiêu chuẩn này, mặt phẳng bit dùng để chỉ tất cả các bit có cùng độ lớn trong tất cả các hệ số hoặc mẫu. Chúng có thể là mặt phẳng bit trong thành phần ảnh, khối ảnh thành phần, khối mã, vùng quan tâm hoặc thành phần khác.
3.11 Dòng bit (bit stream)
Chuỗi các bit thực tế là kết quả của quá trình mã hóa một chuỗi các ký hiệu. Nó không bao gồm các nhãn hoặc đoạn nhãn trong các tiêu đề phần chính và tiêu đề phần khối ảnh hoặc nhãn EOC. Nó bao gồm tiêu đề gói bất kỳ, nhãn và đoạn nhãn trong dòng bit không có trong các tiêu đề phần chính hoặc phần khối ảnh.
3.12 big endian
Các bit biểu diễn giá trị sắp xếp theo thứ tự từ quan trọng nhất tới ít quan trọng nhất.
3.13 Khung (Box)
Một phần của định dạng tập tin xác định độ dài và loại khung duy nhất. Một vài loại khung có thể chứa các khung khác.
3.14 Nội dung khung (box contents)
Đề cập đến dữ liệu được đóng gói bên trong cấu trúc khung. Các nội dung của một khung cụ thể được lưu trữ trong trường DBox bên trong cấu trúc dữ liệu khung.
3.15 Kiểu khung (box type)
Quy định loại thông tin sẽ được lưu trữ bởi khung. Kiểu khung cụ thể được lưu trong trường Tbox trong cấu trúc dữ liệu khung.
3.16 Byte
Tám bit.
3.17 Kênh (channel)
Thành phần logic của ảnh. Kênh có thể là đại diện trực tiếp của một thành phần ảnh từ dòng mã hoặc có thể được tạo ra bởi việc ứng dụng bảng màu cho một thành phần ảnh từ dòng mã.
3.18 Bước loại bỏ (dữ liệu thừa) (cleanup pass)
Bước mã hóa thực hiện trên một mặt phẳng bit đơn của khối mã các hệ số. Bước loại bỏ là bước đầu tiên và là bước mã hóa duy nhất cho mặt phẳng bit quan trọng đầu tiên; là bước thứ ba và cũng là bước cuối cùng với các mặt phẳng bit còn lại.
3.19 Dòng mã (codestream)
Tập hợp của một hoặc nhiều dòng bit và tiêu đề phần chính, các tiêu đề phần khối ảnh và nhãn EOC cần thiết để giải mã chúng và mở rộng vào trong dữ liệu ảnh. Đây là các dữ liệu ảnh dạng nén với tất cả các dấu hiệu cần thiết để giải mã.
3.20 Khối mã (code-block)
Một nhóm hình chữ nhật bao gồm các hệ số trong cùng một băng con của một khối ảnh thành phần.
3.21 Quét khối mã (code-block scan)
Thứ tự trong đó các hệ số trong một khối mã được truy cập trong khoảng thời gian của một bước mã hóa. Khối mã được xử lý theo dải, mỗi dải bao gồm bốn hàng (hoặc ít hơn) và có khoảng cách bằng chiều rộng của khối mã. Mỗi dải được xử lý theo từng cột từ trên xuống dưới và từ trái qua phải.
3.22 Bộ mã (coder)
Bộ phận thực hiện quá trình mã hóa hoặc giải mã.
3.23 Bước mã hóa (coding pass)
Một bước hoàn chỉnh mã hóa khối mã áp dụng các giá trị hệ số và ngữ cảnh thích hợp. Có ba bước mã hóa: bước truyền trọng số, bước làm mịn biên độ và bước loại bỏ. Kết quả của mỗi bước (sau khi mã hóa số học, nếu không sử dụng lựa chọn bỏ qua quá trình mã hóa số học) là một dòng dữ liệu ảnh nén.
3.24 Hệ số (coefficient)
Các giá trị là kết quả của một phép biến đổi.
3.25 Kênh màu (colour channel)
Kênh thực hiện chức năng như đầu vào của hệ thống biến đổi màu. Ví dụ, kênh đỏ hoặc kênh xám là một kênh màu.
3.26 Thành phần (component)
Mảng 2 chiều của các mẫu. Một ảnh điển hình bao gồm một vài thành phần, ví dụ, màu đỏ, màu xanh lá cây và màu da trời.
3.27 Dữ liệu ảnh nén (compressed image data)
Một phần hoặc toàn bộ dòng bit. Cũng có thể đề cập đến một tập hợp các dòng bit trong một phần hoặc toàn bộ dòng mã.
3.28 Trình đọc phù hợp (conforming reader)
Một ứng dụng đọc và biên dịch chính xác tập tin JP2.
3.29 Ngữ cảnh (context)
Đặc trưng của các hệ số trước đây được giải mã và sử dụng làm đặt điều kiện để giải mã hệ số hiện tại.
3.30 Ký hiệu ngữ cảnh (context label)
Chỉ số tùy ý được sử dụng để phân biệt các giá trị ngữ cảnh khác nhau. Các nhãn được sử dụng như một ký hiệu thuận tiện chứ không phải quy định.
3.31 Véc-tơ ngữ cảnh (context vector)
Véc-tơ nhị phân bao gồm các trạng thái có nghĩa của hệ số nằm trong một ngữ cảnh.
3.32 Bộ giải mã (decoder)
Bộ phận thực hiện quá trình giải mã và tùy chọn quá trình biến đổi màu.
3.33 Quá trình giải mã (decoding process)
Quá trình mà đầu vào là toàn bộ hoặc một phần của một dòng mã và kết quả đầu ra là toàn bộ hoặc một phần của ảnh được tái tạo.
3.34 Mức phản tách (decomposition level)
Tập hợp các băng con sóng con trong đó mỗi hệ số có cùng tác động không gian hoặc cùng khoảng cách đối với các mẫu thành phần gốc. Chúng bao gồm các băng con HL, LH và HH của cùng một phân tách băng con 2 chiều. Đối mức phân tách cuối cùng, gồm cả băng con LL.
3.35 Nhãn và đoạn nhãn phân giới (delimiting markers and marker segments)
Các nhãn và đoạn nhãn cung cấp thông tin về điểm bắt đầu và kết thúc trong cấu trúc dòng mã.
3.36 Biến đổi sóng con rời rạc (discrete wavelet transformation (DWT))
Một phép biến đổi được lặp đi lặp lại biến một tín hiệu thành hai hoặc nhiều tín hiệu được lọc và bị lược bỏ tương ứng với các dải tần khác nhau. Phép biến đổi này hoạt động trên các mẫu rời rạc trong miền không gian.
3.37 Bộ mã hóa (encoder)
Bộ phận thực hiện quá trình mã hóa.
3.38 Quá trình mã hóa (encoding process)
Quá trình mà đầu vào là toàn bộ hoặc một phần của dữ liệu ảnh gốc và kết quả đầu ra là dòng mã.
3.39 Định dạng tập tin (file format)
Một dòng mã và dữ liệu bổ trợ và thông tin không rõ ràng cần cho quá trình giải mã dòng mã. Các ví dụ của dữ liệu bổ trợ bao gồm các trường văn bản cung cấp thông tin đặt tên, bảo mật và lịch sử, dữ liệu hỗ trợ sự phân bố nhiều dòng mã trong một tập tin dữ liệu nhất định và dữ liệu hỗ trợ trao đổi giữa các nền tảng hoặc chuyển đổi sang các định dạng tập tin khác.
3.40 Nhãn thông tin cố định và đoạn nhãn thông tin cố định (fixed information markers and fixed information marker segments)
Các nhãn và đoạn nhãn cung cấp thông tin ảnh gốc.
3.41 Nhãn chức năng và đoạn nhãn chức năng (functional markers and functional marker segments) Các nhãn và đoạn nhãn cung cấp thông tin về các thủ tục mã hóa.
3.42 Mức phân giải lưới (grid resolution)
Độ phân giải không gian của lưới tham chiếu, quy định khoảng các giữa các điểm lân cận trong lưới tham chiếu.
3.43 Bit bảo vệ (guard bits)
Bổ sung các bit có trọng số cao nhất được thêm vào dữ liệu mẫu.
3.44 Tiêu đề (header)
Là một phần của dòng mã chứa các nhãn và đoạn nhãn (tiêu đề phần chính và tiêu đề phần khối ảnh) hoặc phần chứa dấu hiệu của gói (tiêu đề gói)
3.45 Băng con HH (HH sub-band)
Băng con thu được thông qua việc lọc thông cao theo chiều ngang rồi lọc thông cao theo chiều dọc. Băng con này góp phần vào việc tái tạo ảnh bằng cách đảo ngược lại lọc thông cao theo chiều dọc rồi đến lọc thông cao theo chiều ngang.
3.46 Băng con HL (HL sub-band)
Băng con thu được thông qua việc lọc thông cao theo chiều ngang rồi lọc thông thấp theo chiều dọc. Băng con này góp phần vào việc tái tạo ảnh bằng cách đảo ngược lại lọc thông thấp theo chiều dọc rồi đến lọc thông cao theo chiều ngang.
3.47 Ảnh (image)
Tập hợp tất cả các thành phần ảnh.
3.48 Vùng ảnh (image area)
Phần hình chữ nhật của lưới tham chiếu, được xác định bởi các độ lệch từ điểm gốc đến các phần mở rộng của lưới tham chiếu.
3.49 Độ lệch vùng ảnh (image area offset)
Số lượng các điểm lưới phía dưới và bên phải so với điểm gốc lưới tham chiếu để xác định vị trí điểm gốc của vùng ảnh.
3.50 Dữ liệu ảnh (image data)
Các thành phần ảnh và các mẫu thành phần tạo nên một hình ảnh. Dữ liệu ảnh có thể đề cập tới hoặc dữ liệu ảnh gốc hoặc dữ liệu ảnh tái tạo.
3.51 Nhãn trong dòng bit và đoạn nhãn trong dòng bit (in-bit-stream markers and in-bit-stream marker segments)
Các nhãn và đoạn nhãn cung cấp khả năng kháng lỗi.
3.52 Nhãn mang thông tin và đoạn nhãn mang thông tin (informational markers and informational marker segments)
Các nhãn và đoạn nhãn cung cấp thông tin bổ sung.
3.53 Tốc độ bit tức thời (instantaneous bit rate)
Với mỗi khung hình, tốc độ này tương ứng với kích thước dòng mã liền kề với khung hình tính theo bit nhân với tốc độ khung.
3.54 Không khả đảo (irreversible)
Một quá trình biến đổi, lũy tiến, lượng tử hóa hoặc các quá trình khác, do lỗi có tính hệ thống hoặc lỗi lượng tử hóa, không cho phép tái tạo không tổn hao. Một quá trình không thể đảo ngược chỉ dùng để nén tổn hao.
3.55 JP2
Tên của định dạng tập tin được định nghĩa trong tiêu chuẩn này.
3.56 JPEG
Sử dụng để tham chiếu tổng thể cho quá trình mã hóa và giải mã theo các tiêu chuẩn quốc tế sau đây:
- Khuyến nghị ITU-T T.81 (1992) | ISO/IEC 10918-1;
- Khuyến nghị ITU-T T.83 (1994) | ISO/IEC 10918-2;
- Khuyến nghị ITU-T T.84 (1996) | ISO/IEC 10918-3;
- Khuyến nghị ITU-T T.86 (1998) | ISO/IEC 10918-4.
3.57 JPEG 2000
Sử dụng để tham chiếu tổng thể cho quá trình mã hóa và giải mã trong tiêu chuẩn này và sự hiện diện của chúng trong các ứng dụng.
3.58 Băng con LH (LH sub-band)
Băng con thu được thông qua việc lọc thông thấp theo chiều ngang rồi lọc thông cao theo chiều dọc. Băng con này góp phần vào việc tái tạo ảnh bằng cách đảo ngược lại lọc thông cao theo chiều dọc rồi đến lọc thông thấp theo chiều ngang.
3.59 Băng con LL (LL sub-band)
Băng con thu được thông qua việc lọc thông thấp theo chiều ngang rồi lọc thông thấp theo chiều dọc. Băng con này góp phần vào việc tái tạo ảnh bằng cách đảo ngược lại lọc thông thấp theo chiều dọc rồi đến lọc thông thấp theo chiều ngang.
3.60 Lớp (layer)
Tập hợp các dữ liệu ảnh nén từ các bước mã hóa của một hoặc nhiều khối mã trong khối ảnh thành phần. Các lớp được đánh thứ tự trong quá trình mã hóa và giải mã, thứ tự của chúng phải được bảo toàn.
3.61 Không tổn hao (lossless)
Một thuật ngữ mô tả ảnh hưởng của quá trình mã hóa và giải mã toàn bộ ảnh trong đó đầu ra của quá trình giải mã giống hệt với đầu vào của quá trình mã hóa. Việc tái tạo không biến dạng được đảm bảo. Tất cả quá trình mã hóa hoặc các bước được sử dụng cho quá trình mã hóa và giải mã có thể đảo ngược.
3.62 Tổn hao (lossy)
Một thuật ngữ mô tả ảnh hưởng của quá trình mã hóa và giải mã toàn bộ ảnh trong đó đầu ra của quá trình giải mã không giống với đầu vào của quá trình mã hóa. Xuất hiện biến dạng (xét về mặt toán học). Ít nhất một trong các quá trình mã hóa hoặc các bước được sử dụng cho quá trình mã hóa và giải mã không thể đảo ngược.
3.63 Bước làm mịn biên độ (magnitude refinement pass)
Một bước mã hóa.
3.64 Tiêu đề chính (main header)
Một nhóm các nhãn và đoạn nhãn tại bắt đầu của dòng mã mô tả các tham số ảnh và tham số mã hóa có thể áp dụng cho tất cả khối ảnh và khối ảnh thành phần.
3.65 Nhãn (marker)
Một mã hai byte trong đó byte đầu tiên là FF (0xFF) hệ thập lục phân và byte thứ hai là giá trị trong khoảng từ 1 (0x01) đến FE (0xFE) hệ thập lục phân.
3.66 Đoạn nhãn (marker segment)
Một nhãn và tập các tham số đi kèm (không rỗng).
3.67 mod:
mod(y,x) = z, trong đó 0 ≤ z < x và y - z là bội số của x.
3.68 Gói (packet)
Một phần của dòng bit bao gồm tiêu đề gói và dữ liệu ảnh nén từ một lớp của một phân khu ảnh tại một mức phân giải trong khối ảnh thành phần.
3.69 Tiêu đề gói (packet header)
Một phần của gói chứa các dấu hiệu cần thiết để giải mã gói.
3.70 Nhãn con trỏ và đoạn nhãn con trỏ (pointer markers and pointer marker segments)
Nhãn và đoạn nhãn cung cấp thông tin về vị trí trong cấu trúc của dòng mã.
3.71 Phân khu ảnh (precinct)
Vùng chữ nhật của khối ảnh thành phần biến đổi, tại từng mức phân giải, được sử dụng để giới hạn kích thước gói.
3.72 Độ chính xác (precision)
Số lượng bit được chỉ định cho một mẫu, hệ số cụ thể hoặc biểu diễn dưới dạng số nhị phân khác.
3.73 Quá trình lũy tiến (progression)
Thứ tự trong một dòng mã trong đó quá trình giải mã từng bit liên tiếp đóng góp vào việc tái tạo ảnh “tốt hơn”. Cách xác định các tham số để tái tạo ảnh “tốt hơn” là một chức năng của ứng dụng. Một vài ví dụ của quá trình lũy tiến là tăng độ phân giải hoặc cải thiện độ chính xác mẫu.
3.74 Lượng tử hóa (quantization)
Một phương pháp giảm độ chính xác của các hệ số riêng nhằm giảm số lượng bit dùng cho mã hóa entropy. Quá trình lượng tử hóa được thực hiện bởi phép chia trong quá trình mã hóa và phép nhân trong quá trình giải mã. Lượng tử hóa có thể thực hiện bởi một phép toán tường minh với giá trị lượng tử cho trước hoặc bằng cách giảm (bỏ bớt) các bước mã hóa từ dòng mã.
3.75 Thứ tự quét mành (raster order)
Trình tự cụ thể của dữ liệu của loại bất kỳ trong một mảng. Thứ tự quét mành bắt đầu tại điểm dữ liệu trên cùng bên trái và di chuyển đến các điểm dữ liệu bên phải gần nhất. Sau khi đến điểm kết thúc hàng, điểm dữ liệu tiếp theo trong chuỗi là điểm dữ liệu tận cùng bên trái ngay phía dưới dòng hiện tại. Thứ tự này cứ tiếp tục cho tới khi đến được điểm cuối cùng của mảng.
3.76 Ảnh tái tạo (reconstructed image)
Ảnh ở đầu ra của bộ giải mã.
3.77 Mẫu tái tạo (reconstructed sample)
Mẫu được tái tạo bởi bộ giải mã. Nó luôn bằng với giá trị mẫu gốc trong quá trình mã hóa không tổn hao và khác giá trị này trong quá trình mã hóa tổn hao.
3.78 Lưới tham chiếu (reference grid)
Một mảng các điểm lưới chữ nhật được sử dụng làm tham chiếu cho các mảng dữ liệu chữ nhật khác. Ví dụ bao gồm các thành phần ảnh và khối ảnh.
3.79 Khối ảnh tham chiếu (reference tile)
Lưới chữ nhật phụ với kích cỡ bất kỳ được gắn với lưới tham chiếu.
3.80 Vùng quan tâm (region of interest (ROI))
Tập các hệ số thỏa mãn các tiêu chí được người dùng định nghĩa.
3.81 Mức phân giải (resolution level)
Tương đương với mức phân tách với một ngoại lệ: các băng con LL cũng là một mức phân giải riêng.
3.82 Khả đảo (reversible)
Quá trình biến đổi, lũy tiến hoặc quá trình khác không gặp lỗi có tính hệ thống hoặc lỗi lượng tử hóa, cho phép khôi phục tín hiệu không tổn hao.
3.83 Mẫu (sample)
Một phần tử trong mảng 2 chiều chứa một thành phần ảnh.
3.84 Ký hiệu phân đoạn (segmentation symbol)
Một ký tự đặc biệt được mã hóa với nội dung không đổi tại điểm kết thúc của mỗi bước mã hóa để kháng lỗi.
3.85 Lựa chọn bỏ qua quá trình mã hóa số học (selective arthmetic coding bypass)
Kiểu mã hóa trong đó một vài bước mã hóa khối mã không được mã hóa bởi bộ mã số học. Thay vào đó các bit cần mã hóa được nối trực tiếp vào dòng bit mà không cần mã hóa.
3.86 Phép dịch (shift)
Phép nhân hoặc chia với lũy thừa của 2.
3.87 Bit dấu (sign bit)
Một bit chỉ ra một số là dương (giá trị bằng 0) hoặc âm (giá trị bằng 1).
3.88 Phép biểu diễn dấu và độ lớn (sign-magnitude notation)
Biểu diễn nhị phân của một số nguyên trong đó khoảng cách tới gốc được thể hiện bằng số dương và hướng tới gốc (dương hoặc âm) thể hiện bằng một bit dấu riêng duy nhất.
3.89 Bước truyền trọng số (significance propagation pass)
Bước mã hóa hoạt động trên một mặt phẳng bit đơn của khối mã các hệ số.
3.90 Trạng thái có nghĩa (significance state)
Trạng thái của hệ số tại một mặt phẳng bit cụ thể. Nếu một hệ số, trong phép biểu diễn dấu và độ lớn, có độ lớn bit bằng 1 đầu tiên tại một mặt phẳng bit cho trước, thì được coi là “có ý nghĩa”. Nếu không, nó được coi là “không có ý nghĩa”.
3.91 Ảnh gốc (source image)
Ảnh được sử dụng tại đầu vào bộ mã hóa.
3.92 Băng con (subband)
Một nhóm các hệ số biến đổi là kết quả của một loạt các tính toán lọc thông thấp và thông cao, theo cả chiều ngang và chiều dọc.
3.93 Hệ số băng con (sub-band coefficient)
Hệ số biến đổi trong một băng con cho trước.
3.94 Phân tách băng con (sub-band decomposiontion)
Một biến đổi của khối ảnh thành phần thành các băng con.
3.95 Siêu khung (superbox)
Một khung mà bản thân nó chức một chuỗi liên tiếp các khung (và chỉ một chuỗi liên tiếp các khung). Do tập tin JP2 chứa chỉ duy nhất một chuỗi liên tiếp các khung, nên bản thân tập tin JP2 được xem là một siêu khung. Khi được sử dụng như một phần mỗi quan hệ giữa hai khung, thuật ngữ “siêu khung” đề cập đến khung trực tiếp chứa các khung khác.
3.96 Khối ảnh (tile)
Mảng các điểm lưới chữ nhật trên lưới tham chiếu, được ghi nhận bằng độ lệch từ điểm gốc lưới tham chiếu và được xác định cả chiều cao và chiều rộng. Các khối ảnh có thể chồng lấn sử dụng để xác định khối ảnh thành phần.
3.97 Khối ảnh thành phần (tile-component)
Tất cả các mẫu của thành phần ảnh cho trước trong một khối ảnh.
3.98 Chỉ số khối ảnh (tile index)
Chỉ số của khối ảnh hiện tại có phạm vi từ không đến số lượng khối ảnh trừ một.
3.99 Phần khối ảnh (tile-part)
Một phần của dòng mã chứa một vài hoặc tất cả dữ liệu ảnh nén của khối ảnh. Phần khối ảnh bao gồm ít nhất một và đến tất cả các gói tạo nên khối ảnh mã hóa.
3.100 Tiêu đề phần khối ảnh (tile-part header)
Một nhóm các nhãn và đoạn nhãn tại điểm bắt đầu của mỗi phần khối ảnh trong dòng mã mô tả các tham số mã hóa phần khối ảnh.
3.101 Chỉ số phần khối ảnh (tile-part index)
Chỉ số của phần khối ảnh trong một khối ảnh cho trước nằm trong khoảng từ không đến số lượng phần khối ảnh trừ một.
3.102 Phép biến đổi (tranformation)
Ánh xạ toán học từ không gian tín hiệu này sang không gian tín hiệu khác.
3.103 Hệ số biến đổi (transformation coefficient)
Giá trị kết quả của một phép biến đổi.
3.104 XOR
Toán tử logic OR tuyệt đối.
4. Ký hiệu và thuật ngữ viết tắt
1D-DWT |
Biến đổi Sóng con rời rạc 1 chiều |
One-dimensional Discrete Wavelet Transformation |
CCITT |
Ủy ban Tư vấn quốc tế về Điện thoại và Điện báo, nay là ITU-T |
International Telegraph and Telephone Consultative Committee |
CPRL |
Trình tự lũy tiến Thành phần, Vị trí, Mức phân giải và lớp gói dữ liệu trong một khối ảnh. |
Component, Position, Resolution and Layer data packet progression order within a tile |
CSF |
Hàm số độ nhạy tương phản |
Contrast Sensitivity Function |
DSP |
Gói sản phẩm điện ảnh kỹ thuật số |
Digital Cinema Package |
FDWT |
Biến đổi Sóng con rời rạc thuận |
Forward Discrete Wavelet Transformation |
FEC |
Sửa lỗi trước khi truyền |
Forward Error Correction |
ICC |
Hiệp hội màu quốc tế |
International Colour Consortium |
ICT |
Biến đổi màu không khả đảo |
Irreversible Colour transformation |
IDWT |
Biến đổi Sóng con rời rạc nghịch |
Inverse Discrete Wavelet Transformation |
IEC |
Ủy ban kỹ thuật điện quốc tế |
International Electrotechnical Commission |
ISO |
Tổ chức tiêu chuẩn hóa quốc tế |
International Organization for Standardization |
ITTF |
Nhóm đặc trách công nghệ thông tin |
Information Technology Task Force |
ITU |
Liên minh viễn thông quốc tế |
International Telecommunication Union |
ITU-T |
Liên minh viễn thông quốc tế - Lĩnh vực tiêu chuẩn hóa viễn thông |
International Telecommunication Union - Telecommunication Standardization Sector |
JPEG |
Nhóm chuyên gia nghiên cứu tiêu chuẩn về ảnh |
Joint Photographic Experts Group |
JURA |
Cơ quan đăng ký các tiện ích JPEG |
JPEG Utilities Registration Authority |
LRCP |
Trình tự lũy tiến Lớp, Mức phân giải, Thành phần và Vị trí gói dữ liệu trong một khối ảnh. |
Layer, Resolution, Component and Position data packet progression order within a tile |
LSB |
Bit có trọng số nhỏ nhất |
Least Significant Bit |
MSB |
Bit có trọng số lớn nhất |
Most Significant Bit |
MSE |
Sai số toàn phương trung bình |
Mean Squared Error |
PCRL |
Trình tự lũy tiến Vị trí, Thành phần, Mức phân giải và Lớp gói dữ liệu trong một khối ảnh. |
Position, Component, Resolution and Layer data packet progression order within a tile |
PCS |
Không gian kết nối profile |
Profile Connection Space |
RCT |
Biến đổi màu khả đảo |
Reversible Colour Transformation |
RLCP |
Trình tự lũy tiến Mức phân giải, Lớp, Thành phần và Vị trí gói dữ liệu trong một khối ảnh. |
Resolution, Layer, Component, and Position data packet progression order within a tile |
ROI |
Vùng quan tâm |
Region of Interest |
RPCL |
Trình tự lũy tiến Mức phân giải, Vị trí, Thành phần và Lớp gói dữ liệu trong một khối ảnh. |
Resolution, Position, Component, and Layer data packet progression order within a tile |
SNR |
Tỷ lệ tín hiệu nhiễu |
Signal to Noise Ratio |
TCP |
Giao thức kiểm soát truyền tải |
Transmission Control Protocol |
UCS |
Bộ ký tự toàn cầu |
Universal Character Set |
URI |
Định danh tài nguyên thống nhất |
Uniform Resource Identifier |
URL |
Định vị tài nguyên thống nhất |
Uniform Resource Locator |
UTF-8 |
Định dạng chuyển đổi mã ký tự toàn cầu 8-bit |
UCS Transformation Format 8 |
UUID |
Định danh duy nhất trên toàn cầu |
Universal Unique Identifier |
XML |
Ngôn ngữ đánh dấu mở rộng |
Extensible Markup Language |
W3C |
Hiệp hội Web toàn cầu |
World-Wide Web Consortium |
0x---- Biểu thị số hệ thập lục phân
\nnn Một số có 3 chữ số đặt sau dấu gạch chéo chỉ ra giá trị của một byte duy nhất trong chuỗi ký tự, trong đó 3 chữ số quy định giá trị bát phân của byte.
ɛb Số mũ của giá trị lượng tử cho một băng con được quy định trong QCD và QCC
µb Phần định trị của giá trị lượng tử cho một băng con được quy định trong QCD và QCC
Mb Số lượng mặt phẳng bit tối đa được mã hóa trong một khối mã cho trước
NL Số mức phân tách được quy định trong COD và COC
Rb Dải động của một mẫu thành phần ảnh được quy định trong SIZ
COC Nhãn kiểu mã hóa thành phần ảnh
COD Nhãn kiểu mã hóa mặc định
COM Nhãn chú thích
CRG Nhãn đăng ký thành phần
EPH Nhãn kết thúc tiêu đề gói
EOC Nhãn kết thúc dòng mã
PLM Nhãn tiêu đề phần chính, độ dài gói
PLT Nhãn tiêu đề phần khối ảnh, độ dài gói
POC Nhãn thay đổi thứ tự lũy tiến
PPM Nhãn tiêu đề phần chính, các tiêu đề gói được đóng gói
PPT Nhãn tiêu đề phần khối ảnh, các tiêu đề gói được đóng gói
QCC Nhãn thành phần lượng tử hóa
QCD Nhãn mặc định lượng tử hóa
RGN Nhãn vùng quan tâm
SIZ Nhãn kích cỡ khối ảnh và ảnh
SOC Nhãn bắt đầu dòng mã
SOP Nhãn bắt đầu gói
SOD Nhãn bắt đầu dữ liệu
SOT Nhãn bắt đầu phần khối ảnh
TLM Nhãn độ dài phần khối ảnh
Tiêu chuẩn này mô tả một hệ thống nén ảnh, có sự linh hoạt lớn, không chỉ cho phép nén ảnh, mà còn cho phép truy cập vào dòng mã. Dòng mã cung cấp một số cơ chế để định vị và trích chọn các phần của dữ liệu ảnh nén với mục đích truyền lại, lưu trữ, hiển thị hoặc chỉnh sửa. Việc truy cập này cho phép lưu trữ và tra cứu dữ liệu ảnh nén phù hợp với một ứng dụng nhất định, mà không cần giải mã.
Việc phân chia cả dữ liệu ảnh gốc và dữ liệu ảnh nén trong một số cách dẫn đến khả năng trích chọn dữ liệu ảnh từ dữ liệu ảnh nén để tạo thành một ảnh tái tạo có độ phân giải thấp hơn hoặc độ chính xác thấp hơn hoặc một vùng của ảnh gốc. Điều này cho phép kết hợp dòng mã với các kênh truyền dẫn, thiết bị lưu trữ hoặc thiết bị hiển thị với kích thước bất kỳ, mà không cần quan tâm đến số lượng chính xác thành phần ảnh và mẫu của ảnh gốc. Dòng mã có thể được thao tác mà không cần giải mã để đạt được trật tự sắp xếp hiệu quả hơn bằng ứng dụng nhất định.
Như vậy, các tính năng phức tạp của tiêu chuẩn này cho phép sử dụng hiệu quả một dòng mã duy nhất với một số ứng dụng. Ví dụ, các thiết bị có nguồn hình ảnh lớn nhất có thể cung cấp một dòng mã dễ dàng xử lý với các thiết bị hiển thị hình ảnh nhỏ nhất.
Nói chung, tiêu chuẩn này nói về lĩnh vực: không gian (các mẫu), phép biến đổi (các hệ số) và các dữ liệu ảnh nén. Một số đối tượng (ví dụ, khối ảnh thành phần) có ý nghĩa đối với cả ba lĩnh vực. Các đối tượng khác (ví dụ, khối mã hoặc gói) chỉ có ý nghĩa trong một lĩnh vực (ví dụ, phép biến đổi và dữ liệu ảnh nén, tương ứng). Việc chia tách của một đối tượng thành nhiều đối tượng vào cùng một lĩnh vực (ví dụ, thành phần ảnh thành khối ảnh thành phần) được mô tả riêng cho từng lĩnh vực.
5.1 Mục đích
Có bốn yếu tố chính được mô tả trong tiêu chuẩn này:
- Bộ mã hóa: Biểu hiện của quá trình mã hóa. Một bộ mã hóa lấy dữ liệu và các thông số kỹ thuật ảnh gốc kỹ thuật số ở đầu vào, bằng một tập hợp các thủ tục tạo ra dòng mã ở đầu ra.
- Bộ giải mã: Biểu hiện của quá trình giải mã. Một bộ giải mã lấy dữ liệu và các thông số kỹ thuật của ảnh nén ở đầu vào và bằng một tập hợp các thủ tục cho trước tạo ra dữ liệu ảnh tái tạo kỹ thuật số ở đầu ra.
- Cú pháp dòng mã: Biểu diễn của dữ liệu ảnh nén bao gồm tất cả các thông số kỹ thuật mà quá trình giải mã yêu cầu.
- Định dạng tập tin tùy chọn: Định dạng tập tin tùy chọn để trao đổi giữa các môi trường ứng dụng. Dòng mã có thể được sử dụng với các định dạng tập tin khác hoặc đứng một mình mà không cần định dạng tập tin này.
5.2 Dòng mã
Dòng mã là một dòng bit tuyến tính từ bit đầu tiên đến bit cuối cùng. Để thuận tiện, nó có thể được chia thành các byte (8-bit), điểm bắt đầu với bit đầu tiên của dòng mã, với bit "đầu" trong một byte được xem như là bit quan trọng nhất của byte cho trước, ví dụ, biểu diễn hệ thập lục phân. Dòng byte này có thể được chia thành các nhóm byte liên tiếp. Biểu diễn giá trị hệ thập lục phân đôi khi mặc nhiên được thừa nhận trong các văn bản khi mô tả các byte hoặc một nhóm các byte mà không có biểu diễn giá trị số "tự nhiên" nào.
5.3 Các nguyên tắc mã hóa
Các thủ tục chính của tiêu chuẩn này được thể hiện trong Hình 5.1. Hình này cho thấy chỉ quá trình giải mã là theo trình tự. Dữ liệu ảnh nén ấn định khái niệm cho từng phần dữ liệu ảnh. Các thủ tục được trình bày trong phụ lục theo trình tự của quá trình giải mã. Quá trình mã hóa được tóm tắt như bên dưới.
CHÚ THÍCH 1: Các phụ lục từ A đến I là quy định của tiêu chuẩn này. Tuy nhiên, một số mục nhỏ được ký hiệu, ghi chú và tất cả các ví dụ chỉ mang tính tham khảo.
Đa phần ảnh có nhiều thành phần. Tiêu chuẩn này có một phép biến đổi nhiều thành phần để giải tương quan ba thành phần. Đây là chức năng duy nhất trong tiêu chuẩn này liên hệ các thành phần với nhau (xem Phụ lục G).
Các thành phần ảnh được chia thành các khối ảnh. Khối ảnh thành phần là các mảng hình chữ nhật có liên hệ với các phần tương tự khác của từng thành phần tạo nên ảnh. Như vậy, việc cắt lát ảnh thực sự tạo ra các khối ảnh thành phần có thể trích chọn hoặc giải mã độc lập với nhau. Khối ảnh độc lập này cung cấp một trong những phương pháp để trích chọn một vùng ảnh (xem Phụ lục B).
Các khối ảnh thành phần được phân tách thành các mức phân tách khác nhau bằng cách sử dụng phép biến đổi sóng con. Các mức phân tách chứa một số băng con gắn với các hệ số mô tả đặc tính tần số trọng không gian theo chiều ngang và theo chiều dọc của các khối ảnh thành phần gốc. Các hệ số cung cấp thông tin tần số của một khu vực cục bộ, chứ không phải toàn bộ hình ảnh giống như trong phép biến đổi Fourier. Do đó, một lượng ít các hệ số hoàn toàn có thể mô tả một mẫu duy nhất. Mỗi mức phân tách liên quan đến mức phân tách tiếp theo bởi độ phân giải không gian. Tức là, ảnh sau khi phân tách một băng con có độ phân giải theo chiều ngang và chiều dọc bằng nửa so với độ phân giải của băng con đó. Các hình ảnh độ phân giải thấp hơn so với ảnh gốc được tạo ra bằng cách giải mã một tập con được chọn từ các băng con này (xem Phụ lục F).
Mặc dù có rất nhiều hệ số cũng như các mẫu, nội dung thông tin có xu hướng tập trung ở một vài hệ số. Thông qua lượng tử hóa, nội dung thông tin của phần lớn các hệ số có độ lớn nhỏ sẽ bị rút gọn (Phụ lục E). Quá trình xử lý bổ sung bởi các bộ mã hóa entropy làm giảm số bit cần thiết để biểu diễn các hệ số đã lượng tử hóa, đôi khi đáng kể so với ảnh gốc (xem phụ lục C, D và B).
Hình 5.1 - Sơ đồ khối chi tiết kỹ thuật
Các băng con riêng của một khối ảnh thành phần được chia tiếp thành các khối mã. Các mảng hệ số hình chữ nhật này có thể trích chọn độc lập. Các mặt phẳng bit đơn các hệ số trong một khối mã được mã hóa bằng ba bước mã hóa. Mỗi bước mã hóa này thu thập thông tin theo ngữ cảnh về dữ liệu ảnh nén trong mặt phẳng bit (xem Phụ lục D). Một bộ mã hóa số học sử dụng thông tin theo ngữ cảnh này và trạng thái nội bộ, để giải mã dòng bit nén (xem Phụ lục C). Các cơ chế chấm dứt khác nhau cho phép trích chọn độc lập các mức khác nhau của dữ liệu ảnh nén trong bước mã hóa này.
Các dòng bit dữ liệu ảnh nén được tạo ra từ các bước mã hóa được nhóm trong các lớp ảnh. Các lớp ảnh là nhóm các bước mã hóa bất kỳ từ các khối mã (xem Phụ lục B).
CHÚ THÍCH 2 : Mặc dù có sự linh hoạt tuyệt vời trong phân lớp, giả thiết là mỗi lớp ảnh kế tiếp góp phần vào hình ảnh chất lượng cao hơn.
Các hệ số băng con tại mỗi mức phân giải phân chia thành các vùng chữ nhật gọi là phân khu ảnh (xem Phụ lục B).
Các gói là đơn vị cơ bản của dòng mã nén. Một gói chứa dữ liệu ảnh nén từ một lớp của phân khu của mức phân giải của khối ảnh thành phần. Các gói cung cấp một phương pháp khác để trích chọn một vùng không gian độc lập từ dòng mã. Các gói này được xen kẽ trong dòng mã sử dụng một vài phương pháp khác nhau (xem Phụ lục B).
Một cơ chế được cung cấp cho phép các dữ liệu ảnh nén tương ứng với vùng quan tâm trong các khối ảnh thành phần ban đầu được mã hóa và được đặt trước trong dòng bit (xem Phụ lục H).
Một số cơ chế được cung cấp cho phép phát hiện và che giấu các bit lỗi có thể xuất hiện trên một kênh truyền nhiễu (xem D.5 và J.7).
Các dòng mã liên quan đến khối ảnh được tổ chức trong các gói, được bố trí trong một hoặc nhiều phần khối ảnh. Tiêu đề phần khối ảnh, bao gồm một loạt các nhãn và các đoạn nhãn, chứa thông tin về các cơ chế khác nhau và các kiểu mã hóa cần thiết để định vị, trích chọn, giải mã và tái tạo lại tất cả khối ảnh thành phần. Tại điểm bắt đầu của toàn bộ dòng mã là tiêu đề chính, bao gồm các nhãn và các đoạn nhãn cung cấp thông tin tương tự, cũng như thông tin về ảnh gốc (xem Phụ lục A).
Các dòng mã tùy chọn đóng gói trong một định dạng tập tin cho phép các ứng dụng biên dịch ý nghĩa và các thông tin khác của ảnh. Định dạng tập tin có thể chứa dữ liệu bên cạnh dòng mã (xem Phụ lục I).
Trong tài liệu, các thủ tục chia ảnh gốc như sau:
- Các thành phần của ảnh được chia thành các khối ảnh chữ nhật. Khối ảnh thành phần là đơn vị cơ bản của ảnh gốc hoặc ảnh tái tạo.
- Thực hiện phép biến đổi sóng con trên khối ảnh thành phần tạo ra các mức phân tách.
- Các mức phân tách tạo thành từ các băng con của các hệ số mô tả các đặc tính tần số của các khu vực cục bộ (chứ không phải trên toàn bộ khối ảnh thành phần) của khối ảnh thành phần.
- Các băng con của các hệ số được lượng tử hóa và tập hợp vào các mảng chữ nhật của khối mã.
- Mỗi mặt phẳng bit của các hệ số trong một khối mã được mã hóa entropy bằng ba bước mã hóa.
- Một vài hệ số có thể được mã hóa đầu tiên để cung cấp một vùng quan tâm.
Tại điểm này, các dữ liệu ảnh hoàn toàn chuyển đổi thành dữ liệu ảnh nén. Các thủ tục lắp ráp lại các đơn vị dòng bit vào dòng bit như sau:
- Các dữ liệu ảnh nén từ các bước mã hóa được thu thập trong các lớp.
- Các gói là dữ liệu ảnh nén được cấu tạo từ một phân khu ảnh của một lớp duy nhất của một mức phân giải duy nhất của một khối ảnh thành phần duy nhất. Các gói là đơn vị cơ bản của dữ liệu ảnh nén.
- Tất cả các gói từ một khối ảnh được xen kẽ theo một trong các thứ tự và được đặt trong một hoặc nhiều phần khối ảnh.
- Các phần khối ảnh có một mô tả tiêu đề phần khối ảnh và có thể được xen kẽ theo một số thứ tự.
- Các dòng mã có tiêu đề chính tại điểm bắt đầu mô tả ảnh gốc và kiểu khai triển và mã hóa khác nhau.
- Các định dạng tập tin tùy chọn mô tả ý nghĩa của ảnh và các thành phần của nó theo ngữ cảnh của ứng dụng.
Quá trình mã hóa chuyển đổi dữ liệu ảnh gốc thành dữ liệu ảnh nén. Các phụ lục A, B, C, D, E, F, G và H mô tả quá trình mã hóa. Tất cả quá trình mã hóa chỉ mang tính tham khảo.
Bộ mã hóa là bộ phận thực hiện quá trình mã hóa. Để tương thích với tiêu chuẩn này, bộ mã hóa sẽ chuyển đổi dữ liệu ảnh gốc thành dữ liệu ảnh nén phù hợp với cú pháp dòng mã được quy định tại Phụ lục A.
Quá trình giải mã chuyển đổi dữ liệu ảnh nén thành dữ liệu ảnh tái tạo. Các phụ lục từ A đến H mô tả và quy định quá trình giải mã. Tất cả quá trình giải mã là quy định bắt buộc.
Bộ giải mã là bộ phận thực hiện quá trình giải mã. Để tương thích với tiêu chuẩn này, bộ giải mã sẽ chuyển đổi toàn bộ hoặc một phần cụ thể của dữ liệu ảnh nén bất kỳ phù hợp với cú pháp dòng mã được quy định tại Phụ lục A thành một ảnh tái tạo.
Không có quy định hoặc yêu cầu cài đặt nào đối với bộ mã hóa và giải mã. Trong một số trường hợp, các mô tả sử dụng các kỹ thuật cài đặt cụ thể với mục đích minh họa.
7.1 Các yêu cầu cú pháp dòng mã
Phụ lục A mô tả cú pháp dòng mã định nghĩa biểu diễn mã hóa của dữ liệu ảnh nén để trao đổi giữa các môi trường ứng dụng. Mọi dữ liệu ảnh nén được thực hiện theo cú pháp và gán mã thích hợp cho các quá trình mã hóa được định nghĩa trong tiêu chuẩn này.
Tiêu chuẩn này không bao gồm quy định về tuân thủ hoặc tương thích. Các giá trị tham số của cú pháp được mô tả trong Phụ lục A không nhằm để miêu tả các khả năng yêu cầu phải tuân thủ.
7.2 Các yêu cầu định dạng tập tin tùy chọn
Phụ lục I mô tả định dạng tập tin tùy chọn có chứa dữ liệu đặc tả về hình ảnh bổ sung cho dòng mã. Dữ liệu này cho phép hiển thị hoặc in ở độ phân giải cụ thể. Các định dạng tập tin tùy chọn, khi được sử dụng, phù hợp với cú pháp định dạng tập tin và gán mã thích hợp cho quá trình mã hóa được định nghĩa trong tiêu chuẩn này.
Không có quy định hoặc yêu cầu ứng dụng nào đối với tiêu chuẩn này. Trong một số trường hợp, các mô tả sử dụng các kỹ thuật ứng dụng cụ thể với mục đích minh họa.
Trong phụ lục này tất cả các mục nhỏ, lưu đồ và bảng biểu mang tính quy phạm chỉ được hiểu rằng chúng định nghĩa một đầu ra mà các cài đặt thay thế có thể sao chép lại.
Phụ lục này quy định cú pháp và ngữ nghĩa của nhãn và đoạn nhãn được định nghĩa trong tiêu chuẩn này. Những nhãn và đoạn nhãn này cung cấp thông tin cho dòng mã của tiêu chuẩn. Ngoài ra, phụ lục này còn cung cấp một cú pháp nhãn và đoạn nhãn được thiết kế để được sử dụng trong các tài liệu kỹ thuật trong tương lai bao gồm cả tiêu chuẩn này như một tham chiếu quy phạm.
Tiêu chuẩn này không gồm các định nghĩa về tuân thủ hoặc tương thích. Các giá trị tham số của cú pháp được mô tả trong phụ lục này không nhằm mục đích miêu tả các khả năng yêu cầu phải tuân thủ.
A.1 Nhãn, đoạn nhãn và tiêu đề
Tiêu chuẩn này sử dụng nhãn và đoạn nhãn để phân tách và báo hiệu các đặc tính của ảnh gốc và dòng mã. Bộ nhãn và đoạn nhãn này là thông tin tối thiểu cần thiết để thực hiện các tính năng của tiêu chuẩn này và không phải là một định dạng tập tin. Định dạng tập tin tối thiểu được mô tả trong Phụ lục I.
Các tiêu đề chính và phần khối ảnh là tập hợp các nhãn và đoạn nhãn. Các tiêu đề chính được tìm thấy ở phần đầu của dòng mã. Các tiêu đề phần khối ảnh được tìm thấy ở phần đầu của mỗi phần khối ảnh (xem dưới đây). Một số nhãn và đoạn nhãn bị giới hạn chỉ dùng với một trong hai loại tiêu đề trong khi những nhãn khác có thể được tìm thấy trong cả hai.
Mỗi nhãn có độ dài hai byte. Byte đầu tiên bao gồm byte 0xFF duy nhất. Byte thứ hai biểu thị các nhãn cụ thể và có giá trị bất kỳ trong phạm vi 0x01 để 0xFE. Một vài nhãn trong số này được sử dụng trong tiêu chuẩn ITU-T T.81 | ISO / IEC 10918-1 và ITU-T T.84 | ISO / IEC 10918-3 được xem là dự phòng trừ trường hợp sử dụng cụ thể.
Đoạn nhãn gồm một nhãn và các tham số liên quan gọi là tham số đoạn nhãn. Trong mỗi đoạn nhãn hai byte đầu tiên phía sau nhãn là một giá trị không dấu biểu thị chiều dài tính bằng byte của các tham số đoạn nhãn (bao gồm cả hai byte chiều dài tham số, nhưng không phải là hai byte của chính nhãn đó). Khi một đoạn nhãn không được quy định trong tiêu chuẩn này xuất hiện trong dòng mã, bộ giải mã sẽ sử dụng các tham số chiều dài để loại bỏ đoạn nhãn.
A.1.1 Các loại nhãn và đoạn nhãn
Có sáu loại nhãn và đoạn nhãn được sử dụng: phân tách, thông tin cố định, chức năng, trong dòng bit, con trỏ và mang thông tin. Nhãn và đoạn nhãn phân giới được sử dụng để đóng khung các tiêu đề chính và tiêu đề phần khối ảnh và dữ liệu dòng bit. Nhãn và đoạn nhãn thông tin cố định cung cấp thông tin cần thiết về hình ảnh. Vị trí của các đoạn nhãn này, chẳng hạn như nhãn và đoạn nhãn phân giới được chỉ định. Đoạn nhãn chức năng được sử dụng để mô tả các chức năng mã hóa được sử dụng. Nhãn và đoạn nhãn trong dòng bit được sử dụng cho khả năng kháng lỗi. Đoạn nhãn con trỏ cung cấp các độ lệch cụ thể trong dòng bit. Đoạn nhãn mang thông tin cung cấp thông tin bổ sung.
A.1.2 Các cú pháp tương tự với tiêu chuẩn ITU-T T.81 | ISO/IEC 10918-1
Cú pháp nhãn và đoạn nhãn sử dụng cùng cấu trúc được trong quy định tiêu chuẩn ITU-T T.81 | ISO/IEC 10918-1.
Phạm vi nhãn từ 0xFF30 đến 0xFF3F được dự phòng cho tiêu chuẩn này dành cho các nhãn không có tham số đoạn nhãn. Bảng A.1 xác định các giá trị này của các nhãn và đoạn nhãn.
Bảng A.1 - Định nghĩa nhãn
Phạm vi mã nhãn |
Tiêu chuẩn quy định |
0xFF00, 0xFF01, 0xFFFE, 0xFFC0 đến 0xFFDF |
Quy định tại tiêu chuẩn ITU-T T.81 | ISO/IEC 10918-1 |
0xFFF0 đến 0xFFF6 |
Quy định tại tiêu chuẩn ITU-T T.84 | ISO/IEC 10918-3 |
0xFFF7 đến 0xFFF8 |
Quy định tại tiêu chuẩn ITU-T T.87 | ISO/IEC 14495-1 |
0xFF4F đến 0xFF6F, 0xFF90 đến 0xFF93 |
Quy định tại tiêu chuẩn này |
0xFF30 đến 0xFF3F |
Dự phòng chỉ quy định cho các nhãn (không phải các đoạn nhãn) |
|
Tất cả các giá trị khác được dự phòng |
A.1.3 Các quy tắc cho nhãn, đoạn nhãn và dòng mã
- Đoạn nhãn, tiêu đề chính và tiêu đề phần khối ảnh, là bội số của 8 bit (một byte). Hơn nữa, dữ liệu dòng bit giữa các tiêu đề và trước các nhãn EOC (xem A.4.4) được đệm vào cũng phải được căn chỉnh với bội số của 8 bit.
- Tất cả các đoạn nhãn trong một tiêu đề phần khối ảnh chỉ áp dụng cho khối ảnh đó.
- Tất cả các đoạn nhãn trong tiêu đề chính áp dụng cho toàn bộ hình ảnh trừ khi được ghi đè đặc biệt bởi nhãn hoặc đoạn nhãn trong tiêu đề phần khối ảnh
- Nhãn và đoạn nhãn phân giới và thông tin cố định phải xuất hiện tại các vị trí cụ thể trong dòng mã.
- Các đoạn nhãn mô tả chính xác các hình ảnh đại diện bởi các dòng mã. Nếu thực hiện cắt ngắn, thay đổi hoặc chỉnh sửa các dòng mã, thì các đoạn nhãn sẽ được cập nhật, nếu cần thiết.
- Tất cả các giá trị tham số trong đoạn nhãn đều dạng big-endian.
- Các đoạn nhãn có thể xuất hiện theo thứ tự bất kỳ một tiêu đề cho trước. Ngoại trừ trường hợp nhãn và đoạn nhãn phân giới và nhãn và đoạn nhãn thông tin cố định.
- Tất cả các nhãn với mã nhãn trong khoảng 0xFF30 và 0xFF3F đều không có tham số đoạn nhãn. Chúng sẽ bị bỏ qua bởi bộ giải mã.
- Một số đoạn nhãn có giá trị được gán bởi các nhóm bit trong tham số. Trong một số trường hợp có các bit, ký hiệu “x”, không được gán một giá trị cho trường bất kỳ nào trong một tham số. Các dòng mã sẽ chứa giá trị không cho tất cả các bit như vậy. Các bộ giải mã sẽ bỏ qua các bit này.
CHÚ THÍCH: Các nhãn trong khoảng 0xFF30 đến 0xFF3F có thể được sử dụng để mở rộng trong tương lai. Chúng có thể hoặc không thể bị bỏ qua bởi bộ giải mã mà không cần phân nhánh.
A.1.4 Các mô tả đồ họa quan trọng (tham khảo)
Mỗi đoạn nhãn được mô tả theo chức năng, cách sử dụng và độ dài của nó. Các chức năng mô tả thông tin chứa trong đoạn nhãn. Cách sử dụng mô tả vị trí logic và tần suất của đoạn nhãn này trong dòng mã. Độ dài mô tả các tham số xác định chiều dài của đoạn nhãn.
Các mô tả này theo sau các hình minh họa trình bày thứ tự và mối quan hệ của các tham số trong đoạn nhãn. Hình A.1 trình bày một ví dụ về loại hình minh họa này. Các đoạn nhãn được biểu thị bởi mã ba ký tự của nhãn được gán cho đoạn nhãn. Các ký hiệu tham số biểu thị bằng ký tự in hoa theo sau là ký tự nhãn biểu thị bằng các ký tự in thường. Hình chữ nhật được sử dụng để chỉ ra vị trí tham số trong dòng mã. Chiều rộng của hình chữ nhật là tỷ lệ thuận với số lượng byte của tham số. Hình chữ nhật tô đậm (sọc chéo) chỉ ra rằng các tham số là có kích thước thay đổi. Hai tham số với chỉ số trên và vùng màu xám giữa chúng chỉ ra trình tự của các tham số này.
Hình A.1 - Ví dụ về hình minh họa đoạn nhãn.
Theo sau hình minh họa là một danh sách các mô tả ý nghĩa của từng tham số trong đoạn nhãn. Nếu tham số được lặp lại, độ dài và tính chất của trình tự các tham số được định nghĩa. Ví dụ, trong hình A.1, hình chữ nhật đầu tiên biểu diễn nhãn với ký hiệu MAR. Hình chữ nhật thứ hai biểu diễn độ dài của tham số. Các tham số Amar, Bmar, Cmar và Dmar tương ứng với độ dài 8, 16, 32-bit và độ dài thay đổi. Ký hiệu Emari mô tả n tham số khác nhau, Emari, trong một hàng.
Sau danh sách là một bảng cũng mô tả các giá trị tham số được cho phép hoặc cung cấp tham chiếu đến các bảng khác mô tả các giá trị này. Bảng tham số riêng được cung cấp để mô tả tham số bất kỳ mà không có giá trị số đơn giản. Trong một số trường hợp, những tham số này mô tả bởi giá trị bit trong một trường bit. Trong trường hợp này, "x" được sử dụng để biểu thị các bit không bao gồm đặc tính của tham số hoặc tham số con ở hàng tương ứng của bảng.
Một số tham số đoạn nhãn được mô tả bằng cách sử dụng ký hiệu "Sxxx" và "SPxxx" (với ký hiệu nhãn, XXX). Tham số Sxxx lựa chọn giữa các trạng thái có thể của tham số SPxxx. Theo lựa chọn này, tham số SPxxx hoặc danh sách tham số bị sửa đổi.
A.2 Thông tin trong đoạn nhãn
Bảng A.2 liệt kê các nhãn được quy định trong tiêu chuẩn này. Bảng A.3 trình bày một danh sách trong đó thông tin được cung cấp bởi nhãn và đoạn nhãn.
Bảng A.2 - Danh sách nhãn và đoạn nhãn
|
Ký hiệu |
Mã |
Tiêu đề chính |
Tiêu đề phần khối ảnh |
Nhãn và đoạn nhãn phân giới |
|
|
|
|
Bắt đầu của dòng mã |
SOC |
0xFF4F |
bắt buộca |
không cho phép |
Bắt đầu của phần khối ảnh |
SOT |
0xFF90 |
không cho phép |
bắt buộc |
Bắt đầu của dữ liệu |
SOD |
0xFF93 |
không cho phép |
nhãn cuối cùng |
Kết thúc của dòng mã |
EOC |
0xFFD9 |
không cho phép |
không cho phép |
Đoạn nhãn thông tin cố định |
|
|
|
|
Kích thước ảnh và khối ảnh |
SIZ |
0xFF51 |
bắt buộc |
không cho phép |
Đoạn nhãn chức năng |
|
|
|
|
Kiểu mã hóa mặc định |
COD |
0xFF52 |
bắt buộc |
tùy chọn |
Thành phần kiểu mã hóa |
COC |
0xFF53 |
tùy chọn |
tùy chọn |
Vùng quan tâm |
RGN |
0xFF5E |
tùy chọn |
tùy chọn |
Lượng tử hóa mặc định |
QCD |
0xFF5C |
bắt buộc |
tùy chọn |
Thành phần lượng tử hóa |
QCC |
0xFF5D |
tùy chọn |
tùy chọn |
Thay đổi trình tự lũy tiếnb) |
POC |
0xFF5F |
tùy chọn |
tùy chọn |
Đoạn nhãn con trỏ |
|
|
|
|
Độ dài phần khối ảnh |
TLM |
0xFF55 |
tùy chọn |
không cho phép |
Tiêu đề chính, độ dài gói |
PLM |
0xFF57 |
tùy chọn |
không cho phép |
Tiêu đề phần khối ảnh, độ dài gói |
PLT |
0xFF58 |
không cho phép |
tùy chọn |
Tiêu đề chính, tiêu đề gói được đóng góic) |
PPM |
0xFF60 |
tùy chọn |
không cho phép |
Tiêu đề phần khối ảnh, tiêu đề gói được đóng góic) |
PPT |
0xFF61 |
không cho phép |
tùy chọn |
Nhãn và đoạn nhãn trong dòng bit |
|
|
|
|
Bắt đầu gói |
SOP |
0xFF91 |
không cho phép |
không cho phép trong tiêu đề phần khối ảnh, tùy chọn trong trong nhãn dòng bit |
Kết thúc tiêu đề gói |
EPH |
0xFF92 |
tùy chọn trong đoạn nhãn PPM |
tùy chọn trong đoạn nhãn PPT và nhãn trong dòng bit |
Đoạn nhãn mang thông tin |
|
|
|
|
Đăng ký thành phần ảnh |
CRG |
0xFF63 |
tùy chọn |
không cho phép |
Chú giải |
COM |
0xFF64 |
tùy chọn |
tùy chọn |
a) "bắt buộc" có nghĩa là nhãn hoặc đoạn nhãn phải có trong tiêu đề này; “tùy chọn” nghĩa là có thể được sử dụng. b) Đoạn nhãn POC bắt buộc khi có sự thay đổi trình tự lũy tiến. c) Đoạn nhãn PPM hoặc PPT bắt buộc khi các tiêu đề gói không được phân phối trong dòng bit. Nếu sử dụng đoạn nhãn PPM thì các đoạn nhãn PPT sẽ không được sử dụng và ngược lại. |
Bảng A.3 - Thông tin trong đoạn nhãn
Thông tin |
Đoạn nhãn |
Các khả năng Kích thước vùng ảnh hoặc kích thước lưới tham chiếu (chiều cao và chiều rộng) Kích thước khối ảnh (chiều cao và chiều rộng) Số lượng thành phần ảnh Độ chính xác của thành phần ảnh Thành phần ảnh ánh xạ lên lưới tham khảo (lấy mẫu con) |
SIZ |
Chỉ số khối ảnh Độ dài dữ liệu phần khối ảnh |
SOT, TLM |
Trình tự lũy tiến Số lượng lớp Sử dụng phép biến đổi đa thành phần |
COD |
Kiểu mã hóa Số mức phân tách Kích thước khối mã Kiểu khối mã Phép biến đổi sóng con Kích thước phân khu ảnh |
COD, COC |
Dịch vùng quan tâm |
RGN |
Không lượng tử hóa Lượng tử hóa dẫn xuất Lượng tử hóa dẫn giải |
QCD, QCC |
Điểm bắt đầu lũy tiến Điểm bắt kết thúc lũy tiến Mặc định trình tự lũy tiến |
POC |
Kháng lỗi |
SOP |
Kết thúc của tiêu đề gói |
EPH |
Tiêu đề gói |
PPM, PPT |
Độ dài gói |
PLM, PLT |
Đăng ký thành phần ảnh Thông tin bổ sung |
CRG COM |
A.3 Cấu trúc của dòng mã
Hình A.2 trình bày cấu trúc của dòng mã. Hình A.3 trình bày cấu trúc của tiêu đề chính. Tất cả các đường nét đậm chỉ ra đoạn nhãn yêu cầu. Các nhãn và đoạn nhãn sau đây được yêu cầu tại một vị trí cụ thể: SOC, SIZ, SOT, SOD và EOC. Các đường nét đứt chỉ ra đoạn nhãn tùy chọn hoặc không cần thiết. Hình A.4 trình bày cấu trúc tiêu đề phần khối ảnh đầu tiên trong một khối ảnh cho trước. Hình A.5 minh họa cấu trúc của tiêu đề các phần khối ảnh còn lại trong khối ảnh.
Hình A.2 - Cấu trúc của dòng mã
Hình A.3 - Cấu trúc của tiêu đề chính
Hình A.4 - Cấu trúc của tiêu đề phần khối ảnh đầu tiên trong khối ảnh cho trước
Hình A.5 - Cấu trúc của tiêu đề phần khối ảnh còn lại
Đoạn nhãn COD và COC và đoạn nhãn QCD và QCC có phân cấp trong cách sử dụng. Điều này được ký hiệu cho phép khối ảnh thành phần có các đặc tính mã hóa và lượng tử hóa khác nhau với mức báo hiệu tối thiểu.
Ví dụ, đoạn nhãn COD được yêu cầu trong tiêu đề chính. Nếu tất cả các thành phần trong tất cả các khối ảnh được mã hóa theo cùng một cách, thì nó là tất cả những gì được yêu cầu. Nếu có một thành phần được mã hóa khác hơn so với những phận khác (ví dụ, thành phần độ chói của ảnh bao gồm thành phần độ chói và độ màu), thì các COC có thể biểu thị trong tiêu đề chính. Nếu một hoặc nhiều thành phần được mã hóa khác nhau trong các khối ảnh khác nhau, thì COD và COC được sử dụng một cách tương tự để biểu thị điều này trong các tiêu đề phần khối ảnh.
Đoạn nhãn POC xuất hiện trong tiêu đề chính được sử dụng cho tất cả các khối ảnh trừ khi một POC khác xuất hiện trong tiêu đề phần khối ảnh.
Với những trường hợp ngoại lệ của các nhãn và đoạn nhãn SOC, SOT, SOD, EOC và SIZ, các đoạn nhãn có thể xuất hiện theo thứ tự bất kỳ trong các tiêu đề tương ứng.
A.4 Nhãn và đoạn nhãn phân giới
Nhãn và đoạn nhãn phân giới xuất hiện trong tất cả các dòng mã phù hợp với tiêu chuẩn này. Mỗi dòng mã có một nhãn SOC, một nhãn EOC và ít nhất một phần khối ảnh. Mỗi phần khối ảnh có một nhãn SOT và một mã SOD. SOC, SOD và EOC là nhãn phân giới không phải đoạn nhãn và không có thông tin chiều dài rõ ràng hoặc các tham số khác.
A.4.1 Bắt đầu của dòng mã (SOC)
Chức năng: nhãn bắt đầu của dòng mã được quy định trong tiêu chuẩn này.
Cách sử dụng: Tiêu đề chính. Đây là nhãn đầu tiên trong dòng mã. Chỉ có duy nhất một SOC trong mỗi dòng mã.
Độ dài: Cố định.
SOC: Mã nhãn.
Bảng A.4 - Giá trị tham số Bắt đầu của dòng mã (SOC)
Tham số |
Kích thước (bit) |
Giá trị |
SOC |
16 |
0xFF4F |
A.4.2 Bắt đầu của phần khối ảnh (SOT)
Chức năng: Nhãn bắt đầu của phần khối ảnh, chỉ số khối ảnh của nó và chỉ số phần khối ảnh của nó. Các phần khối ảnh của khối ảnh trong trước xuất hiện theo thứ tự (xem TPsot) trong dòng mã. Tuy nhiên, các phần khối khối ảnh của khối ảnh khác có thể được xen kẽ trong dòng mã. Do đó, các phần khối ảnh từ khối ảnh cho trước không xuất hiện liên tiếp trong dòng mã.
Cách sử dụng: Tất cả tiêu đề phần khối ảnh. Nó sẽ là đoạn nhãn đầu tiên trong tiêu đề phần khối ảnh. Sẽ có ít nhất một SOT trong một dòng mã. Có duy nhất một SOT trong phần khối ảnh.
Độ dài: Cố định.
Hình A.6 - Cú pháp Bắt đầu phần khối ảnh
SOT: Mã nhãn. Bảng A.5 trình bày kích thước và giá trị của ký hiệu và tham số đối với đoạn nhãn bắt đầu phần khối ảnh.
Lsot: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn).
Isot: Chỉ số khối ảnh. Giá trị này đề cập đến các khối ảnh theo thứ tự quét mành bắt đầu từ giá trị 0.
Psot: Độ dài tính theo byte, từ điểm đầu của byte đầu tiên của đoạn nhãn SOT của phần khối ảnh đến điểm cuối của dữ liệu phần khối ảnh. Hình A.16 chỉ ra sự sắp xếp này. Chỉ phần khối ảnh cuối cùng trong dòng mã có thể chứa giá trị 0 cho Psot. Nếu Psot bằng 0, phần khối ảnh này được cho là chứa tất cả các dữ liệu cho đến khi gặp nhãn EOC.
TPsot: Chỉ số khối ảnh. Có thứ tự cụ thể cần thiết để giải mã phần khối ảnh; chỉ số này biểu thị thứ tự từ 0. Nếu chỉ có duy nhất một phần khối ảnh trong khối ảnh, thì giá trị này bằng 0. Phần khối ảnh của khối ảnh này xuất hiện trong dòng mã theo thứ tự đó, mặc dù không nhất thiết phải liên tục.
TNsot: Số lượng phần khối ảnh của khối ảnh trong dòng mã. Hai giá trị được cho phép: số lượng chính xác phần khối ảnh của khối ảnh đó và 0. Giá trị 0 chỉ ra rằng số lượng phần khối ảnh của khối ảnh này không được quy định trong phần khối ảnh.
Bảng A.5 - Giá trị tham số Bắt đầu của phần khối ảnh
Tham số |
Kích thước (bit) |
Giá trị |
SOT |
16 |
0xFF90 |
Lsot |
16 |
10 |
Isot |
16 |
0 đến 65534 |
Psot |
32 |
0 hoặc 14 đến (232 - 1) |
TPsot |
8 |
0 to 254 |
TNsot |
8 |
Bảng A.6 |
Bảng A.6 - Giá trị tham số số lượng phần khối ảnh, TNsot
Giá trị |
Số lượng phần khối ảnh |
0 |
Số lượng phần khối ảnh của khối ảnh này trong dòng mã không được định nghĩa trong tiêu đề này |
1 đến 255 |
Số lượng phần khối ảnh của khối ảnh này trong dòng mã. |
A.4.3 Bắt đầu của dữ liệu (SOD)
Chức năng: Chỉ ra điểm bắt đầu của dữ liệu dòng bit đối với phần khối ảnh hiện tại. SOD cũng thể hiện chỉ ra điểm kết thúc của một tiêu đề phần khối ảnh.
Cách sử dụng: Tất cả tiêu đề phần khối ảnh. Nó là nhãn cuối cùng trong tiêu đề phần khối ảnh. Dữ liệu dòng bit giữa SOD và SOT kế tiếp hoặc EOC (kết thúc ảnh) là bội số của 8 bit - dòng mã được đệm bằng các bit khi cần thiết. Sẽ có ít nhất một SOD trong một dòng mã. Có một SOD trong mỗi phần khối ảnh.
Độ dài: Cố định
SOD: Mã nhãn.
Bảng A.7 - Giá trị tham số của Bắt đầu của dữ liệu
Tham số |
Kích thước (bit) |
Giá trị |
SOD |
16 |
0xFF93 |
A.4.4 Kết thúc của dòng mã (EOC)
Chức năng: Chỉ ra kết thúc của dòng mã.
CHÚ THÍCH 1: Nhãn này chia sẻ cùng một mã như nhãn EOI trong tiêu chuẩn ITU-T T.81 | ISO/IEC 10.918-1.
Cách sử dụng: Là nhãn cuối cùng trong một dòng mã. Sẽ có một EOC trong mỗi dòng mã.
CHÚ THÍCH 2: Trong trường hợp một tập tin đã bị hỏng, Bộ giải mã có thể trích xuất các dữ liệu ảnh nén hữu ích mà không gặp một nhãn EOC.
Độ dài: Cố định.
EOC: Mã nhãn.
Bảng A.8 - Giá trị tham số Kết thúc của dòng mã
Tham số |
Kích thước (bit) |
Giá trị |
EOC |
16 |
0xFFD9 |
A.5 Đoạn nhãn thông tin cố định
Đoạn nhãn này mô tả thông tin yêu cầu về ảnh. Đoạn nhãn SIZ được yêu cầu trong tiêu đề chính ngay sau đoạn nhãn SOC.
A.5.1 Kích thước ảnh và khối ảnh (SIZ)
Chức năng: Cung cấp thông tin về ảnh không nén chẳng hạn như chiều rộng và chiều cao của lưới tham chiếu, chiều rộng và chiều cao của khối ảnh, số lượng các thành phần ảnh, độ sâu bit của thành phần ảnh, tách các mẫu thành phần ảnh theo lưới tham chiếu (xem B.2).
Cách sử dụng: Tiêu đề chính. Có một và chỉ một trong tiêu đề chính ngay sau đoạn nhãn SOC. Có một SIZ trong mỗi dòng mã.
Độ dài: Thay đổi phụ thuộc vào số lượng thành phần ảnh.
Hình A.7 - Cú pháp kích thước ảnh và khối ảnh
SIZ: Mã nhãn. Bảng A.9 chỉ ra kích thước và giá trị tham số của ký hiệu và tham số đoạn nhãn ảnh và khối ảnh.
Lsiz: Độ dài của đoạn nhãn tính theo byte (không bao gồm các nhãn). Giá trị của tham số này được xác định bởi phương trình sau
Lsiz = 38 + 3 ∙ Csiz (A-1)
Rsiz: Chỉ ra dung lượng mà bộ giải cần để giải mã đúng dòng mã.
Xsiz: Độ rộng của lưới tham chiếu.
Ysiz: Độ cao của lưới tham chiếu.
XOsiz: Độ lệch theo chiều ngang tính từ gốc của lưới tham chiếu sang bên trái của vùng ảnh.
YOsiz: Độ lệch theo chiều dọc tính từ gốc của lưới tham chiếu lên phía trên của vùng ảnh.
XTsiz: Chiều rộng của một khối ảnh tham chiếu theo lưới tham chiếu.
YTsiz: Chiều cao của một khối ảnh tham chiếu theo lưới tham chiếu.
XTOsiz: Độ lệch theo chiều ngang tính từ gốc của lưới tham chiếu sang bên trái của khối ảnh đầu tiên.
YTOsiz: Độ lệch theo chiều dọc tính từ gốc của lưới tham chiếu lên phía trên của khối ảnh đầu tiên.
Csiz: Số lượng thành phần trong ảnh.
Ssizi: Độ chính xác (độ sâu) tính theo bit và dấu của mẫu thành phần thứ i. Độ chính xác là độ chính xác của các mẫu thành phần trước khi thực hiện dịch mức DC (ví dụ, độ chính xác của mẫu thành phần gốc trước khi thực hiện bất kỳ xử lý nào). Nếu các giá trị mẫu thành phần có dấu, thì phạm vi của các giá trị mẫu thành phần - 2(Ssiz+1 AND 0x7F)-1 ≤ giá trị mẫu thành phần ≤ 2(Ssiz+1 AND 0x7F)-1 - 1. Tham số này xuất hiện với từng thành phần ảnh. Thứ tự tương ứng với chỉ số của thành phần ảnh, bắt đầu từ 0.
XRsizi: Tách một mẫu của thành phần ảnh thứ i theo chiều ngang theo lưới ảnh tham chiếu. Tham số này xuất hiện với từng thành phần ảnh.
YRsizi: Tách một mẫu của thành phần ảnh thứ i theo chiều dọc theo lưới ảnh tham chiếu. Tham số này xuất hiện với từng thành phần ảnh.
Bảng A.9 - Giá trị tham số Kích thước khối ảnh và ảnh
Tham số |
Kích thước (bit) |
Giá trị |
SIZ |
16 |
0xFF51 |
Lsiz |
16 |
41 đến 49190 |
Rsiz |
16 |
Bảng A.10 |
Xsiz |
32 |
1 đến (232 - 1) |
Ysiz |
32 |
1 đến (232 - 1) |
XOsiz |
32 |
0 đến (232 - 2) |
YOsiz |
32 |
0 đến (232 - 2) |
XTsiz |
32 |
1 đến (232 - 1) |
YTsiz |
32 |
1 đến (232 - 1) |
XTOsiz |
32 |
0 đến (232 - 2) |
YTOsiz |
32 |
0 đến (232 - 2) |
Csiz |
16 |
1 đến 16 384 |
Ssizi |
8 |
Bảng A.11 |
XRsizi |
8 |
1 đến 255 |
YRsizi |
8 |
1 đến 255 |
Bảng A.10 - Tham số Dung lượng của Rsiz
Giá trị (bit) MSB LSB |
Dung lượng |
0000 xxxx xxxx xxxx |
Dòng mã tuân thủ tiêu chuẩn này |
0000 0000 0000 0000 |
Dung lượng sử dụng không bị giới hạn xác định trong tiêu chuẩn này |
0000 0000 0000 0001 |
Dòng mã được giới hạn như Profile 0 từ Bảng A.45 |
0000 0000 0000 0010 |
Dòng mã được giới hạn như Profile 1 từ Bảng A.45 |
0000 0000 0000 0011 |
Profile Điện ảnh kỹ thuật số 2k quy định tại Bảng A.46 |
0000 0000 0000 0100 |
Profile Điện ảnh kỹ thuật số 4k quy định tại Bảng A.46 |
0000 0000 0000 0101 |
Profile Điện ảnh kỹ thuật số 2k có khả năng mở rộng quy định tại Bảng A.46 |
0000 0000 0000 0110 |
Profile Điện ảnh kỹ thuật số 4k có khả năng mở rộng quy định tại Bảng A.46 |
0000 0000 0000 0111 |
Profile lưu trữ dài hạn quy định tại Bảng A.46 |
0000 0001 0000 wwww |
Profile khối ảnh đơn phát quảng bá quy định tại bảng A.48, 8 bit thấp xác định Mức chính được mô tả như trong Bảng A.49 |
0000 0010 0000 wwww |
Profile đa khối ảnh phát quảng bá quy định tại Bảng A.48, 8 bit thấp xác định Mức chính được mô tả như trong Bảng A.49 |
0000 0011 0000 0110 |
Profile đảo đa khối ảnh phát quảng bá quy định tại Bảng A.48, Mức chính 6 được mô tả tại Bảng A.50 |
0000 0011 0000 0111 |
Profile đảo đa khối ảnh phát quảng bá quy định tại Bảng A.48, Mức chính 7 được mô tả tại Bảng A.50 |
0000 0100 yyyy wwww |
Profile tổn hao khối ảnh đơn IMF 2k quy định trong Bảng A.51, 8 bit thấp xác định Mức độ chính và Mức phụ được quy định trong Bảng A.53 và Bảng A.54. |
0000 0101 yyyy wwww |
Profile tổn hao khối ảnh đơn IMF 4k quy định trong Bảng A.51, 8 bit thấp xác định Mức độ chính và Mức phụ được quy định trong Bảng A.53 và Bảng A.54. |
0000 0110 yyyy wwww |
Profile tổn hao khối ảnh đơn IMF 8k quy định trong Bảng A.51, 8 bit thấp xác định Mức độ chính và Mức phụ được quy định trong Bảng A.53 và Bảng A.54. |
0000 0111 yyyy wwww |
Profile đảo khối ảnh đơn/đa khối ảnh IMF 2k quy định trong Bảng A.52, 8 bit thấp xác định Mức độ chính và Mức phụ được quy định trong Bảng A.53 và Bảng A.54. |
0000 1000 yyyy wwww |
Profile đảo khối ảnh đơn/đa khối ảnh IMF 4k quy định trong Bảng A.52, 8 bit thấp xác định Mức độ chính và Mức phụ được quy định trong Bảng A.53 và Bảng A.54. |
0000 1001 yyyy wwww |
Profile đảo khối ảnh đơn/đa khối ảnh IMF 8k quy định trong Bảng A.52, 8 bit thấp xác định Mức độ chính và Mức phụ được quy định trong Bảng A.53 và Bảng A.54. |
0000 1111 1111 1111 |
Profiel được báo hiệu trong nhãn Profile (Profile chỉ sử dụng trong tiêu chuẩn này và các Profile trên được báo hiệu bằng sự kết hợp giữa giá trị Rsiz và các giá trị Profile trong nhãn Profile). Tất cả các giá trị còn lại được dự phòng trong tương lai bởi ITU-T | ISO / IEC. |
CHÚ THÍCH 1: Hai MSB của Rsiz được sử dụng như sau: • 10 - Các khả năng của ISO / IEC 15444-2 • 01 - Các khả năng mở rộng, như được xác định bởi đoạn nhãn CAP, không bao gồm các khả năng được chỉ định trong ISO/IEC 15444-2 • 11 - Các khả năng của ISO / IEC 15444-2 được mở rộng thông qua đoạn nhãn CAP CHÚ THÍCH 2: Các bit được xác định là wwww trong bảng này mô tả Mức chính. Các bit được xác định là yyyy trong Bảng A.10 mô tả Mức phụ |
Bảng A.11 - Tham số thành phần ảnh Ssiz
Giá
trị (bit) |
Độ chính xác mẫu thành phần ảnh |
x000
0000 |
Độ sâu bit mẫu thành phần ảnh = giá trị +1. Từ bit 1 đến bit 38 tương ứng (tính cả bit dấu, nếu phù hợp)a), Rl |
0xxx xxxx |
Các giá trị mẫu thành phần ảnh là giá trị không dấu |
1xxx xxxx |
Các giá trị mẫu thành phần ảnh là giá trị có dấu |
|
Tất cả các giá trị còn lại được dự phòng. |
a) Độ chính xác mẫu thành phần ảnh được giới hạn bởi số lượng bit bảo vệ, lượng tử hóa, độ tang của các hệ số ở mỗi mức phân tách và số lượng bước mã hóa có thể được báo hiệu. Không phải tất cả các kết hợp của kiểu mã hóa sẽ cho phép mã hóa các mẫu 38-bit. |
A.5.2 Các khả năng mở rộng (CAP)
Chức năng: Tín hiệu mà các khả năng mở rộng đã được sử dụng để tạo ra (được khuyến nghị hoặc bắt buộc để giải mã) một đoạn mã.
Cách sử dụng: Tùy chọn. Nếu có, nó phải được bao gồm trong tiêu đề chính sau đoạn nhãn SIZ và trước bất kỳ đoạn nhãn nào được định nghĩa trong tiêu chuẩn này. Bit trọng số thứ hai trong Rsiz có thể tùy chọn thiết lập thành 1 để chỉ ra sự hiện diện của đoạn nhãn CAP.
Độ dài: Thay đổi.
Hình A.7a mô tả cú pháp của đoạn nhãn các khả năng mở rộng.
Hình A.7a - Cú pháp Các khả năng mở rộng
CAP: Mã nhãn. Bảng A.11a hiển thị kích thước và giá trị của ký hiệu và tham số cho đoạn nhãn các khả năng mở rộng.
Lcap: Độ dài của đoạn nhãn CAP (không bao gồm các nhãn). Giá trị của tham số này được xác định bởi phương trình sau
Lcap = 6 + 2n bytes
Trong đó n là số lượng bit 1 xuất hiện trong Pcap
Pcap: Trường 32 bit với các bit Pcapi như trong Bảng A.11b.
Ccapi: Trường 16 bit có giá trị và trọng số được mô tả trong các phần mở rộng của tiêu chuẩn này. Ccapi tồn tại khi và chỉ khi giá trị của Pcapi là 1.
Bảng A.11a - Giá trị tham số Các khả năng mở rộng
Tham số |
Kích thước (bit) |
Giá trị |
CAP |
16 |
0xFF50 |
Lcap |
16 |
8 đến 70 |
Pcap |
16 |
Bảng A.11b |
Ccapi |
32 |
Thay đổi và được mô tả trong phần mở rộng của tiêu chuẩn này |
Bảng A.11b - Định nghĩa giá trị tham số Pcapi
Giá
trị (bit) |
Dung lượng |
bxxx xxxx xxxx xxxx xxxx xxxx xxxx xxxx |
Pcap1 = b |
xbxx xxxx xxxx xxxx xxxx xxxx xxxx xxxx |
Pcap2 = b |
... |
|
xbxx xxxx xxxx xxxx xxxx xxxx xxxx xxxb |
Pcap32 = b |
Hướng dẫn cách sử dụng (tham khảo): Nếu một dòng mã được tạo ra trong trường hợp sử dụng, bộ giải mã của tiêu chuẩn này cố gắng giải mã một dòng mã có các tính năng được xác định nằm ngoài phạm vi của tiêu chuẩn, dòng mã phải được tạo ra sao cho bit quan trọng thứ 2 trong Rsiz được thiết lập thành 0 để tránh báo hiệu sự hiện diện của đoạn nhãn CAP. Theo mục A.1, việc triển khai bộ giải mã dự kiến sẽ xử lý các đoạn nhãn không được nhận dạng bằng cách sử dụng tham số độ dài để loại bỏ đoạn nhãn.
Trong trường hợp này, các bộ giải mã nhận ra bất kỳ khả năng nào được chỉ định trong đoạn nhãn CAP có thể chọn phân tích cú pháp nhãn CAP trong tất cả các dòng mã, bất kể giá trị của bit quan trọng thứ 2 trong Rupiz. Đoạn nhãn CAP luôn xuất hiện trước bất kỳ đoạn nhãn nào khác hỗ trợ các khả năng mở rộng được chỉ định trong đoạn nhãn CAP, do đó các khả năng đó sẽ được chỉ định cho bộ giải mã trước khi gặp bất kỳ đoạn nhãn liên quan nào.
Nếu một dòng mã được tạo ra trong trường hợp sử dụng, muốn ngăn chặn bộ giải mã của tiêu chuẩn này không cố giải mã một dòng mã thực sự đòi hỏi các khả năng được chỉ định trong đoạn nhã CAP, bộ mã hóa thông thường sẽ được xây dựng sao cho cho bit quan trọng thứ 2 trong Rsiz được thiết lập thành 1.
A.5.3 Profile (PRF)
Chức năng: Tín hiệu Profie mà dòng mã phù hợp. Profile cung cấp các giới hạn về các tham số cú pháp dòng mã.
Để tránh khả năng nhiều Profile được báo hiệu đồng thời, nhãn Profile sẽ không xuất hiện trong dòng mã nếu giá trị Rupiz nằm trong phạm vi 0000 0000 0000 0000 đến 0000 1111 1111 1110.
Để tránh nhầm lẫn có thể có về tính duy nhất của Số lượng Profle (PRFnum) được chỉ định đoạn nhãn PRF so với các giá trị Rupiz có thể được sử dụng để chỉ ra một Profile, PRFnum sẽ không bằng 0-4095.
Cách sử dụng: Tùy chọn. Nếu xuất hiện đoạn nhãn PRF sẽ xuất hiện sau đoạn nhãn SIZ và, nếu có, đoạn nhãn CAP, nhưng trước tất cả các đoạn nhãn khác được xác định trong tiêu chuẩn này.
Độ dài: Thay đổi.
Hình A.7b mô tả cú pháp của đoạn nhãn PRF.
Hình A.7b - Cú pháp Profile
PRF: Mã nhãn. Bảng A.11c hiển thị kích thước và giá trị của ký hiệu và tham số cho đoạn nhãn Profile.
Lprf: Độ dài của đoạn nhãn PRF (không bao gồm các nhãn). Giá trị của tham số này được xác định bởi phương trình sau
Lprf = 2 + 2N bytes
Trong đó N là số lượng từ 16 bit được sử dụng để biểu diễn PRFnum (số lượng Profile) trừ đi 4095
Pprfi: Pprfi là số nguyên 16 bit được sử dụng để giao tiếp với PRFnum (số lượng Profile). Từ 16 bit cuối cùng PprfN phải khác 0.
PRFnum (số lượng Profile) là số nằm giữa 4096 và 4095 + (216N - 1), được sử dụng để xác định Profile. Bảng A.55 liệt kê các giá trị PRFnum.
PRFnum được tính từ N số nguyên 16 bit Pprf theo công thức:
Bảng A.11c - Giá trị tham số Profile
Tham số |
Kích thước (bit) |
Giá trị |
PRF |
16 |
0XFF56 |
Lprfi |
16 |
4 đến 65534 |
Pprfi |
16 |
Pprfi là số nguyên 16 bit được sử dụng để giao tiếp với PRFnum |
A.6 Đoạn nhãn chức năng
Các đoạn nhãn này mô tả các chức năng được sử dụng để mã toàn bộ khối ảnh, nếu nó được tìm thấy trong tiêu đề phần khối ảnh hoặc ảnh, tìm thấy trong tiêu đề chính.
A.6.1 Kiểu mã hóa mặc định (COD)
Chức năng: Mô tả kiểu mã hóa, số lượng các mức phân tách và phân lớp được sử dụng mặc định để nén tất cả các thành phần của một ảnh (nếu trong tiêu đề chính) hoặc một khối ảnh (nếu trong tiêu đề phần khối ảnh). Các giá trị tham số có thể bị ghi đè với một thành phần riêng bởi đoạn nhãn COC hoặc tiêu đề phần khối ảnh chính.
Cách sử dụng: Tiêu đề chính và tiêu đề phần khối ảnh đầu tiêu đề của một khối ảnh cho trước. Nó là một và chỉ một trong tiêu đề chính. Ngoài ra, có thể có nhiều nhất là một nhãn cho mỗi khối ảnh. Nếu có nhiều khối ảnh trong một khối ảnh và đoạn nhãn này xuất hiện, thì chỉ tìm thấy một nhãn trong phần khối ảnh đầu tiên (TPsot = 0).
Khi được sử dụng trong tiêu đề chính, các giá trị tham số đoạn nhãn COD được sử dụng cho tất cả các khối ảnh thành phần mà không có đoạn nhãn COC tương ứng hoặc trong các tiêu đề chính hoặc trong tiêu đề phần khối ảnh. Khi được sử dụng trong tiêu đề phần khối ảnh nó ghi đè COD và các COC chính và được sử dụng cho tất cả các thành phần ảnh trong khối ảnh mà không có đoạn nhãn COC tương ứng trong phần khối ảnh. Như vậy, thứ tự ưu tiên như sau:
COC phần khối ảnh > COD phần khối ảnh > COC chính > COD chính
Trong đó dấu "lớn hơn" > có nghĩa là đoạn nhãn lớn hơn ghi đề các đoạn nhãn nhỏ hơn.
Độ dài: Thay đổi phụ thuộc vào giá trị của Scod.
Hình A.8 - Cú pháp kiểu mã hóa mặc định
COD: Mã nhãn. Bảng A.12 chỉ ra kích thước và giá trị của ký hiệu và các tham số cho đoạn nhãn kiểu mã hóa mặc định.
Lcod: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bởi phương trình sau:
Trong đó maximumprecincts và user-defined_precincts chỉ ra trong tham số Scod và number_decomposition_levels được chỉ ra trong tham số SPcod.
Scod: Kiểu mã hóa cho tất cả các thành phần. Bảng A.13 chỉ ra giá trị của tham số Scod.
SGcod: Các tham số kiểu mã hóa được biểu thị trong Scod. Các tham số là các thành phần độc lập và được biểu thị theo thứ tự từ trên xuống dưới, trong Bảng A.14. Các tham số kiểu mã hóa trong trường SGcod xuất hiện theo trình tự trong Hình A.9.
SPcod: Các tham số kiểu mã hóa được biểu thị trong Scod. Các tham số liên quan đến tất cả các thành phần và được biểu thị theo thứ tự từ trên xuống dưới, trong Bảng A.15. Các tham số kiểu mã hóa trong trường SPcod xuất hiện theo trình tự trong Hình A.9.
Bảng A.12 - Giá trị tham số kiểu mã hóa mặc định
Tham số |
Kích thước (bit) |
Giá trị |
COD |
16 |
0xFF52 |
Lcod |
16 |
12 đến 45 |
Scod |
8 |
Bảng A.13 |
SGcod |
32 |
Bảng A.14 |
SPcod |
thay đổi |
Bảng A.15 |
Bảng A.13 - Giá trị tham số kiểu mã hóa mặc định đối với tham số Scod
Giá
trị (bit) |
Kiểu mã hóa |
xxxx xxx0 |
Bộ mã hóa Entropy, phân khu ảnh với PPx = 15 và PPy = 15 |
xxxx xxx1 |
Bộ mã hóa Entropy với phân khu ảnh xác định bên dưới |
xxxx xx0x |
Không sử dụng đoạn nhãn SOP |
xxxx xx1x |
Có thể sử dụng đoạn nhãn SOP |
xxxx x0xx |
Không sử dụng nhãn EPH |
xxxx x1xx |
Sử dụng nhãn EPH |
|
Tất cả các giá trị khác để dự phòng |
Bộ giải mã có thể bỏ qua các bit quan trọng thứ nhất, thứ hai, thứ ba, thứ tư và thứ năm của Scod, ngoại trừ khi các khả năng mở rộng được báo hiệu thông qua đoạn nhãn CAP và bit quan trọng thứ hai của Rupiz được thiết lập. Theo đó, các bộ mã hóa phù hợp với tiêu chuẩn này sẽ đặt các bit này thành 0.
CHÚ THÍCH: Các bit quan trọng thứ nhất, thứ hai, thứ ba, thứ tư và thứ năm có thể có giá trị khác 0 do được sử dụng trong các tiêu chuẩn khác để báo hiệu các phương pháp và cấu hình mã hóa thay thế.
Bảng A.14 - Giá trị tham số M kiểu mã hóa mặc định đối với tham số SGcod
Các tham số (theo thứ tự) |
Kích thước (bit) |
Giá trị |
Ý nghĩa của giá trị SGcod |
Trình tự lũy tiến |
8 |
Bảng A.16 |
Trình tự lũy tiến |
Số lớp |
16 |
1 đến 65535 |
Số lớp |
Phép biến đổi đa thành phần |
8 |
Bảng A.17 |
Sử dụng biến đổi đa thành phần |
Hình A.9 - Sơ đồ tham số kiểu mã hóa đối với tham số SGcod và SPcod
Bảng A.15 - Giá trị tham số kiểu mã hóa đối với tham số SGcod và SPcod
Các tham số (theo thứ tự) |
Kích thước (bit) |
Giá trị |
Ý nghĩa của giá trị SPcod |
Số mức phân tách |
8 |
0 đến 32 |
Số mức phân tách, NL, 0 chỉ ra không có biến đổi. |
Chiều rộng khối mã |
8 |
Bảng A.18 |
Giá trị độ lệch mũ chiều rộng khối mã, xcb |
Chiều cao khối mã |
8 |
Bảng A.18 |
Giá trị độ lệch số mũ chiều cao khối mã, ycb |
Kiểu khối mã |
8 |
Bảng A.19 |
Loại bước mã hóa khối mã |
Phép biến đổi |
8 |
Bảng A.20 |
Sử dụng biến đổi sóng con |
Kích thước phân khu ảnh |
Thay đổi |
Bảng A.21 |
Nếu Scod hoặc Scoc = xxxx xxx0, thì tham số này không xuất hiện; nếu không thì tham số này chỉ ra chiều rộng và chiều cao phân khu ảnh. Tham số đầu tiên (8 bit) tương ứng với các băng con NL LL. Mỗi tham số liên tiếp tương ứng với từng mức phân giải liên tiếp theo thứ tự. |
Bảng A.16 - Trình tự lũy tiến đối với các tham số SGcod, SPcoc và Ppoc
Giá
trị (bit) |
Trình tự lũy tiến |
0000 0000 |
Lũy tiến theo lớp - mức phân giải - thành phần ảnh - vị trí |
0000 0001 |
Lũy tiến theo mức phân giải - lớp - thành phần ảnh - vị trí |
0000 0010 |
Lũy tiến theo mức phân giải - vị trí - thành phần ảnh - lớp |
0000 0011 |
Lũy tiến theo vị trí - thành phần ảnh - mức phân giải - lớp |
0000 0100 |
Lũy tiến theo thành phần ảnh - vị trí - mức phân giải - lớp |
|
Tất cả các giá trị khác để dự phòng |
Bảng A.17 - Biến đổi đa thành phần đối với tham số SGcod
Giá
trị (bit) |
Kiểu biến đổi đa thành phần |
0000 0000 |
Không quy định phép biến đổi đa thành phần |
0000 0001 |
Phép biến đổi thành phần được sử dụng trên các thành phần ảnh 0, 1, 2 để mã hóa hiệu quả (xem G.2). Phép chuyển đổi thành phần nghịch được sử dụng với bộ lọc không khả đảo 9-7. Phép chuyển đổi thành phần thuận được sử dụng với bộ lọc khả đảo 5-3. |
|
Tất cả các giá trị khác để dự phòng |
Bảng A.18 - Số mũ chiều rộng hoặc chiều cao của khối mã đối với tham số SPcod và SPcoc
Giá
trị (bit) |
Chiều rộng và chiều cao của khối mã |
xxxx
0000 |
Giá trị độ lệch số mũ chiều rộng và chiều cao khối mã xcb = giá trị + 2 hoặc ycb = giá trị + 2. Chiều rộng và chiều cao khối mã bị giới hạn bởi lũy thừa của hai với kích thước tối thiểu là 22 và tối đa là 210. Hơn nữa, kích thước khối mã bị giới hạn để xcb + xcb ≤ 12. |
|
Tất cả các giá trị khác để dự phòng |
Bảng A.19 - Kiểu khối mã đối với tham số SPcod và SPcoc
Giá
trị (bit) |
Kiểu khối mã |
xxxx xxx0 xxxx xxx1 |
Không lựa chọn bỏ qua quá trình mã hóa số học Lựa chọn bỏ qua quá trình mã hóa số học |
xxxx xx0x xxxx xx1x |
Không thiết lập ngữ cảnh xác suất biên của bước mã hóa Thiết lập ngữ cảnh xác suất biên của bước mã hóa |
xxxx x0xx xxxx x1xx |
Không kết thúc sau mỗi bước mã hóa Kết thúc sau mỗi bước mã hóa |
xxxx 0xxx xxxx 1xxx |
Ngữ cảnh không ngẫu nhiên theo chiều dọc Ngữ cảnh ngẫu nhiên theo chiều dọc |
xxx0 xxxx xxx1 xxxx |
Không dự đoán được kết thúc Dự đoán được kết thúc |
xx0x xxxx xx1x xxxx |
Không sử dụng ký hiệu phân đoạn Sử dụng ký hiệu phân đoạn |
|
Tất cả các giá trị khác để dự phòng |
Bộ giải mã có thể bỏ qua các bit quan trọng thứ nhất và thứ hai của SPcod / SPcoc, ngoại trừ các khả năng mở rộng được báo hiệu thông qua đoạn nhãn CAP và bit quan trọng thứ hai của Rupiz được thiết lập. Theo đó, các bộ mã hóa phù hợp với tiêu chuẩn này sẽ đặt các bit này thành 0.
CHÚ THÍCH: Các bit quan trọng thứ nhất và thứ hai có thể có giá trị khác 0 do được sử dụng trong các tiêu chuẩn khác để báo hiệu các phương pháp mã hóa thay thế.
Bảng A.20 - Phép biến đổi đối với tham số SPcod và SPcoc
Giá
trị (bit) |
Kiểu biến đổi |
0000 0000 |
Bộ lọc không đảo chiều 9-7 |
0000 0001 |
Bộ lọc đảo chiều 5-3 |
|
Tất cả các giá trị khác để dự phòng |
Bảng A.21 - Độ rộng và độ cao của phân khu ảnh đối với tham số SPcod và SPcoc
Giá
trị (bit) |
Kích thước phân khu ảnh |
xxxx
0000 |
4 LSB là chiều rộng phân khu ảnh, PPx = giá trị. Giá trị này có thể bằng 0 ở mức phân giải tương ứng với băng tần NLLL. |
0000
xxxx |
4 MSB là chiều rộng phân khu ảnh, PPy = giá trị. Giá trị này có thể bằng 0 ở mức phân giải tương ứng với băng tần NLLL. |
A.6.2 Thành phần kiểu mã hóa (COC)
Chức năng: Mô tả kiểu mã hóa và số mức phân tách được sử dụng để nén một thành phần ảnh cụ thể.
Cách sử dụng: Tiêu đề chính và tiêu đề phần khối ảnh đầu tiên của khối ảnh cho trước. Tùy chọn trong cả tiêu đề chính và tiêu đề phần khối ảnh. Không nhiều hơn một với từng thành phần cho trước xuất hiện trong các tiêu đề chính hoặc tiêu đề phần khối ảnh. Nếu có nhiều phần khối ảnh trong một khối ảnh và xuất hiện đoạn nhãn này, thì nó sẽ chỉ được tìm thấy trong phần khối ảnh đầu tiên (TPsot = 0).
Khi được sử dụng trong tiêu đề chính, nó sẽ ghi đè lên đoạn nhãn COD chính đối với thành phần ảnh cụ thể. Khi được sử dụng trong tiêu đề phần khối ảnh, nó sẽ ghi đè lên COD chính, COC chính, COD khối ảnh đối với thành phần ảnh cụ thể. Như vậy, thứ tự ưu tiên như sau:
COC phần khối ảnh > COD phần khối ảnh > COC chính > COD chính
Trong đó dấu "lớn hơn" > có nghĩa là đoạn nhãn lớn hơn ghi đề các đoạn nhãn nhỏ hơn.
Độ dài: Thay đổi phụ thuộc vào giá trị của Scoc.
Hình A.10 - Cú pháp thành phần kiểu mã hóa
COC: Mã nhãn. Bảng A.22 chỉ ra kích thước và giá trị của ký hiệu và các tham số cho đoạn nhãn thành phần kiểu mã hóa.
Lcoc: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bởi phương trình sau:
Trong đó maximum_precincts và user-defined_precincts chỉ ra trong tham số Scoc và number_decoposition_levels được chỉ ra trong tham số SPcoc.
Ccoc: Chỉ số của thành phần ảnh liên quan đến đoạn nhãn này. Các thành phần ảnh được đánh chỉ số 0, 1, 2, ...
Scoc: Kiểu mã hóa cho thành phần này. Bảng A.23 chỉ ra giá trị của từng tham số Scoc.
SPcoc: Các tham số kiểu mã hóa được biểu thị trong Scoc. Các tham số được biểu thị theo thứ tự từ trên xuống dưới, trong Bảng A.15. Các tham số kiểu mã hóa trong trường SPcoc xuất hiện theo trình tự trong Hình A.11.
Hình A.11 - Sơ đồ tham số kiểu mã hóa của tham số Spcoc
Bảng A.22 - Giá trị tham số thành phần kiểu mã hóa
Tham số |
Kích thước (bit) |
Giá trị |
COC |
16 |
0xFF53 |
Lcoc |
16 |
9 đến 43 |
Ccoc |
8 16 |
0
đến 255; nếu Csiz < 257 |
Scoc |
8 |
Bảng A.23 |
SPcoci |
Thay đổi |
Bảng A.15 |
Bảng A.23 - Giá trị tham số kiểu mã hóa đối với tham số Sco
Giá
trị (bit) |
Kiểu mã hóa |
0000 0000 |
Bộ mã hóa entropy với giá trị phân khu ảnh lớn nhất PPx=PPy=15 |
0000 0001 |
Bộ mã hóa entropy với giá trị phân khu ảnh được định nghĩa bên dưới |
|
Tất cả các giá trị khác để dự phòng |
A.6.3 Vùng quan tâm (RGN)
Chức năng: Báo hiệu sự xuất hiện ROI trong dòng mã
Các sử dụng: Tiêu đề chính và tiêu đề phần khối ảnh của một khối ảnh cho trước. Nếu sử dụng trong tiêu đề chính, nó đề cập đến giá trị chia tỉ lệ ROI đối với một thành phần ảnh trong toàn bộ ảnh, có giá trị với tất cả các khối ảnh ngoại trừ các khối ảnh chứa đoạn nhãn RGN.
Khi sử dụng trong tiêu đề phần khối ảnh, giá trị chia tỉ lệ chỉ có giá trị đối với một thành phần ảnh trong khối ảnh này. Có nhiều nhất một đoạn nhãn RGN cho từng thành phần ảnh hoặc trong tiêu đề chính hoặc các tiêu đề phần khối ảnh. Đoạn nhãn RGN của một thành phần ảnh cụ thể xuất hiện trong tiêu đề phần khối ảnh ghi đè lên bất kỳ nhãn nào của thành phần ảnh đó trong tiêu đề chính, đối với khối ảnh nó xuất hiện. Nếu có nhiều phần khối ảnh trong khối ảnh, thì đoạn nhãn này sẽ được tìm thấy duy nhất trong tiêu đề phần khối ảnh đầu tiên.
Độ dài: Cố định.
Hình A.12 - Cú pháp vùng quan tâm
RGN: Mã nhãn. Bảng A.24 chỉ ra kích thước và giá trị của ký hiệu và các tham số của đoạn nhãn vùng quan tâm.
Lrgn: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn).
Crgn: Chỉ số của thành phần ảnh liên quan đến đoạn nhãn này. Thành phần ảnh được đánh chỉ số 0, 1, 2, ...
Srgn: Kiểu ROI cho ROI hiện tại. Bảng A.25 cho thấy giá trị tham số Srgn.
SPrgn: Tham số kiểu ROI biểu thị trong Srgn.
Bảng A.24 - Các giá trị tham số vùng quan tâm
Tham số |
Kích thước (bit) |
Giá trị |
RGN |
16 |
0XFF5E |
Lrgn |
16 |
5 đến 6 |
Crgn |
8 |
0 đến 255; nếu Csiz < 257 |
16 |
0 đến 16 383; Csiz ≥ 257 |
|
Srgn |
8 |
Bảng A.25 |
Srgn |
8 |
Bảng A.26 |
Bảng A.25 - Giá trị tham số vùng quan tâm đối với tham số Srgn
Giá trị |
Kiểu ROI (Srqn) |
0 |
ROI ẩn (dịch tối đa) |
|
Tất cả các giá trị khác để dự phòng |
Bảng A.26 - Glá trị vùng quan tâm từ tham số SPrgn (Srgn = 0)
Tham số (theo thứ tự) |
Kích thước (bit) |
Giá trị |
Ý nghĩa của giá trị SPrgn |
Phép dịch ROI ẩn |
8 |
0 đến 255 |
Phép dịch nhị phân hệ số ROI trên nền |
A.6.4 Lượng tử hóa mặc định (QCD)
Chức năng: Mô tả lượng hóa mặc định sử dụng để nén tất cả các thành phần ảnh không được định nghĩa bởi đoạn nhãn QCC. Các giá trị tham số có thể được ghi đè lên một thành phần ảnh riêng bởi đoạn nhãn QCC trong tiêu đề chính hoặc tiêu đề phần khối ảnh
Cách sử dụng: Tiêu đề chính và tiêu đề phần khối ảnh của một khối ảnh cho trước. Sẽ chỉ có một đoạn nhãn trong tiêu đề chính. Hầu hết, nó là duy nhất cho tất cả các tiêu đề phần khối ảnh của một khối ảnh. Nếu có nhiều phần khối ảnh trong một khối ảnh và đoạn nhãn này xuất hiện, thì sẽ chỉ tìm thấy trong phần khối ảnh đầu tiên (TPsot = 0).
Khi sử dụng trong tiêu đề phần khối ảnh nó ghi đè QCD chính và QCC chính lên thành phần ảnh cụ thể/ Như vậy, thứ tự ưu tiên như sau:
QCC phần khối ảnh > QCD phần khối ảnh > QCC chính > QCD chính
Trong đó dấu "lớn hơn" > có nghĩa là đoạn nhãn lớn hơn ghi đề các đoạn nhãn nhỏ hơn.
Độ dài: Thay đổi phụ thuộc vào số lượng thành phần lượng tử hóa.
Hình A.13 - Cú pháp lượng tử hóa mặc định
QCD: Mã nhãn. Bảng A.27 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn lượng tử hóa mặc định.
Lqcd: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bởi phương trình sau:
Trong đó number_decomposition_levels được định nghĩa trong nhãn COD và COC. Và no_quantization, scalar_quantization_derived và scalar_quantization_expounded là dấu hiệu trong tham số Sqcd.
CHÚ THÍCH: Lqcd có thể được sử dụng để xác định kích thước bước lượng tử xuất hiện trong đoạn nhãn. Tuy nhiên, không nhất thiết phải là một sự tương ứng với số lượng băng con xuất hiện bởi các băng con có thể được rút gọn không có yêu cầu để sửa đoạn nhãn.
Sqcd: Kiểu lượng tử hóa cho tất cả thành phần ảnh.
SPqcdi: Giá trị kích thước bước lượng tử của băng con thứ i theo thứ tự quy định (xem F.3.1). Số lượng tham số bằng số lượng băng con trong khối ảnh thành phần với số mức phân tách lớn nhất.
Bảng A.27 - Giá trị tham số lượng tử hóa mặc định
Tham số |
Kích thước (bit) |
Giá trị |
QCD |
16 |
0xFF5C |
Lqcd |
16 |
4 đến 197 |
Sqcd |
8 |
Bảng A.28 |
SPgcdi |
thay đổi |
Bảng A.28 |
Bảng A.28 - Giá trị lượng tử hóa mặc định đối với tham số Sqcd và Sqcc
Giá
trị (bit) |
Kiểu lượng tử hóa |
Kích thước SPqcd hoặc SPqcc (bit) |
Cách sử dụng SPqcd hoặc SPqcc |
xxx0 0000 |
Không lượng tử hóa |
8 |
Bảng A.29 |
xxx0 0001 |
Dẫn xuất vô hướng (giá trị nhận biết băng con NLLL). Sử dụng Phương trình (E-5) |
16 |
Bảng A.30 |
xxx0 0010 |
Dẫn giải vô hướng (giá trị nhận biết từng băng con). Có nhiều kích thước bước nhận biết băng con |
16 |
Bảng A.30 |
000x xxxx đến 111x xxxx |
Số lượng bit bảo vệ: 0 đến 7 |
|
|
|
Tất cả các giá trị khác để dự phòng |
|
|
Bảng A.29 - Giá trị kích thước bước nghịch với tham số SPqcd và SPqcc (chỉ biến đổi nghịch)
Giá
trị (bit) |
Giá trị kích thước bước nghịch |
0000 0xxx đến 1111 1xxx |
Số mũ, ɛb, trong phạm vi nghịch động nhận biết từng băng con (xem phương trình (E-5)) |
|
Tất cả các giá trị khác để dự phòng |
Bảng A.30 - Giá trị lượng tử hóa đối với tham số SPqcd và SPqcc (chỉ biến đổi thuận)
Giá
trị (bit) |
Giá trị kích thước bước lượng tử |
xxxx x000 0000 0000 đến xxxx x111 1111 1111 |
Phần định trị, µb, của giá trị kích thước bước lượng tử (xem phương trình (E-3) |
0000 0xxx xxxx xxxx đến 1111 1xxx xxxx xxxx |
Phần số mũ, ɛb, của giá trị kích thước bước lượng tử (xem phương trình (E-3) |
A.6.5 Thành phần lượng tử hóa (QCC)
Chức năng: Mô tả lượng tử hóa sử dụng để nén một thành phần ảnh đặc biệt.
Cách sử dụng: Tiêu đề chính và tiêu đề phần khối ảnh của một khối ảnh. Tùy chọn trong tiêu đề chính và tiêu đề phần khối ảnh. Không xuất hiện nhiều hơn một đoạn nhãn với mỗi thành phần ảnh bất kỳ trong các tiêu đề chính hoặc tiêu đề phần khối ảnh. Nếu có nhiều phần khối ảnh trong một khối ảnh, thì đoạn nhãn xuất hiện trong phần khối ảnh đầu tiên (TPsot = 0).
Tùy chọn trong cả tiêu đề chính và tiêu đề phần khối ảnh. Khi sử dụng trong tiêu đề chính, nó sẽ ghi đè đoạn nhãn QCD chính lên thành phần ảnh cụ thể. Khi sử dụng trong tiêu đề phần khối ảnh, nó sẽ ghi đè QCD chính, QCC chính và QCD khối ảnh lên thành phần ảnh cụ thể. Như vậy, thứ tự ưu tiên sau đây:
QCC phần khối ảnh > QCD phần khối ảnh > QCC chính > QCD chính
Trong đó dấu "lớn hơn" > có nghĩa là đoạn nhãn lớn hơn ghi đề các đoạn nhãn nhỏ hơn.
Độ dài: Thay đổi phụ thuộc vào số lượng thành phần lượng tử hóa.
Hình A.14 - Cú pháp thành phần lượng tử hóa
QCC: Mã nhãn. Bảng A.31 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn thành phần lượng tử hóa.
Lqcc: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bởi phương trình sau:
Trong đó number_decomposition_levels được định nghĩa trong nhãn COD và COC. Và no_quantization, scalar_quantization_derived và scalar_quantization_expounded là dấu hiệu trong tham số Sqcc.
CHÚ THÍCH: Lqcc có thể được sử dụng để xác định kích thước bước lượng tử xuất hiện trong đoạn nhãn. Tuy nhiên, không nhất thiết phải là một sự tương ứng với số lượng băng con xuất hiện bởi các băng con có thể được rút gọn không có yêu cầu để sửa đoạn nhãn.
Cqcc: Chỉ số của thành phần ảnh liên quan đến đoạn nhãn này. Thành phần ảnh được đánh chỉ số 0, 1, 2, ... (hoặc 8 hoặc 16 bit phụ thuộc vào giá trị Csiz)
Sqcc: Kiểu lượng tử hóa của thành phần ảnh này.
SPqcci: Giá trị kích thước bước lượng tử của từng băng con theo thứ tự quy định (xem F.3.1). Số lượng tham số bằng số lượng băng con trong khối ảnh thành phần với số mức phân tách lớn nhất.
Bảng A.31 - Giá trị tham số thành phần lượng tử hóa
Tham số |
Kích thước (bit) |
Giá trị |
QCC |
16 |
0xFF5D |
Lqcc |
16 |
5 đến 199 |
Cqcc |
8 16 |
0 đến 255; nếu Csiz < 257 0 đến 16383; Csiz ≥ 257 |
Sqcc |
8 |
Bảng A.28 |
SPqcci |
thay đổi |
Bảng A.28 |
A.6.6 Thay đổi trình tự lũy tiến (POC)
Chức năng: Mô tả biên và trình tự lũy tiến đối với trình tự lũy tiến bất kỳ khác so với quy định trong đoạn nhãn COD trong dòng mã.
Cách sử dụng: Tiêu đề chính và tiêu đề phần khối ảnh. Hầu hết đoạn nhãn POC có thể xuất hiện trong tiêu đề bất kỳ. Tuy nhiên, một số quá trình lũy tiến có thể được mô tả bởi một đoạn nhãn POC. Nếu đoạn nhãn POC được sử dụng trong tiêu đề chính, nó sẽ ghi đè trình tự lũy tiến lên đoạn nhãn COD chính và phần khối ảnh. Nếu POC được sử dụng để mô tả quá trình lũy tiến của một khối ảnh đặc biệt, thì đoạn nhãn POC phải xuất hiện trong tiêu đề phần khối ảnh đầu tiên của khối ảnh đó. Như vậy, trình tự lũy tiến của khối ảnh cho trước được xác định bởi sự xuất hiện của POC hoặc các giá trị của COD theo thứ tự ưu tiên sau:
POC phần khối ảnh > POC chính > COD phần khối ảnh > COD chính
Trong đó dấu "lớn hơn" > có nghĩa là đoạn nhãn lớn hơn ghi đề các đoạn nhãn nhỏ hơn.
Trong trường hợp đoạn nhãn POC được sử dụng, quá trình lũy tiến của của các gói trong các dòng mã (hoặc với khối ảnh của các dòng mã) được định nghĩa trong một hoặc nhiều đoạn nhãn POC. Mỗi trình tự lũy tiến được mô tả trong chỉ có một đoạn nhãn POC và được mô tả trong bất kỳ tiêu đề phần trước các gói bất kỳ mà quá trình lũy tiến được tìm thấy.
Độ dài: Thay đổi phụ thuộc vào số lượng quá trình lũy tiến khác nhau.
Hình A.15 - Cú pháp khối ảnh thay đổi trình tự lũy tiến
POC: Giá trị nhãn. Bảng A.32 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn thay đổi trình tự lũy tiến.
Lpoc: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bởi phương trình sau:
Trong đó number_progression_oder_change do bộ mã hóa quy định.
RSpoci: Chỉ số mức phân giải (bao gồm) bắt đầu quá trình lũy tiến. Có một giá trị cho từng thay đổi quá trình lũy tiến trong khối ảnh hoặc phần khối ảnh này. Số thay đổi quá trình lũy tiến có thể được suy ra từ độ dài của đoạn nhãn.
CSpoci: Chỉ số thành phần ảnh (bao gồm) bắt đầu quá trình lũy tiến. Thành phần ảnh được đánh chỉ số 0, 1, 2, ... (hoặc 8 hoặc 16 bit phụ thuộc vào giá trị Csiz). Có một giá trị cho từng thay đổi quá trình lũy tiến trong khối ảnh hoặc phần khối ảnh này. Số thay đổi quá trình lũy tiến có thể được suy ra từ độ dài của đoạn nhãn.
LYEpoci: Chỉ số lớp (không bao gồm) kết thúc quá trình lũy tiến. Chỉ số lớp thường bắt đầu từ 0 với mọi quá trình lũy tiến. Các gói cũng được bao gồm trong dòng mã nên không được tính lần nữa. Có một giá trị cho từng thay đổi quá trình lũy tiến trong khối ảnh hoặc phần khối ảnh này. Số thay đổi quá trình lũy tiến có thể được suy ra từ độ dài của đoạn nhãn.
REpoci: Chỉ số mức phân giải (không bao gồm) kết thúc quá trình lũy tiến. Có một giá trị cho từng thay đổi quá trình lũy tiến trong khối ảnh hoặc phần khối ảnh này. Số thay đổi quá trình lũy tiến có thể được suy ra từ độ dài của đoạn nhãn.
CEpoci: Chỉ số thành phần ảnh (không bao gồm) kết thúc quá trình lũy tiến. Thành phần ảnh được đánh chỉ số 0, 1, 2, ... (hoặc 8 hoặc 16 bit phụ thuộc vào giá trị Csiz). Có một giá trị cho từng thay đổi quá trình lũy tiến trong khối ảnh hoặc phần khối ảnh này. Số thay đổi quá trình lũy tiến có thể được suy ra từ độ dài của đoạn nhãn.
Ppoci: Trình tự lũy tiến. Có một giá trị cho từng thay đổi quá trình lũy tiến trong khối ảnh hoặc phần khối ảnh này. Số thay đổi quá trình lũy tiến có thể được suy ra từ độ dài của đoạn nhãn
Bảng A.32 - Giá trị tham số khối ảnh thay đổi trình tự lũy tiến
Tham số |
Kích thước (bit) |
Giá trị |
POC |
16 |
0xFF5F |
Lpoc |
16 |
9 đến 65 535 |
RSpoci |
8 |
0 đến 32 |
CSpoci |
8 |
0 đến 255; nếu Csiz < 257 |
16 |
0 đến 16383; Csiz ≥ 257 |
|
LYEpoci |
16 |
1 đến 65535 |
REpoci |
8 |
(RSpoci + 1) đến 33 |
CEpoci |
8 16 |
(CSpoci + 1) đến 255, 0; nếu Csiz < 257 (CSpoci + 1) đến 16384, 0; Csiz ≥ 257 (0 được hiểu như 256) |
Ppoci |
8 |
Bảng A.16 |
A.7 Đoạn nhãn con trỏ
Đoạn nhãn con trỏ cung cấp một chiều dài hoặc con trỏ trong dòng mã. Đoạn nhãn TLM mô tả độ dài của phần khối ảnh. Có các thông tin độ dài tương tự như đoạn nhãn SOT. Đoạn nhãn PLM hoặc PLT mô tả độ dài gói.
CHÚ THÍCH: Tất cả sự xuất hiện của đoạn nhãn con trỏ trong tiêu đề chính cho phép truy cập trực tiếp vào dữ liệu dòng bit. Thông tin con trỏ trong tiêu đề khối ảnh loại bỏ những gánh nặng trên bộ mã hóa để lưu trữ thông tin.
Các tham số TLM (Ptlm) hoặc SOT (Post) trỏ từ điểm bắt đầu của đoạn nhãn SOT của phần khối ảnh hiện tại đến điểm cuối cùng của dữ liệu dòng mã trong phần khối ảnh. Do các khối ảnh yêu cầu phải là bội của 8 bit, nên các giá trị này luôn có độ dài một byte. Hình A.16 minh họa độ dài của một phần khối ảnh.
Các đoạn nhãn PLM hoặc PLT là tùy chọn. Đoạn nhãn PLM được sử dụng trong tiêu đề chính và đoạn nhãn PLT được sử dụng trong tiêu đề phần khối ảnh. Các đoạn nhãn PLM và PLT mô tả độ dài của từng gói trong dòng mã.
Hình A.16 - Độ dài phần khối ảnh
A.7.1 Độ dài phần khối ảnh (TLM)
Chức năng: Mô tả độ dài của mọi phần khối ảnh trong dòng mã. Mỗi độ dài phần khối ảnh được tính từ byte đầu tiên của đoạn nhãn SOT đến điểm cuối của dữ liệu dòng bit của phần khối ảnh. Giá trị độ dài của từng phần khối ảnh riêng trong đoạn nhãn TLM bằng giá trị trong Psot tương ứng trong đoạn nhãn SOT.
Cách sử dụng: Tiêu đề chính. Có thể tùy chọn sử dụng trong duy nhất tiêu đề chính. Có thể có nhiều đoạn nhãn TLM trong tiêu đề chính.
Độ dài: Thay đổi phụ thuộc vào số lượng phần khối ảnh trong mã dòng mã.
Hình A.17 - Cú pháp độ dài phần khối ảnh
TLM: Mã nhãn. Bảng A.33 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn độ dài phần khối ảnh.
Ltlm: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bởi phương trình sau:
Trong đó number_of_tile_parts_in_marker_segment là độ dài phần khối ảnh được biểu thị trong đoạn nhãn này; ST và SP được nhận biết bởi tham số Stlm.
Ztlm: Chỉ số của đoạn nhãn này liên quan đến tất cả đoạn nhãn TLM khác xuất hiện trong tiêu đề hiện tại. Trình tự của cặp (Ttlmi, Ptlmi) được kết nối từ đoạn nhãn này theo thứ tự Ztlm tăng, với trình tự của cặp từ các đoạn nhãn khác. Mục thứ j trong danh sách chứa cặp chỉ số khối ảnh và độ dài phần khối ảnh với phần khối ảnh thứ j xuất hiện trong dòng mã.
Stlm: Kích thước của tham số Ttlm và Ptlm.
Ttlmi: Chỉ số khối ảnh của phần khối ảnh thứ i. Hoặc không có hoặc có một giá trị đối với mọi phần khối ảnh trong mỗi khối ảnh được suy ra từ đoạn nhãn này (hoặc danh sách kết nối của tất cả nhãn như vậy) hoặc từ tham số TNsot khác không, nếu nó xuất hiện.
Ptlmi: Độ dài tính theo byte từ điểm bắt đầu nhãn SOT của phần khối ảnh thứ I đến điểm cuối cùng của dữ liệu dòng bit với phần khối ảnh. Có một giá trị đối với mọi phần khối ảnh.
Bảng A.33 - Giá trị tham số độ dài phần khối ảnh
Tham số |
Kích thước (bit) |
Giá trị |
TLM |
16 |
0xFF55 |
Ltlm |
16 |
6 đến 65535 |
Ztlm |
8 |
0 đến 255 |
Stlm |
8 |
Bảng A.34 |
Ttlmi |
0 nếu ST = 0 |
khối ảnh theo thứ tự |
8 nếu ST = 1 |
0 đến 254 |
|
|
16 nếu ST = 2 |
0 đến 65534 |
Ptlmi |
16 nếu SP = 0 |
14 đến 65 535 |
32 nếu SP = 1 |
14 đến (232 - 1) |
Bảng A.34 - Tham số kích thước đối với Stlm
Giá
trị (bit) |
Kích thước tham số |
xx00 xxxx |
ST = 0; tham số Ttlm 0 bit, chỉ có một phần khối ảnh trong mỗi khối ảnh và khối ảnh là chỉ số thứ tự không bỏ sót hay lặp lại |
xx01 xxxx |
ST = 1; tham số Ttlm 8 bit |
xx10 xxxx |
ST = 2; tham số Ttlm 16 bit |
x0xx xxxx |
SP = 0; tham số Ptlm 16 bit |
x1xx xxxx |
SP = 1; tham số Ptlm 32 bit |
|
Tất cả các giá trị khác để dự phòng |
A.7.2 Tiêu đề chính, độ dài gói (PLM)
Chức năng: Danh sách các độ dài gói trong các phần khối ảnh đối với mọi phần khối ảnh theo thứ tự.
Cách sử dụng: Tiêu đề chính. Có thể có nhiều đoạn nhãn PLM. Cả hai đoạn nhãn PLM và PLT là tùy chọn và có thể được sử dụng cùng nhau hoặc riêng rẽ.
Độ dài: Thay đổi phụ thuộc vào số lượng phần khối ảnh trong ảnh và số lượng các gói trong mỗi phần khối ảnh.
Hình A.18 - Cú pháp tiêu đề chính, độ dài gói
PLM: Mã nhãn. Bảng A.35 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn tiêu đề chính, độ dài gói.
Lplm: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn).
Zplm: Chỉ số của đoạn nhãn này liên quan đến tất cả đoạn nhãn PLM khác xuất hiện trong tiêu đề hiện tại. Trình tự của cặp (Nplmi, lplmi) được kết nối từ đoạn nhãn này theo thứ tự Zplm tăng, với trình tự của cặp từ các đoạn nhãn khác. Mục thứ k trong danh sách chứa cặp chỉ số khối ảnh và độ dài phần khối ảnh với phần khối ảnh thứ k xuất hiện trong dòng mã.
Mọi đoạn nhãn trong loạt này sẽ kết thúc với độ dài tiêu đề gói hoàn chỉnh. Tuy nhiên, một loạt tham số Iplm được mô tả bởi Nplm không được hoàn thành trong một đoạn nhãn cho trước. Do đó, nó có thể là đoạn nhãn PLM kế tiếp không có tham số Nplm sau Zplm, nhưng tiếp tục loạt Iplm từ đoạn nhãn PLM cuối cùng.
Nplmi: Số byte thông tin Iplm của phần khối ảnh thứ I theo thứ tự được tìm thấy trong dòng mã. Có một giá trị với từng phần khối ảnh. Nếu dòng mã chứa một hoặc nhiều hơn một phần khối ảnh vượt quá giới hạn của nhãn PLM, thì các nhãn này sẽ không được sử dụng.
CHÚ THÍCH: Giá trị này được biểu diễn bằng với một số 8-bit giới hạn số lượng byte của Iplm đến 255 và số gói trong một phần khối ảnh đến 255 hoặc ít hơn. Đây không phải là một hạn chế về số lượng gói có thể có trong một phần khối ảnh, nó chỉ đơn thuần là một giới hạn về khả năng đoạn nhãn để mô tả các gói trong một phần khối ảnh.
Iplmij: Độ dài của gói trong phần khối ảnh thứ i. Nếu tiêu đề gói được lưu với gói, thì độ dài này bao gồm cả tiêu đề gói. Nếu tiêu đề gói lưu trong PPM hoặc PPT, độ dài này không bao gồm độ dài tiêu đề gói. Có một phạm vi giá trị với từng phần khối ảnh. Có một giá trị đối với từng gói trong khối ảnh.
Bảng A.35 - Giá trị tham số tiêu đề chính, độ dài gói
Tham số |
Kích thước (bit) |
Giá trị |
PLM |
16 |
0xFF57 |
Lplm |
16 |
4 đến 65 535 |
Zplm |
8 |
0 đến 255 |
Nplmi |
8 |
0 đến 255 |
Iplmij |
thay đổi |
Bảng A.36 |
Bảng A.36 - Danh sách Iplm, Iplt của độ dài gói
Tham số (theo thứ tự) |
Kích thước (bit) |
Giá trị |
Ý nghĩa của giá trị Ipm hoặc Iplt |
Độ dài gói |
8 bit lặp lại khi cần thiết |
0xxx xxxx 1xxx xxxx x000 0000 đến x111 1111 |
7 bit cuối cùng của độ dài gói, số chấm dứta) Tiếp tục đọcb) 7 bit của độ dài gói |
a) Đây là 7 bit cuối cùng tạo nên độ dài gói. b) Đây không phải 7 bit cuối cùng tạo nên độ dài gói. Thay vào đó, 7 bit này là một phần tạo nên độ dài gói. Độ dài gói được chia thành các đoạn 7 bit, được gửi đi theo thứ tự đoạn quan trọng nhất đến đoạn ít quan trọng nhất. Hơn nữa, các bit trong đoạn quan trọng nhất là ranh giới phải của byte, ví dụ, độ dài gói 128 được nhận biết 1000 0001 0000 0000, trong khi độ dài 512 được nhận biết 1000 0100 0000 0000. |
A.7.3 Tiêu đề phần khối ảnh, độ dài gói (PLT)
Chức năng: Danh sách độ dài gói trong phần khối ảnh.
Cách sử dụng: Tiêu đề phần khối ảnh. Có nhiều đoạn nhãn PLT trong khối ảnh. Cả hai đoạn nhãn PLM và PLT tùy chọn sử dụng cùng nhau hoặc riêng lẻ. Nó sẽ xuất hiện trong tiêu đề phần khối ảnh bất kỳ trước khi độ dài gói được mô tả ở đây.
Độ dài: Thay đổi phụ thuộc vào số lượng gói trong mỗi phần khối ảnh.
Hình A.19 - Cú pháp tiêu đề phần khối ảnh, độ dài gói
PLT: Mã nhãn. Bảng A.37 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn tiêu đề phần khối ảnh, độ dài gói.
Lplt: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn).
Zplt: Chỉ số của đoạn nhãn này liên quan đến tất cả đoạn nhãn PLM khác xuất hiện trong tiêu đề hiện tại. Loạt tham số (Iplti) được kết nối từ đoạn nhãn này theo thứ tự Zplm tăng, với trình tự của cặp từ các đoạn nhãn khác. Mọi đoạn nhãn trong loạt sẽ kết thúc mới độ dài tiêu đề gói hoàn chỉnh.
Iplmi: Độ dài của gói thứ i. Nếu tiêu đề gói được lưu với gói, thì độ dài này bao gồm cả tiêu đề gói. Nếu tiêu đề gói lưu trong PPM hoặc PPT, độ dài này không bao gồm độ dài tiêu đề gói. Có một phạm vi giá trị với từng phần khối ảnh.
Bảng A.37 - Giá trị tham số tiêu đề phần khối ảnh, độ dài gói
Tham số |
Kích thước (bit) |
Giá trị |
PLT |
16 |
0xFF58 |
Lplt |
16 |
4 đến 65535 |
Zplt |
8 |
0 đến 255 |
Iplti |
thay đổi |
Bảng A.36 |
A.7.4 Tiêu đề chính, tiêu đề gói được đóng gói (PPM)
Chức năng: Tập các tiêu đề gói từ tất cả các khối ảnh.
CHÚ THÍCH: Điều này rất hữu ích vì khi đọc nhiều lần không cần phải giải mã tiêu đề.
Cách sử dụng: Tiêu đề chính. Có thể được sử dụng trong tiêu đề chính cho tất cả các phần khối ảnh trừ khi đoạn nhãn PPT được sử dụng trong tiêu đề phần khối ảnh.
Các tiêu đề gói chỉ nằm ở một trong ba vị trí trong dòng mã. Nếu xuất hiện đoạn nhãn PPM, thì tất cả các tiêu đề gói được tìm thấy trong các tiêu đề chính. Trong trường hợp này, đoạn nhãn PPT và các gói được không được phép phân phối trong dòng bit của phần khối ảnh.
Nếu không có đoạn nhãn PPM thì các tiêu đề gói có thể được phân phối hoặc trong đoạn nhãn PPT hoặc phân phối trong các dòng mã được quy định tại B.10. Các tiêu đề gói sẽ không có nằm ở đoạn nhãn PPT và dòng mã của cùng một khối ảnh. Nếu các tiêu đề gói nằm trong đoạn nhãn PPT, chúng sẽ xuất hiện trong một tiêu đề phần khối ảnh trước khi xuất hiện dữ liệu gói tương ứng (tức là, trong cùng một tiêu đề phần khối ảnh hoặc với một giá trị TPsot thấp hơn). Có thể có nhiều đoạn nhãn PPT trong một tiêu đề phần khối ảnh.
Độ dài: Thay đổi phụ thuộc vào số lượng gói trong mỗi phần khối ảnh và kích thước của tiêu đề gói.
Hình A.20 - Cú pháp tiêu đề chính, tiêu đề gói được đóng gói
PPM: Mã nhãn. Bảng A.38 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn tiêu đề chính, tiêu đề gói được gói.
Lppm: Độ dài của đoạn nhãn tính theo byte, không bao gồm nhãn.
Zppm: Chỉ số của đoạn nhãn này liên quan đến tất cả đoạn nhãn PLM khác xuất hiện trong tiêu đề hiện tại. Trình tự của cặp (Nppmi, Ippmi) được kết nối từ đoạn nhãn này theo thứ tự Zppm tăng, với trình tự của cặp từ các đoạn nhãn khác. Mục thứ k trong danh sách chứa cặp chỉ số khối ảnh và độ dài phần khối ảnh với phần khối ảnh thứ k xuất hiện trong dòng mã.
Mọi đoạn nhãn trong loạt này sẽ kết thúc với độ dài tiêu đề gói hoàn chỉnh. Tuy nhiên, một loạt tham số Ippm được mô tả bởi Nppm không được hoàn thành trong một đoạn nhãn cho trước. Do đó, nó có thể là đoạn nhãn PPM kế tiếp không có tham số Nppm sau Zppm, nhưng tiếp tục loạt Ippm từ đoạn nhãn PPM cuối cùng.
Nppmi: Số byte thông tin Ippm của phần khối ảnh thứ i theo thứ tự được tìm thấy trong dòng mã.
Ippmij: Tiêu đề gói của mọi gói theo thứ tự trong phần khối ảnh. Nội dung chính xác tiêu đề gói được phân phối trong dòng bit như mô tả trong B.10.
Bảng A.38 - Giá trị tham số tiêu đề chính, tiêu đề gói được đóng gói
Tham số |
Kích thước (bit) |
Giá trị |
PPM |
16 |
0xFF60 |
Lppm |
16 |
7 đến 65535 |
Zppm |
8 |
0 đến 255 |
Nppmi |
32 |
0 đến (232 - 1) |
Ippmij |
thay đổi |
tiêu đề gói |
A.7.5 Tiêu đề phần khối ảnh, tiêu đề gói được đóng gói (PPT)
Chức năng: Tập hợp các tiêu đề gói từ một khối ảnh hoặc phần khối ảnh.
Cách sử dụng: Tiêu đề phần khối ảnh. Nó sẽ xuất hiện trong bất kỳ tiêu đề phần khối ảnh trước khi tiêu đề được mô tả ở đây.
Các tiêu đề gói chỉ nằm ở một trong ba vị trí trong dòng mã. Nếu xuất hiện đoạn nhãn PPM, thì tất cả các tiêu đề gói được tìm thấy trong các tiêu đề chính. Trong trường hợp này, đoạn nhãn PPT và các gói được không được phép phân phối trong dòng bit của phần khối ảnh.
Nếu không có đoạn nhãn PPM thì các tiêu đề gói có thể được phân phối hoặc trong đoạn nhãn PPT hoặc phân phối trong các dòng mã được quy định tại B.10. Các tiêu đề gói sẽ không có nằm ở đoạn nhãn PPT và dòng mã của cùng một khối ảnh. Nếu các tiêu đề gói nằm trong đoạn nhãn PPT, chúng sẽ xuất hiện trong một tiêu đề phần khối ảnh trước khi xuất hiện dữ liệu gói tương ứng (tức là, trong cùng một tiêu đề phần khối ảnh hoặc với một giá trị TPsot thấp hơn). Có thể có nhiều đoạn nhãn PPT trong một tiêu đề phần khối ảnh.
Độ dài: Thay đổi phụ thuộc vào số lượng gói trong mỗi phần khối ảnh và kích thước của tiêu đề gói.
Hình A.21 - Cú pháp tiêu đề phần khối ảnh, tiêu đề khối ảnh được đóng gói
PPT: Mã nhãn. Bảng A.39 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn tiêu đề phần khối ảnh, tiêu đề khối ảnh được đóng gói.
Lppt: Độ dài của đoạn nhãn tính theo byte, không bao gồm nhãn.
Zppt: Chỉ số của đoạn nhãn này liên quan đến tất cả đoạn nhãn PPT khác xuất hiện trong tiêu đề hiện tại. Loạt tham số (Ippti) được kết nối từ đoạn nhãn này theo thứ tự Zppt tăng, với trình tự của cặp từ các đoạn nhãn khác. Mọi đoạn nhãn trong loạt sẽ kết thúc mới độ dài tiêu đề gói hoàn chỉnh.
Ippti: Tiêu đề gói của mọi gói theo thứ tự trong phần khối ảnh. Chỉ số thành phần ảnh, lớp và mức phân giải được quyết định từ phương pháp lũy tiến hoặc đoạn nhãn POC. Nội dung chính xác tiêu đề gói được phân phối trong dòng bit như mô tả trong B.10.
Bảng A.39 - Giá trị tham số tiêu đề phần khối ảnh, tiêu đề khối ảnh
Tham số |
Kích thước (bit) |
Giá trị |
PPT |
16 |
0xFF61 |
Lppt |
16 |
4 đến 65535 |
Zppt |
8 |
0 đến 255 |
Ippti |
thay đổi |
tiêu đề gói |
A.8 Nhãn và đoạn nhãn trong dòng bit
Nhãn và đoạn nhãn này được sử dụng cho khả năng kháng lỗi. Chúng có thể được tìm thấy trong dòng bit. (Các nhãn EPH cũng có thể được sử dụng trong các đoạn nhãn PPM và PPT).
A.8.1 Bắt đầu gói (SOP)
Chức năng: Nhãn bắt đầu của gói trong dòng mã.
Cách sử dụng: Tùy chọn. Có thể được sử dụng trong dòng bit trước của mỗi gói. Nó không được sử dụng trừ khi nó được cho phép trong đoạn nhãn COD thích hợp (xem A.6.1). Nếu đoạn nhãn PPM hoặc PPT được sử dụng, thì đoạn nhãn SOP có thể xuất hiện ngay trước dữ liệu gói trong dòng bit.
Nếu đoạn nhãn SOP được cho phép (bằng cách báo hiệu trong đoạn nhãn COD, xem A.6.1), mỗi gói trong phần khối ảnh bất kỳ cho trước có hoặc không được nối thêm vào đoạn nhãn SOP. Tuy nhiên, sử dụng hoặc không sử dụng đoạn nhãn SOP, số trong Nsop được tăng lên cho mỗi gói. Nếu các tiêu đề gói tin được chuyển đến đoạn nhãn PPM hoặc PPT (xem A.7.4 và A.7.5), thì các đoạn nhãn SOP có thể xuất hiện ngay trước phần thân gói trong phần khối ảnh của phần dữ liệu ảnh nén.
Độ dài: Cố định.
Hình A.22 - Cú pháp bắt đầu gói
SOP: Mã nhãn. Bảng A.40 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn bắt đầu gói.
Lsop: Độ dài của đoạn nhãn tính theo byte, không bao gồm nhãn.
Nsop: Số thứ tự liên tiếp của gói. Gói đầu tiên trong khối ảnh được mã hóa được gán giá trị 0. Đối với gói tiếp theo trong khối ảnh được mã hóa này số thứ tự này tăng thêm 1. Khi đạt đến số lơn nhất, số thứ tự này quay về 0.
Bảng A.40 - Giá trị tham số bắt đầu gói
Tham số |
Kích thước (bit) |
Giá trị |
SOP |
16 |
0xFF91 |
Lsop |
16 |
4 |
Nsop |
16 |
0 đến 65535 |
A.8.2 Kết thúc tiêu đề gói (EPH)
Chức năng: Cho biết điểm kết thúc của tiêu đề gói của một gói cho trước. Phân tách tiêu đề gói trong dòng bit hoặc trong các đoạn nhãn PPM hoặc PPT. Đoạn nhãn này không biểu thị điểm bắt đầu của dữ liệu gói, nhãn này không được sử dụng trong dòng bit.
Cách sử dụng: Được sử dụng khi và chỉ khi được chỉ định trong đoạn nhãn COD thích hợp (xem A.6.1). Nó xuất hiện ngay sau tiêu đề gói.
Nếu nhãn EPH được yêu cầu (bằng cách báo hiệu trong đoạn nhãn COD, xem A.6.1), thì mỗi tiêu đề gói tin trong phần khối ảnh bất kỳ cho trước bị trì hoãn với đoạn nhãn EPH. Nếu các tiêu đề gói được chuyển đến đoạn nhãn PPM hoặc PPT (xem A.7.4 và A.7.5), thì nhãn EPH sẽ xuất hiện sau tiêu đề gói trong đoạn nhãn PPM hoặc PPT.
Độ dài: Cố định.
EPH: Mã nhãn
Bảng A.41 - Giá trị kết thúc tiêu đề gói
Tham số |
Kích thước (bit) |
Giá trị |
EPH |
16 |
0xFF92 |
A.9 Đoạn nhãn mang thông tin
Các đoạn nhãn này là thông tin bí mật và không cần thiết cho bộ giải mã. Tuy nhiên, các đoạn nhãn này hỗ trợ bộ phân tích cú pháp hoặc bộ giải mã. Nhiều thông tin về nguồn và đặc tính của ảnh có thể thu được bằng cách sử dụng định dạng tập tin chẳng hạn như JP2 (xem Phụ lục I).
A.9.1 Đăng ký thành phần ảnh (CRG)
Chức năng: Cho phép đăng ký các thành phần ảnh cụ thể liên quan đến nhau. Đối với mục đích mã hóa các mẫu của các thành phần ảnh được xem nằm trên các điểm lưới tham chiếu, là bội số nguyên của XRsiz và YRsiz (xem A.5.1). Tuy nhiên, điều này có thể không phù hợp để kết xuất ảnh. Đoạn nhãn CRG mô tả "khối tâm" của các mẫu của từng thành phần ảnh liên quan đến việc phân tách. Đoạn nhãn này không có tác dụng giải mã dòng mã.
CHÚ THÍCH: Độ lệch đăng ký thành phần ảnh này liên quan đến độ lệch (XOsiz và YOsiz) và phân tách thành phần ảnh (XRsizi và YRsizi). Ví dụ, các điểm lưới tham chiếu theo chiều ngang của các mẫu thành phần ảnh tận cùng bên trái là XRsizC éXOsiz / XRsizCù (tương tự với chiều dọc). Độ lệch theo chiều ngang được ký hiệu trong đoạn nhãn để bổ sung cho độ lệch này.
Cách sử dụng: Chỉ tiêu đề chính. Chỉ có một CRG được sử dụng trong tiêu đề chính và được áp dụng cho tất cả các khối ảnh.
Độ dài: Thay đổi phụ thuộc vào số lượng các thành phần ảnh.
Hình A.23 - Cú pháp đăng ký thành phần ảnh
CRG: Mã nhãn. Bảng A.42 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn đăng ký thành phần ảnh.
Lsrg: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn).
Xcrgi: Giá trị độ lệch theo chiều ngang, theo đơn vị của 1/65536 của phân tách theo chiều ngang XRsizi, đối với thành phần ảnh thứ i. Như vậy, phạm vi giá từ 0/65536 (mẫu nằm trên điểm lưới tham chiếu) đến XRsizC(65535/65536) (ngay trước điểm lưới tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại với mỗi thành phần ảnh.
Ycrgi: Giá trị độ lệch theo chiều dọc, theo đơn vị của 1/65536 của phân tách theo chiều dọc YRsizi, đối với thành phần ảnh thứ i. Như vậy, phạm vi giá từ 0/65536 (mẫu nằm trên điểm lưới tham chiếu) đến YRsizC(65535/65536) (ngay trước điểm lưới tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại với mỗi thành phần ảnh.
Bảng A.42 - Giá trị tham số đăng ký thành phần ảnh
Tham số |
Kích thước (bit) |
Giá trị |
CRG |
16 |
0xFF63 |
Lcrg |
16 |
6 đến 65534 |
Xcrgi |
16 |
0 đến 65535 |
Ycrgi |
16 |
0 đến 65535 |
A.9.2 Chú giải (COM)
Chức năng: Cho phép dữ liệu phi cấu trúc trong tiêu đề chính và tiêu đề phần khối ảnh.
Cách sử dụng: Tiêu đề chính và tiêu đề phần khối ảnh. Lặp lại nhiều lần như mong muốn trong một hoặc cả hai tiêu đề chính hoặc tiêu đề phần khối ảnh. Đoạn nhãn này không có tác dụng giải mã dòng mã.
Độ dài: Thay đổi phụ thuộc vào độ dài của bản tin.
Hình A.24 - Cú pháp chú giải
COM: Mã nhãn. Bảng A.43 chỉ ra kích thước và giá trị của ký hiệu và các tham số đoạn nhãn chú giải.
Lcom: Độ dài của đoạn nhãn tính theo byte (không bao gồm nhãn).
Rcom: Giá trị đăng ký của đoạn nhãn.
Ccomi: Byte dữ liệu phi cấu trúc.
Bảng A.43 - Giá trị tham số chú giải
Tham số |
Kích thước (bit) |
Giá trị |
COM |
16 |
0xFF64 |
Lcom |
16 |
5 đến 65535 |
Rcom |
16 |
Bảng A.44 |
Ccomi |
8 |
0 đến 255 |
Bảng A.44 - Giá trị đăng ký đối với tham số Rcom
Giá trị |
Giá trị đăng ký |
0 |
Sử dụng chung (các giá trị nhị phân) |
1 |
Sử dụng chung (các giá trị ISO / IEC 8859-15 (Latin)) |
|
Tất cả các giá trị khác để dự phòng |
A.10 Các hạn chế của dòng mã tương ứng với tiêu chuẩn này
Để phát huy các khả năng tương tác rộng của dòng mã JPEG 2000, các hạn chế của dòng mã được giới thiệu. Trường hợp "Không hạn chế", tương ứng với tiêu chuẩn này được gọi là Profile-2. Profile-0 và Profile-1 được định nghĩa như sau.
Dòng mã đạt được khả năng trao đổi mức tối đa tương ứng với Profile-0 và khả năng trao đổi mức trung bình với dòng mã tương ứng Profile-1.
Bảng A.45 - Các hạn chế của dòng mã
Hạn chế |
Profile-0 |
Profile-1 |
Đoạn nhãn SIZ |
|
|
Dấu hiệu Profile |
Rsiz = 1 |
Rsiz = 2 |
Kích thước ảnh |
Xsiz, Ysiz < 231 |
Xsiz, Ysiz < 231 |
Khối ảnh |
Kích thước khối ảnh 128 x 128: YTsiz = XTsiz = 128 hoặc một khối ảnh cho toàn bộ ảnh YTsiz + YTOsiz ≥ Ysiz XTsiz + XTOsiz ≥ Xsiz |
XTsiz / min(XRsizi, YRsizi) ≥ 1024 XTsiz = YTsiz hoặc một khối ảnh cho toàn bộ ảnh YTsiz + YTOsiz ≥ Ysiz XTsiz + XTOsiz ≥ Xsiz |
Ảnh và khối ảnh gốc |
XOsiz = YOsiz = XTOsiz = YTOsiz = 0 |
XOsiz, YOsiz, XTOsiz, YTOsiz < 231 |
Đoạn nhãn RGN |
SPrgn ≤ 37 |
SPrgn ≤ 37 |
Lấy mẫu con |
XRsizi = 1, 2, or 4 YRsizi = 1, 2, or 4 |
Không hạn chế |
Khối mã |
|
|
Kích thước khối mã |
xcb = ycb = 5 hoặc xcb = ycb = 6 |
xcb ≤ 6, ycb ≤ 6 |
Kiểu khối mã |
SPcod, SPcoc = 00sp vtra trong đó a = r = v = 0, and t, p, s = 0 hoặc 1 CHÚ THÍCH 1: t = 1 với chấm dứt trên từng bước mã hóa p = 1 với chấm dứt dự đoán s = 1 với phân đoạn các ký hiệu |
Không hạn chế |
Vị trí nhãn |
|
|
Tiêu đề được đóng gói (PPM, PPT) |
Không cho phép |
Không hạn chế |
COD, COC, QCD, QCC |
Chỉ tiêu đề chính |
Không hạn chế |
Yêu cầu tập con |
|
|
Độ phân giải LL |
Nếu sử dụng một khối ảnh cho toàn bộ ảnh (Xsiz - XOsiz) / D(l) ≤ 128 và (Ysiz - YOsiz) / D(l) ≤ 128 trong đó D(l) = 2số_mức_phân tách trong SPcod hoặc SPcoc, với I = thành phần ảnh từ 0 đến 3 |
Với mỗi khối ảnh trong ảnh, ëx1 /D(i)û - ëtx0/D(i)û ≤ 128 và ëty1/D(i)û - ëty0/D(i)û ≤ 128 trong đó D(l) = 2số_mức_phân tách trong SPcod hoặc SPcoc, với I = thành phần ảnh từ 0 đến 3 CHÚ THÍCH 2: tx0, tx1, ty0 và ty1 được định nghĩa trong phương trình (B-7) đến (B-10). |
Khả năng phân tích cú pháp |
Nếu nhãn POC xuất hiện, nhãn POC sẽ có RSPOC0 = 0 và CSPOC0 = 0. CHÚ THÍCH 3: Một số bộ giải mã phù hợp có thể chỉ giải mã các gói liên quan đến quá trình lũy tiến đầu tiên. |
Không hạn chế |
Khối ảnh |
Phần khối ảnh với TPsot = 0 của tất cả khối ảnh sau phần khối ảnh bất kỳ với TPsot > 0, phần khối ảnh Isot = 0 đến Isot = số_khối ảnh - 1, theo thứ tự liên tiếp đối với tất cả các phần khối ảnh với TPsot = 0 |
Không hạn chế |
Kích thước phân khu ảnh |
"Kích thước phân khu ảnh" được định nghĩa bởi SPcod hoặc SPcoc (Bảng A.15 và A.21) phải đủ lớn để chỉ có một phân khu ảnh ở tất cả các mức phân giải với kích thước nhỏ hơn hoặc bằng 128 x 128 CHÚ THÍCH 4: Kích thước phần khu ảnh PPx ≥ 7 và PPy ≥ 7 đủ lớn để đảm bảo chỉ có một phân khu ảnh cho mỗi băng con khi XOsiz = 0 và YOsiz = 0. |
Không hạn chế |
A.10.1 Hạn chế của dòng mã đối với các ứng dụng điện ảnh kỹ thuật số bao gồm cả việc lưu trữ
Ngoài các Profile quy định tại Bảng A.10, năm Profile được định nghĩa cho các ứng dụng điện ảnh kỹ thuật số và lưu trữ chi tiết trong Bảng A.46. Hai Profile đầu tiên, có hình thức Profile-3 và Profile-4, chủ yếu dành cho việc phân phối. Ngoài ra, ba Profile được liệt kê tiếp theo được đánh số từ 5 đến 7 dành cho mục đích lưu trữ và sản xuất. Hai Profile có khả năng mở rộng (Profile-5 và Profile-6) dành cho việc lưu trữ để truy cập dễ dàng. Profile lưu trữ dài hạn (Profile-7) dành cho việc quy trình chụp ảnh gốc hoặc hậu kỳ.
Ý kiến bạn đọc
Nhấp vào nút tại mỗi ô tìm kiếm.
Màn hình hiện lên như thế này thì bạn bắt đầu nói, hệ thống giới hạn tối đa 10 giây.
Bạn cũng có thể dừng bất kỳ lúc nào để gửi kết quả tìm kiếm ngay bằng cách nhấp vào nút micro đang xoay bên dưới
Để tăng độ chính xác bạn hãy nói không quá nhanh, rõ ràng.