ISO/IEC 11172 - 3: 1993/Cor.1:1996
Information technology - Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s - Part 3: Audio
MỤC LỤC
1 Phạm vi áp dụng
2 Tài liệu viện dẫn
3 Thuật ngữ và định nghĩa
4 Ký hiệu và từ ngữ viết tắt
4.1 Toán tử số học
4.2 Các toán tử logic
4.3 Các toán tử quan hệ
4.4 Các phép toán thao tác bít
4.5 Phép gán
4.6 Phép nhớ
4.7 Hằng số
5 Phương pháp mô tả cú pháp dòng bít
6 Các yêu cầu của cấu trúc mã hóa và tham số
6.1 Hàm chuỗi âm thanh
6.2 Hàm khung âm thanh
6.3 Hàm tiêu đề
6.4 Hàm kiểm tra lỗi
6.5 Hàm dữ liệu âm thanh, lớp I
6.6 Hàm dữ liệu âm thanh, lớp II
6.7 Hàm dữ liệu âm thanh lớp III
6.8 Hàm dữ liệu phụ trợ
7 Ngữ nghĩa cho cú pháp dòng bít âm thanh
7.1 Chuỗi âm thanh chung
7.2 Khung âm thanh
7.3 Tiêu đề
7.4 Kiểm tra lỗi
7.5 Dữ liệu âm thanh, lớp I
7.6 Dữ liệu âm thanh lớp II
7.7 Dữ liệu âm thanh, lớp III
7.8 Dữ liệu phụ trợ
8 Quá trình giải mã âm thanh
8.1 Tổng quan
8.2 Lớp I
8.2.1 Tái lượng tử hóa các mẫu băng tần con
8.2.2 Giàn bộ lọc tần con tổng hợp
8.3 Lớp II
8.3.1 Giải mã phản bổ bit
8.3.2 Giải mã thông tin lựa chọn hệ số tỷ lệ
8.3.3 Giải mã hệ số tỷ lệ
8.3.4 Tái lượng tử các mẫu băng tần con
8.3.5 Giàn bộ lọc tần tổng hợp
8.4 Lớp III
8.4.1 Giải mã
8.4.2 Thông tin phụ
8.4.3 Khởi đầu dữ liệu chính
8.4.4 Xem xét bộ đệm
8.4.5 Hệ số tỷ lệ
8.4.6 Giải mã Huffman
8.4.7 Lượng tử hóa
8.4.8 Công thức tính toán lượng tử và tất cả các hệ số tỷ lệ.
8.4.9 Sắp xếp lại thứ tự
8.4.10 Quá trình xử lý âm thanh nổi
Phụ lục A (Quy định) Sơ đồ mã hóa, giải mã
Phụ lục B (Quy định) Các bảng biểu
Phụ lục C (Tham khảo) Quá trình mã hóa
C.1 Mã hóa
Phụ lục D (Tham khảo) Mô hình tâm thính học
D.1. Mô hình tâm thính học 1
D.2. Mô hình tâm thính học 2
Phụ lục E (Tham khảo) Độ nhạy bít với lỗi
E.1 Tổng quan
E.2 Lớp I và II
E.3 Lớp III
Phụ lục F (Tham khảo) Giấu lỗi
Phụ lục G (Tham khảo) Mã hóa phối kết âm thanh nổi
G.1. Mã hóa cường độ âm thanh nổi cho lớp I, II
G.2. MS Stereo và mã hóa cường độ âm thanh nổi cho lớp III
Phụ lục H (Tham khảo) Danh sách chủ sở hữu bằng sáng chế
Thư mục tài liệu tham khảo
Lời nói đầu
TCVN 12892-3: 2020 hoàn toàn tương đương ISO/IEC 11172 - 3: 1993 và đính chính kỹ thuật ISO/IEC 11172-3:1993/ Cor.1:1996.
TCVN 12892-3 : 2020 do Viện Khoa học kỹ thuật Bưu điện - Học viện Công nghệ Bưu chính Viễn thông biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.
CÔNG NGHỆ THÔNG TIN - MÃ HÓA HÌNH ẢNH ĐỘNG VÀ ÂM THANH KẾT HỢP CHO PHƯƠNG TIỆN LƯU TRỮ SỐ LÊN TỚI 1,5 MBIT/S - PHẦN 3: ÂM THANH.
Information
technology - Coding of moving pictures and associated audio for digital
storage media at up to about 1,5 Mbit/s - Part 3:
Audio
Tiêu chuẩn này quy định phương pháp mã hóa, giải mã tín hiệu âm thanh chất lượng cao. Tín hiệu đầu vào của bộ mã hóa và đầu ra của bộ giải mã tương thích với các tiêu chuẩn PCM hiện tại như chuẩn đĩa quang (CD) và băng từ âm thanh số (Digital Audio Tape).
Tiêu chuẩn này áp dụng cho các thiết bị lưu trữ số với tốc độ truyền liên tục lên tới 1,5 Mbit/s đối với cả dòng bít cả âm thanh và video, như CD, DAT, VCD, DVD, băng từ âm thanh số, ổ cứng thể rắn (SSD) và đĩa cứng từ (HDD). Các thiết bị lưu trữ được kết nối trực tiếp với bộ giải mã, hoặc kết nối thông qua các phương tiện khác như đường truyền thông và dòng tín hiệu ISO/IEC 11172 đã ghép kênh được định nghĩa trong phần 1 của tiêu chuẩn ISO/IEC 11172. Tiêu chuẩn này được xây dựng để thực hiện mã hóa ở tốc độ lấy mẫu tần số 32 kHz; 44,1 kHz và 48 kHz.
Tài liệu viện dẫn sau là cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả sửa đổi, bổ sung (nếu có).
ISO/IEC 11172-1:1993, Information technology - Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s - Part 1: System (Công nghệ thông tin - Mã hóa hình ảnh động và âm thanh kết hợp cho phương tiện lưu trữ số lên tới 1,5 Mbit/s - Phần 1: Hệ thống).
ISO/IEC 11172-2:1993, Information technology - Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s - Part 2: Video (Công nghệ thông tin - Mã hóa hình ảnh động và âm thanh kết hợp cho phương tiện lưu trữ số lên tới 1,5 Mbit/s - Phần 2: Video).
CCIR Recommendation 601-2, Encoding parameters of digital television for studios (Khuyến nghị CCIR 601-2 Các thông số mã hóa truyền hình số cho phòng thu).
CCIR Report 624-4, Characteristics of systems for monochrome and colour television (Báo cáo CCIR 624-4 Các đặc tính của hệ thống cho truyền hình màu và đơn sắc).
CCIR Recommendation 648, Recoding of audio signals. (Khuyến nghị CCIR 648 Ghi tín hiệu âm thanh).
CCIR Report 955-2, Sound broadcasting by satellite for portable and mobile receivers, including Annex IV Summry description of Advanced Digital System II (Báo cáo CCIR 955-2 Phát thanh quảng bá qua vệ tinh cho các máy cầm tay và các bộ thu di động, bao gồm Phụ lục IV Mô tả khái quát về Hệ thống số cải tiến II).
CCIIT Recommendation J. 17, Pre-emphasis used on Sound-Programme Circuits (Khuyến nghị CCIIT J.17 Kỹ thuật tăng chỉnh được sử dụng trong các mạch chương trình âm thanh).
IEEE Draft Standard PIIWD2 1990, Specification for the implementation of 8x 8 inverse discrete cosine transform” (Dự thảo chuẩn IEEE PIIWD2 1990 Kỹ thuật cho việc thực hiện chuyển đổi Cosin rời rạc ngược 8x8).
IEC publication 908:1987, CD Digital Audio System (IEC 908:1987 Hệ thống âm thanh số CD).
Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa sau:
3.1
Hệ số AC [video] (AC coefficient [video])
Bất kỳ hệ số DCT nào mà có tần số nằm trong một hoặc cả hai chiều có giá trị khác không.
3.2
Đơn vị truy cập [hệ thống] (access unit [system])
Trong trường hợp âm thanh nén thì đơn vị truy cập chính là đơn vị truy cập âm thanh. Trong trường hợp video nén thì đơn vị truy cập là sự biểu diễn một bức ảnh được mã hóa.
3.3
Phân đoạn thích ứng [âm thanh] (Adaptive segmentation [audio])
Việc phân nhỏ việc trình diễn kỹ thuật số của tín hiệu âm thanh trong các khoảng thời gian thay đổi.
3.4
Phân bổ bít thích ứng [âm thanh] (adaptive bít allocation [audio])
Việc phân chia các bít cho các băng tần con theo thời gian và theo tần số biến đổi kiểu cách theo mô hình tâm thính học.
3.5
Phân bổ nhiễu thích ứng [âm thanh] (adaptive noise allocation [audio])
Việc phân chia nhiễu mã hóa cho các băng tần theo thời gian và tần số biến đổi kiểu cách theo mô hình tâm thính học.
3.6
Bí danh [âm thanh] (alias [audio])
Một thành phần tín hiệu được phản chiếu do việc lấy mẫu Nyquist.
3.7
Giàn bộ lọc phân tích [âm thanh] (Analysis filterbank [audio])
Giàn bộ lọc trong bộ mã hóa chuyển đổi tín hiệu âm thanh PCM băng thông rộng thành một tập hợp các mẫu băng tần con được lấy mẫu.
3.8
Đơn vị truy cập âm thanh [âm thanh] (Audio Access Unit [audio])
Với Lớp I và II, một đơn vị truy cập âm thanh được định nghĩa là một phần nhỏ nhất của dòng bít được mã hóa mà có thể được giải mã bởi chính nó, trong đó được mã hóa nghĩa là “âm thanh được tái tạo hoàn toàn”. Đối với Lớp III, một đơn vị truy cập âm thanh là một phần của dòng bít mà có thể được giải mã bằng việc sử dụng thông tin chính đã yêu cầu trước đó.
3.9
Bộ đệm âm thanh [âm thanh] (audio buffer [audio])
Một bộ đệm trong các bộ giải mã hệ thống dùng để lưu trữ dữ liệu âm thanh được nén.
3.10
Chuỗi âm thanh [âm thanh] (audio sequence [audio])
Một loạt các khung âm thanh không bị gián đoạn trong đó các tham số sau đây không thay đổi:
- ID
- Lớp
- Tần số lấy mẫu
- Đối với lớp I và II: chỉ số tốc độ bít.
3.11
Véc tơ chuyển động ngược [video] (backward motion vector [video])
Một véc tơ chuyển động được sử dụng để bù chuyển động từ một hình ảnh tham chiếu vào một thời điểm sau đó theo thứ tự hiển thị.
3.12
Bark [âm thanh] [audio]
Đơn vị đo tốc độ dải tới hạn. Thang đo Bark là ánh xạ phi tuyến tính của thang đo tần số trên dải âm thanh tương ứng chặt chẽ với độ chọn lọc tần số của tai người trên toàn dải.
3.13
Hình ảnh được mã hóa dự đoán hai chiều; ảnh B [video] (bidirectionally predictive-coded picture; B-picture [video])
Một hình ảnh được mã hóa sử dụng bù chuyển động dự đoán từ một hình ảnh tham chiếu trong quá khứ và / hoặc tương lai.
3.14
Tốc độ bít (bitrate)
Tốc độ mà dòng bít bị nén được phân phối từ các phương tiện lưu trữ tới đầu vào của một bộ giải mã.
3.15
Khối nén giãn [âm thanh] (Block companding [audio])
Tiêu chuẩn hóa việc trình diễn tín hiệu âm thanh số trong một khoảng thời gian nhất định.
3.16
Khối [video] (block [video])
Một khối pixel trực giao gồm 8 hàng x 8 cột
3.17
Phạm vi [âm thanh] (Bound [audio])
Băng tần con thấp nhất trong đó mã hóa âm thanh nổi được sử dụng.
3.18
Căn chỉnh theo byte (byte aligned)
Một bit trong dòng bit được mã hóa được căn chỉnh theo byte nếu vị trí của nó là bội số của 8 bit tính từ bit đầu tiên trong luồng.
3.19
Byte
Chuỗi 8 bít
3.20
Kênh (Channel)
Là một phương tiện kỹ thuật số lưu trữ hoặc truyền tải trong dòng tín hiệu ISO/IEC 11172.
3.21
Kênh [âm thanh] (chanel [audio])
Các kênh trái và kênh phải của tín hiệu âm thanh nổi stereo.
3.22
Màu (thành phần) [video]
Một ma trận, một khối hoặc một pixel đơn trình diễn một trong hai tín hiệu màu sắc khác nhau liên quan đến các màu cơ bản theo định nghĩa được quy định trong CCIR rec 601. Các ký hiệu sử dụng cho tín hiệu màu sắc khác nhau là Cr và Cb.
3.23
Dòng bít mã hóa âm thanh [âm thanh] (coded audio bitstream [audio])
Việc trình diễn tín hiệu âm thanh mã hóa được định nghĩa theo tiêu chuẩn ISO/IEC 11172.
3.24
Dòng bít mã hóa video [video] (coded video bitstream [video])
Việc trình diễn một chuỗi gồm một hoặc nhiều hình ảnh được mã hóa theo tiêu chuẩn ISO/IEC 11172.
3.25
Thứ tự mã hóa [video] (coded order [video])
Thứ tự trong đó các hình ảnh được lưu trữ hoặc được giải mã. Thứ tự này không nhất thiết giống như thứ tự hiển thị.
3.26
Trình diễn mã hóa (coded representation)
Thành phần dữ liệu được trình diễn theo dạng mã hóa của nó.
3.27
Các thông số mã hóa [video] (coding parameters [video])
Tập hợp các thông số do người dùng định nghĩa mà đặc trưng cho một dòng bít video được mã hóa. Dòng bít được đặc trưng bởi các thông số mã hóa. Bộ giải mã dược đặc trưng bởi các dòng bit mà chúng có khả năng giải mã.
3.28
Thành phần màu [video] (component [video])
Một ma trận, một khối hoặc một pixel từ một trong số 3 ma trận (độ chói và 2 độ màu) để tạo nên một bức ảnh.
3.29
Nén (compression)
Kỹ thuật làm giảm số lượng các bít được sử dụng để trình diễn một mục dữ liệu.
3.30
Video được mã hóa với tốc độ bit không đổi [video] (constant bitrate coded video[video])
Một dòng video được nén với tốc độ bít trung bình không đổi.
3.31
Tốc độ bit không đổi (constant bitrate)
Hoạt động trong đó tốc độ bit không đổi từ đầu đến cuối của dòng bit được nén.
3.32
Các thông số bắt buộc [video] (constrained parameters[video])
Các giá trị của một tập các thông số mã hóa được quy định tại khoản 2.4.3.2 của tiêu chuẩn ISO/IEC 11172-2.
3.33
Dòng thông số hệ thống bắt buộc [hệ thống] - constrained system parameter stream (CSPS)
Một dòng tín hiệu tiêu chuẩn ISO/IEC 11172 được ghép kênh mà tuân thủ những ràng buộc được quy định tại khoản 2.4.6 tiêu chuẩn ISO/IEC 11172-1.
3.34
CRC
Mã dự phòng theo chu kỳ.
3.35
Tốc độ băng tới hạn [âm thanh] (critical band rate [audio])
Chức năng tâm thính học của tần số. Tại một tần số âm thanh cho trước, nó tỷ lệ với số dải tần tới hạn nằm dưới tần số đó. Các đơn vị của thang đo tốc độ băng tần tới hạn là Bark.
3.36
Băng tới hạn [âm thanh] (critical band [audio])
Phép đo tâm thính học trong miền phổ tương ứng với độ chọn lọc tần số của tai người. Độ chọn lọc này được biểu diễn bằng đơn vị Bark.
3.37
Phần tử dữ liệu (data element)
Một mục dữ liệu được trình diễn trước khi mã hóa và sau khi giải mã.
3.38
Hệ số DC [video] (DC-coefficient)
Hệ số biến đổi Cosine rời rạc DCT mà tần số bằng không trong cả hai chiều.
3.39
Hình ảnh mã hóa DC; ảnh D [video] (DC - coded picture; D - picture [video])
Một bức ảnh được mã hóa chỉ sử dụng thông tin từ chính nó. Trong số các hệ số DCT trong nhóm đại diện được mã hóa, chỉ có hệ số khử DC được biểu thị.
3.40
Hệ số biến đổi cosin rời rạc DCT (DCT coefficient [video])
Biên độ của hàm cosin cụ thể.
3.41
Dòng giải mã (decoded stream)
Quá trình giải mã được khôi phục từ một dòng bít nén.
3.42
Bộ đệm đầu vào bộ giải mã [video] (decoder input buffer [video])
Bộ đệm kiểu vào trước ra trước (FIFO) được xác thực trong bộ đệm video.
3.43
Tốc độ đầu vào bộ giải mã [video] (decoder input rate [video])
Tốc độ dữ liệu quy định xác minh trong bộ đệm video và mã hóa trong dòng bít của video.
3.44
Bộ giải mã (decoder)
Hiện thân của quá trình giải mã.
3.45
Quá trình giải mã (decoding process)
Quá trình được định nghĩa trong ISO / IEC 11172, đọc dòng bít được mã hóa đầu vào và tạo ra các mẫu hình ảnh hoặc mẫu âm thanh đã được giải mã.
3.46
Nhãn thời gian giải mã DTS [hệ thống] (decoding time-stamp; DTS [system])
Một trường có thể xuất hiện trong tiêu đề gói cho biết thời gian một đơn vị truy cập được giải mã trong bộ giải mã mục tiêu hệ thống.
3.47
Mạch giảm âm [âm thanh] (De-emphasis [audio])
Quá trình lọc được áp dụng cho tín hiệu âm thanh sau khi lưu trữ hoặc truyền tải để hoàn tác hiện tượng độ méo tuyến tính do giảm âm.
3.48
Tái lượng tử [video] (dequantization [video])
Quá trình biến đổi lại thang tỷ lệ của các hệ số DCT đã định lượng sau khi trình diễn chúng dưới dạng dòng bít đã giải mã và trước khi thực hiện biến đổi DCT nghịch đảo.
3.49
Phương tiện lưu trữ kỹ thuật số; DSM (digital storage media; DSM)
Một thiết bị lưu trữ, thiết bị truyền hay hệ thống kỹ thuật số.
3.50
Biến đổi cosin rời rạc DCT [video] (discrete cosine transtorm; DCT [video])
Biến đổi cosin rời rạc thuận hoặc biến đổi cosin rời rạc nghịch đảo. DCT là một phép biến đổi trực giao rời rạc, khả nghịch. DCT nghịch đảo được định nghĩa trong phụ lục A của tiêu chuẩn ISO/IEC 11172-2.
3.51
Thứ tự hiển thị [video] (display order [video])
Thứ tự các hình ảnh được giải mã sẽ được hiển thị. Thông thường thứ tự này giống với thứ tự được trình diễn tại đầu vào của bộ mã hóa.
3.52
Chế độ song kênh [âm thanh] (dual channel mode [audio])
Một chế độ, trong đó hai kênh âm thanh có nội dung chương trình độc lập (ví dụ: song ngữ) được mã hóa trong một dòng bit. Quá trình mã hóa giống như đối với chế độ âm thanh nổi.
3.53
Thực hiện nén (editing)
Quá trình mà một hoặc nhiều dòng bit nén được thao tác để tạo ra một dòng bit nén mới. Các dòng bit đã chỉnh sửa phù hợp phải đáp ứng các yêu cầu được quy định trong tiêu chuẩn ISO/ IEC 11172 này.
3.54
Dòng cơ sở [hệ thống] (elementary stream [system])
Thuật ngữ chung cho một trong các video, âm thanh được mã hóa hoặc các dòng bit được mã hóa khác.
3.55
Mạch tăng âm [âm thanh] (Emphasis [audio])
Quá trình lọc được áp dụng cho tín hiệu âm thanh trước khi lưu trữ hoặc truyền để cải thiện tỷ lệ tín hiệu trên nhiễu ở tần số cao.
3.56
Bộ mã hóa (encoder)
Hiện thân của một quá trình mã hóa.
3.57
Quá trình mã hóa (encoding process)
Một quá trình, không được quy định trong tiêu chuẩn này, đọc một luồng hình ảnh hoặc mẫu âm thanh đầu vào và tạo ra một dòng bit được mã hóa hợp lệ như được định nghĩa trong tiêu chuẩn này.
3.58
Mã hóa entropy (entropy coding)
Mã hóa đặc trưng của một tín hiệu số có độ dài biến đổi nhằm làm giảm độ dư thừa trong các phần tử được mã hóa để truyền đi.
3.59
Tua nhanh [video] (fast forward playback [video])
Quá trình hiển thị một chuỗi hoặc các phần của một chuỗi, các phần của hình ảnh theo thứ tự hiển thị nhanh hơn so với thời gian thực.
3.60
FFT
Phép Biến đổi Fourier nhanh. Một thuật toán biến đổi nhanh để thực hiện một biến đổi Fourier rời rạc (một biến đổi trực giao).
3.61
Giàn bộ lọc [âm thanh] (Filter bank [audio])
Một tập hợp các bộ lọc thông dải bao gồm toàn bộ dải tần âm thanh.
3.62
Phân đoạn cố định (Fixed segmentation)
Một sự chia nhỏ việc trình diễn kỹ thuật số của tín hiệu âm thanh thành các phân đoạn thời gian cố định.
3.63
Khoảng cấm (forbidden)
Thuật ngữ “bị cấm” được sử dụng trong các điều khoản khi định nghĩa dòng bít được mã hóa để chỉ ra rằng giá trị này sẽ không bao giờ được sử dụng. Nó thường dùng để tránh các mã bắt đầu.
3.64
Cập nhật bắt buộc [video] (forced updating [video])
Quá trình mà các khối macro được mã hóa theo dạng thời gian - thời gian để đảm bảo rằng các lỗi trong quá trình biến đổi DCT nghịch đảo trong các bộ mã hóa và bộ giải mã hóa không phát sinh quá mức.
3.65
Vector chuyển động thuận [video] (forward motion vector [video])
Một vector chuyển động được sử dụng để bù chuyển động từ một hình ảnh mẫu tại thời điểm trước theo thứ tự hiển thị.
3.66
Khung [âm thanh] (frame [audio])
Một phần của tín hiệu âm thanh tương ứng với các mẫu PCM âm thanh xuất phát từ bộ truy cập âm thanh.
3.67
Định dạng tự do [âm thanh] (Free format [audio])
Bất kỳ tốc độ bít nào khác so với tốc độ bít cố định đều phải nhỏ hơn tốc độ bít hợp lệ lớn nhất trong mỗi lớp.
3.68
Hình ảnh mẫu dự đoán [video] (furure reference picture [video])
Hình ảnh mẫu dự đoán là hình ảnh tham chiếu xảy ra tại một thời điểm muộn hơn hình ảnh hiện tại theo thứ tự hiển thị.
3.69
Hạt nhỏ [lớp II] [âm thanh] (granules [layer II] [audio])
Một tập hợp gồm 3 mẫu băng tần con liên tiếp từ 32 băng tần con được xem xét cùng nhau trước khi lượng tử. Chúng tương ứng với 96 mẫu PCM.
3.70
Hạt nhỏ [lớp III] [âm thanh] (granules [layer III] [audio])
576 vạch tần số mang thông tin riêng của chúng.
3.71
Nhóm các hình ảnh [video] (group of pictures [video])
Một loạt của một hoặc nhiều hình ảnh được mã hóa để hỗ trợ truy cập ngẫu nhiên. Nhóm các hình ảnh là một lớp của các lớp trong cú pháp mã hóa được định nghĩa trong phần tiêu chuẩn ISO/IEC 11172-2.
3.72
Cửa sổ Hann [âm thanh] (Hann window [audio])
Một hàm thời gian áp dụng từng mẫu một cho một khối mẫu âm thanh trước khi biến đổi Fourier.
3.73
Mã hóa Huffman (Huffman coding)
Một phương pháp cụ thể của mã hóa entropy.
3.74
Giàn bộ lọc âm thanh lai [âm thanh] (Hybrid filter bank [audio])
Một sự kết hợp của giàn giàn bộ lọc tần con và MDCT.
3.75
IMDCT [âm thanh] (IDMCT [audio])
Biến đổi cosin rời rạc biến đổi nghịch đảo.
3.76
Cường độ âm thanh nổi [âm thanh] (intensity stereo [audio])
Một phương pháp vận dụng lượng phân bố hoặc tính dư thừa trong âm thanh nổi trong các chương trình xử lý âm thanh dựa vào việc duy trì tại tần số cao mà chỉ có năng lượng bao quanh các kênh phải và kênh trái.
3.77
Đan xen [video] (interlace [video])
Thuộc tính của hình ảnh truyền hình thông thường là các dòng hình ảnh được trình diễn liên tục đan xen trong khoảng thời gian khác nhau.
3.78
Mã hóa intra [video] (intra coding [video])
Mã hóa của một khối macro hoặc hình ảnh chỉ sử dụng thông tin từ chính khối macro hoặc hình ảnh đó.
3.79
Hình ảnh mã hóa intra; ảnh I [video] (intra-coded picture; I-picture [video])
Một hình ảnh được mã hóa chỉ sử dụng thông tin từ chính nó.
3.80
Dòng ISO/IEC 11172 đã ghép kênh (ISO/IEC 11172 (multiplexed) stream [system])
Một dòng bít gồm có 0 hoặc nhiều dòng bít cơ bản được kết hợp theo cách thức được quy định tiêu chuẩn ISO/IEC 11172-1.
3.81
Phương pháp ghép nối mã hóa âm thanh nổi [âm thanh] (Joint stereo coding [audio])
Phương pháp mã hóa tận dụng đặc tính bất thường hay sự dư thừa của âm thanh nổi.
3.82
Chế độ ghép nối âm thanh nổi [âm thanh] (Joint stereo mode [audio])
Một chế độ mã hóa âm thanh sử dụng thuật toán mã hóa ghép nối âm thanh nổi.
3.83
Lớp [âm thanh] (layer [audio])
Một trong những cấp độ trong hệ thống phân cấp mã hóa của hệ thống âm thanh được quy định trong tiêu chuẩn này.
3.84
Lớp [video và hệ thống] (layer [video and systems])
Một trong những cấp độ trong phân cấp dữ liệu của video và thông số kỹ thuật hệ thống được quy định trong tiêu chuẩn ISO/IEC 11172-1 và ISO/IEC 11172-2.
3.85
Độ chói (thành phần) (luminance (component))
Một ma trận, khối hoặc mẫu pixel trình diễn cho một tín hiệu đơn sắc và liên quan đến các mà cơ bản theo định nghĩa của CCIR rec 601. Độ chói được kí hiệu là Y.
3.86
Khối Macro
Bốn khối 8x8 của dữ liệu độ chói và hai khối 8x8 tương ứng độ màu được tạo bởi từ khối 16x16 thành phân độ chói của hình ảnh. Khối macro thường được dùng để chỉ các dữ liệu pixel và được sử dụng cho các giá trị mã pixel và các thành phần dữ liệu khác được xác định trong lớp khối macro được định nghĩa trong phần 2 của tiêu chuẩn ISO/IEC 11172-2.
3.87
Ánh xạ [âm thanh] (Mapping [audio])
Chuyển đổi tín hiệu âm thanh từ miền thời gian sang miền tần số bằng cách sử dụng bộ lọc băng tần con và/hoặc bằng phép biến đổi cosin rời rạc hiệu chỉnh MDCT.
3.88
Mặt nạ (Masking)
Một thuộc tính của hệ thống thính giác của con người mà không thể nhận được tín hiệu âm thanh khi có sự hiện diện của một tín hiệu âm thanh khác.
3.89
Ngưỡng mặt nạ [âm thanh] (Masking threshold [audio])
Phần phía dưới của hàm trong miền tần số và thời gian mà tín hiệu âm thanh không thể được cảm nhận bằng hệ thống thính giác của con người.
3.90
MDCT [âm thanh] (MDCT [audio])
Biến đổi cosin rời rạc hiệu chỉnh.
3.91
Bù chuyển động [video ] (motion compensation [video])
Việc sử dụng các vectơ chuyển động để nâng cao hiệu quả của việc dự đoán các giá trị pixel. Việc dự đoán có sử dụng vectơ chuyển động để bù cho các hình ảnh tham chiếu trong quá khứ và/ hoặc tương lai mà chứa các giá trị pixel đã được giải mã trước đó được sử dụng để tạo tín hiệu dự đoán lôi.
3.92
Ước lượng chuyển động [video] (motion estimation [video])
Quá trình ước lượng vector chuyển động trong suốt quá trình mã hóa.
3.93
Vector chuyển động [video] (motion vector [video])
Một vectơ hai chiều được sử dụng để bù chuyển động, nó cho biết độ lệch từ vị trí tọa độ trong hình ảnh hiện tại đến vị trí tọa độ trong hình ảnh tham chiếu.
3.94
Âm thanh nổi MS [âm thanh] (MS stereo [audio])
Một phương pháp khai thác tính năng khác nhau, phần thừa của âm thanh nổi trong các chương trình âm thanh nổi dựa trên việc mã hóa tín hiệu tổng, tín hiệu sai khác thay vì mã hóa các kênh âm thanh trái và phải.
3.95
Mã hóa phi nội [video] (non-intra coding [video])
Mã hóa của một khối macro hoặc của hình ảnh mà sử dụng thông tin cả từ chính nó và cả từ khối macro và những hình ảnh xuất hiện vào những thời điểm khác.
3.96
Thành phần âm câm [âm thanh] (Non-tonal component [audio])
Một thành phần giống như tiếng ồn của tín hiệu âm thanh.
3.97
Lấy mẫu Nyquist (Nyquist sampling)
Lấy mẫu bằng hoặc cao hơn gấp đôi so với băng thông tối đa của một tín hiệu.
3.98
Gói tiêu đề [hệ thống] (pack [system])
Một gói bao gồm một tiêu đề gói, theo sau là một hoặc nhiều gói tin. Nó là một lớp trong hệ thống cú pháp mã hóa được mô tả trong tiêu chuẩn ISO/IEC 11172-1.
3.99
Dữ liệu gói [hệ thống] (packet data [system])
Các byte dữ liệu liên tiếp từ một dòng bít cơ sở có trong một gói dữ liệu.
3.100
Mào đầu gói dữ liệu [hệ thống] (packet header [system])
Cấu trúc dữ liệu được sử dụng để truyền tải thông tin về dữ liệu dòng cơ sở dữ được chứa trong gói dữ liệu.
3.101
Gói [hệ thống] (packet [system])
Một gói tin bao gồm một tiêu đề theo sau là một số byte liên tiếp từ một luồng dữ liệu cơ sở. Nó là một lớp trong cú pháp mã hóa hệ thống được mô tả trong tiêu chuẩn ISO/IEC 11172-1.
3.102
Phương pháp đệm (Padding [audio])
Một phương pháp để điều chỉnh độ dài trung bình theo thời gian của một khung âm thanh trong một khoảng thời gian tương ứng lấy mẫu PCM, bằng cách thêm một khe vào khung âm thanh.
3.103
Hình ảnh tham chiếu trước [video] (past reference picture [video])
Hình ảnh tham chiếu trước là hình ảnh tham chiếu xuất hiện tại một thời điểm sớm hơn so với hình ảnh hiện tại theo thứ tự hiển thị.
3.104
Tỷ lệ pixel [video] (pel aspect ratio [video])
Tỷ lệ giữa chiều cao của điểm ảnh trên màn hình với tỷ lệ chiều rộng quy định của nó.
3.105
Pixel (pel [video])
Phần tử ảnh
3.106
Chu kỳ ảnh [video] (picture period [video])
Nghịch đảo của thông số tốc độ hình ảnh.
3.107
Tốc độ ảnh [video] (picture rate [video])
Tốc độ danh định mà tại đó hình ảnh sẽ được xuất ra từ quá trình giải mã.
3.108
Hình ảnh [video] (picture [video])
Dữ liệu ảnh nguồn, được mã hóa hoặc ảnh tái tạo lại. Hình ảnh nguồn, hay ảnh tái tạo lại bao gồm ba ma trận hình chữ nhật trình diễn bằng 8 bít tương ứng với độ chói và 2 tín hiệu màu. Lớp hình ảnh là một trong những lớp có cú pháp mã hóa được định nghĩa trong tiêu chuẩn ISO/IEC 11172-2.
3.109
Giàn bộ lọc nhiều pha [âm thanh] (Polyphase filterbank [audio])
Một tập hợp các giàn bộ lọc thông bằng nhau có các mối quan hệ tương quan biệt về pha với nhau, cho phép giàn bộ lọc thực hiện hiệu quả.
3.110
Dự đoán [video] (prediction [video])
Việc sử dụng công cụ dự đoán để ước tính giá trị pixel hoặc phần tử dữ liệu hiện đang được giải mã.
3.111
Hình ảnh mã hóa dự đoán; ảnh P (prediction-coded picture; P-picture)
Một hình ảnh được mã hóa bằng cách sử dụng tính năng dự đoán bù chuyển động từ hình ảnh tham chiếu trước đó.
3.112
Lỗi dự đoán [video] (prediction error [video])
Sự khác nhau giữa giá trị thực tế của một điểm ảnh hoặc phần tử dữ liệu và dự đoán của nó.
3.113
Dự đoán [video] (predictor [video])
Một sự kết hợp tuyến tính của các giá trị pixel được giải mã hoặc các phần tử dữ liệu trước đây.
3.114
Mốc thời gian trình diễn; PTS [hệ thống] (presentation time-stamp; PTS [system])
Một trường mà có thể xuất hiện trong mào đầu gói tin cho biết thời gian mà một đơn vị trình diễn được trình diễn trong bộ giải mã đích của hệ thống.
3.115
Đơn vị trình diễn [hệ thống] (presentation unit [system])
Một đơn vị truy cập âm thanh hoặc một hình ảnh được giải mã.
3.116
Mô hình tâm thính học [âm thanh] (Psychoacoustic model [audio])
Một mô hình toán học tương ứng với mặt nạ hệ thống thính giác của con người.
3.117
Ma trận lượng tử hóa [video] (quantization matrix [video])
Một tập hợp gồm sáu mươi tư giá trị 8 bít được sử dụng bởi bộ giải lượng tử.
3.118
Hệ số DCT lượng tử [video] (quantized DCT coefficients [video])
Hệ số DCT trước khi giải lượng tử. Một mã có chiều dài thay đổi được trình diễn bởi hệ số DCT được lưu trữ như một phần của dòng bít video nén.
3.119
Hệ số tỷ lệ lượng tử [video] (quantizer scale factor [video])
Một phần tử dữ liệu được trình diễn trong dòng bít và được sử dụng bởi quá trình giải mã để chia tỷ lệ giải lượng tử.
3.120
Truy cập ngẫu nhiên (random access)
Quá trình bắt đầu đọc và giải mã dòng bit được mã hóa tại một điểm tùy ý.
3.121
Ảnh mẫu [video] (reference picture [video])
Ảnh mẫu là những ảnh ảnh I hoặc ảnh P gần nhất với ảnh hiện tại theo thứ tự hiển thị.
3.122
Bộ đệm sắp xếp lại [video] (reoder butter [video])
Một bộ đệm trong các bộ giải mã hệ thống dùng để lưu trữ ảnh I hoặc ảnh P đã được tái tạo lại.
3.123
Quá trình tái lượng tử hóa [âm thanh] (Requantization [audio])
Giải mã các mẫu băng tần con được mã hóa để khôi phục các giá trị lượng tử hóa ban đầu.
3.124
Bảo lưu (reserved)
Thuật ngữ “bảo lưu” được sử dụng trong các điều khoản quy định dòng bit được mã hóa, cho biết các giá trị có thể được sử dụng trong tương lai dùng cho các phần mở rộng được quy định trong tiêu chuẩn ISO/IEC.
3.125
Tua lại [video] (reverse play [video])
Quá trình hiển thị chuỗi hình ảnh ngược với thứ tự hiển thị.
3.126
Băng điều chỉnh hệ số tỷ lệ [âm thanh] (Scalefactor band [audio])
Một tập hợp các đường tần số trong Lớp III được chia tỷ lệ theo một hệ số tỷ lệ.
3.127
Chỉ số hệ số tỷ lệ [âm thanh] (scalefactor index [audio])
Một mã số dùng cho hệ số tỷ lệ.
3.128
Hệ số tỷ lệ [âm thanh] (Scalefactor [audio])
Hệ số mà một tập giá trị được chia tỷ lệ trước khi lượng tử.
3.129
Tiêu đề trình tự [hình ảnh ] (sequence header [video])
Một khối dữ liệu trong dòng bit được mã hóa lưu trữ việc trình diễn mã hóa của một số phần tử dữ liệu. Đây là một trong các lớp của một cú pháp mã hóa được định nghĩa trong tiêu chuẩn ISO/IEC 11172-2.
3.130
Thông tin phụ (Side information)
Thông tin cần thiết trong dòng bít để kiểm soát bộ giải mã.
3.131
Khối macro nhảy cách [video] (skipped macroblock [video])
Một khối macro mà không có dữ liệu nào được lưu trữ.
3.132
Lát cắt ảnh [video] (slice [video])
Một loạt các khối macro. Đây là một trong các lớp của cú pháp mã hóa được xác định trong tiêu chuẩn ISO/IEC 11172-2.
3.133
Khe [âm thanh] (slot [audio])
Khe là một phần cơ bản trong dòng bít. Trong lớp I, một khe bằng bốn byte, trong lớp II và III là một byte.
3.134
Dòng nguồn (source stream)
Một dòng không ghép kênh đơn của các mẫu trước khi mã hóa nén.
3.135
Hàm phân bố [âm thanh] (spreading function [audio])
Một hàm mô tả tần số lan truyền của mặt nạ.
3.136
Các mã khởi đầu [hệ thống và video] (start codes [system anh video])
Các mã 32 bit được nhúng trong dòng bit được mã hóa là duy nhất. Chúng được sử dụng cho một số mục đích kể cả việc xác định số lớp trong cú pháp mã hóa.
3.137
Bộ đệm đầu vào STD [hệ thống] (STD input buffer [system])
Bộ đệm vào trước ra trước tại đầu vào của bộ giải mã đích hệ thống dùng để lưu trữ dữ liệu nén từ các luồng sơ cấp trước khi giải mã.
3.138
Chế độ âm thanh nổi [âm thanh] (Stereo mode [audio])
Chế độ, trong đó hai kênh âm thanh tạo thành một cặp kênh âm thanh nổi (trái và phải) được mã hóa trong một dòng bit. Quá trình mã hóa giống như đối với chế độ song kênh.
3.139
Nhồi (bit); nhồi (byte) (Stuffing (bits); stuffing (bytes))
Các từ mã có thể được chèn vào dòng bit nén sẽ bị loại bỏ trong quá trình giải mã. Mục đích của chúng là làm tăng tốc độ bit của dòng bit.
3.140
Băng tần con [âm thanh] (subband [audio])
Phần nhánh của băng tần số âm thanh.
3.141
Giàn giàn bộ lọc tần con [âm thanh] (subband filterbank [audio])
Một tập hợp các giàn bộ lọc tần bao phủ toàn bộ dải tần âm thanh. Trong tiêu chuẩn này, giàn giàn bộ lọc tần con là một giàn bộ lọc nhiều pha.
3.142
Mẫu băng tần con [âm thanh] (subband samples [audio])
Giàn giàn bộ lọc tần con trong bộ mã hóa âm thanh tạo ra một trình diễn được lọc và được lấy mẫu của dòng âm thanh đầu vào. Các mẫu được lọc được gọi là các mẫu băng tần con. Từ 384 mẫu âm thanh đầu vào liên tiếp theo thời gian, 12 mẫu băng tần con liên tiếp theo thời gian được tạo ra trong mỗi 32 băng tần con.
3.143
Từ đồng bộ [audio] (syncword [audio])
Một mã 12 bit được nhúng trong dòng bit âm thanh xác định thời điểm bắt đầu của khung.
3.144
Giàn bộ lọc tổng hợp [âm thanh] (Synthesis filterbank [audio])
Giàn bộ lọc trong bộ giải mã mà tái tạo lại tín hiệu âm thanh PCM từ các mẫu băng tần con.
3.145
Tiêu đề hệ thống [hệ thống] (system header [system])
Tiêu đề hệ thống là một cấu trúc dữ liệu được định nghĩa trong tiêu chuẩn này mang thông tin tổng hợp các đặc tính hệ thống của dòng đã ghép kênh ISO/IEC 11172.
3.146
Bộ giải mã hệ thống đích; STD [hệ thống] (system target decoder; STD [system])
Mô hình tham chiếu giả định của quá trình giải mã được sử dụng để mô tả ngữ nghĩa của dòng bit ghép kênh ISO/IEC 11172.
3.147
Mốc thời gian [hệ thống] (time-stamp [system])
Một thuật ngữ cho biết thời gian của sự kiện.
3.148
Bộ ba [âm thanh] (Triplet [audio])
Một bộ 3 mẫu băng tần con liên tiếp từ một băng tần con. Một bộ ba mẫu băng tần con từ một trong số 32 băng tần con tạo thành một hạt.
3.149
Thành phần âm [âm thanh] (tonal component [audio])
Một thành phần giống như hình sin của một tín hiệu âm thanh.
3.150
Tốc độ bít thay đổi (variable bitrate)
Hoạt động trong đó tốc độ bit thay đổi theo thời gian trong quá trình giải mã dòng bit nén.
3.151
Mã hóa độ dài thay đổi; VLC (variable length coding; VLC)
Một thủ tục thuận nghịch dùng để mã hóa để gán các từ mã ngắn hơn cho những trường thường xuyên xảy ra và các từ mã dài hơn cho những trường hợp ít có khả năng xảy ra.
3.152
Bộ kiểm định bộ đệm video; VBV [video] (video buffering verifier; VBV [video])
Một bộ giải mã giả định được kết nối về mặt khái niệm với đầu ra của bộ mã hóa. Mục đích của nó là hạn chế sự thay đổi tốc độ dữ liệu mà bộ mã hóa hoặc quá trình chỉnh sửa có thể gây ra.
3.153
Tuần tự video [video] (video sequence [video])
Một loạt một hoặc nhiều nhóm hình ảnh. Nó là một trong các lớp của cú pháp mã hóa được định nghĩa trong tiêu chuẩn ISO/IEC 11172-2.
3.154
Thứ tự quét zig-zag [video] (zig-zag scanning order [video])
Thứ tự tuần tự cụ thể của các hệ số DCT từ (xấp xỉ) tần số không gian thấp nhất đến cao nhất.
Các toán tử số học được sử dụng để mô tả tiêu chuẩn này tương tự như các toán tử được sử dụng trong ngôn ngữ lập trình C. Tuy nhiên, phân số nguyên được làm tròn tới một giá trị cụ thể. Các toán tử phân theo bít được định nghĩa giả định của hai phần bù nhau là đặc trưng của số nguyên. Số và vòng đếm thường bắt đầu từ số không.
4.1 Toán tử số học
+ |
Phép cộng. |
||
- |
Phép trừ (như một toán tử nhị phân) hoặc phủ định (như một toán tử một ngôi). |
||
++ |
Tăng. |
||
-- |
Giảm. |
||
* |
Phép nhân. |
||
^ |
Lũy thừa. |
||
/ |
Phân số nguyên với kết quả làm tròn tới không. Ví dụ, 7/4 và -7/-4 được làm tròn thành 1 và -7/4 và 7/-4 được làm tròn thành -1. |
||
// |
Phân số nguyên với cách làm tròn tới số gần nhất. Giá trị của một nửa số nguyên được làm tròn tới không trừ các trường hợp khác. Ví dụ 3/2 được làm tròn thành 2, và -3/2 làm tròn thành -2. |
||
DIV |
Phép chia số nguyên với kết quả vào khoảng -8. |
||
% |
Toán tử giá trị tuyệt đối. Chỉ xác định cho số dương. |
||
Sign() |
Sign(x) |
= 1 |
x>0 |
|
|
0 |
x==0 |
|
|
-1 |
x<0 |
NINT() |
Toán tử số nguyên gần nhất. Trả lại giá trị số nguyên gần nhất cho đối số của giá trị thực. Một nửa giá trị của số nguyên được làm tròn tới không. |
||
sin |
Sin |
||
cos |
Cô sin |
||
exp |
Số mũ |
||
|
Căn bậc hai |
||
Log10 |
Logarithm cơ số 10 |
||
loge |
Logarithm cơ số e |
4.2 Các toán tử logic
|| |
Phép hoặc. |
&& |
Phép và. |
! |
Phép phủ định. |
4.3 Các toán tử quan hệ
> |
Lớn hơn. |
>= |
Lớn hơn hoặc bằng. |
< |
Nhỏ hơn. |
<= |
Nhỏ hơn hoặc bằng. |
== |
Ngang bằng. |
!= |
Không bằng. |
Max [....] |
Giá trị lớn nhất trong danh sách đối số. |
Min [....] |
Giá trị nhỏ nhất trong danh sách đối số. |
4.4 Các phép toán thao tác bít
& |
Và |
| |
Hoặc |
>> |
Phép dịch phải. |
<< |
Phép dịch trái thêm số 0. |
4.5 Phép gán
= |
Toán tử gán |
4.6 Phép nhớ
Các phép nhớ sau được dùng để mô tả các kiểu dữ liệu khác nhau sử dụng trong mã hóa dòng bit.
bslbf |
Dòng bit, bít đầu tiên bên trái, trong đó “bên trái” là thứ tự trong dòng bít được viết trong tiêu chuẩn ISO/IEC 11172. Dòng bít được viết là một chuỗi của 1 và 0 trong dấu nháy đơn, ví dụ ‘1000 0001’. Khoảng trắng ở giữa dòng bít chỉ có tác dụng dễ đọc và không có ý nghĩa. |
ch |
Kênh. Nếu ch có giá trị 0, kênh bên trái cho biết là một tín hiệu stereo hoặc tín hiệu đầu tiên của hai tín hiệu độc lập.(âm thanh) |
nch |
Số lượng kênh; kết quả là 1 cho chế độ đơn kênh; 2 cho chế độ còn lại. (âm thanh) |
gr |
Hạt của 3*32 mẫu băng tần con trong lớp âm thanh II, 18*32 mẫu băng tần con trong lớp âm thanh III. (âm thanh) |
main_data |
Phần dữ liệu chính của dòng bít chứa hệ số tỷ lệ, mã hóa dữ liệu Huffman, và thông tin phụ thuộc, (âm thanh) |
main_data_beg |
Vị trí trong dòng bít của dữ liệu chính khởi đầu của một khung. Vị trí là kết quả của vị trí kết thúc trước khi thêm dữ liệu chính của khung trong một bít. Nó là quá trình tính từ giá trị dữ liệu kết thúc của khung trước. (âm thanh) |
part2_legnth |
Số lượng của bít dữ liệu chính sử dụng cho hệ số tỷ lệ. (âm thanh) |
rpchof |
Hệ số đa thức còn lại, bậc cao nhất trước tiên. (âm thanh) |
sb |
Băng tần con. (âm thanh) |
sblimit |
Số lượng của băng tần con ít nhất mà không có bít nào được phân bổ. (âm thanh) |
scfsi |
Hệ số tỷ lệ chọn lọc thông tin. (âm thanh) |
switch_point_l |
Số dải tần (khối dải tần dài) từ một điểm trên cửa sổ nguồn được sử dụng. (âm thanh) |
switch_point_s |
Số dải tần (khối dải tần ngắn) từ một điểm trên cửa sổ nguồn được sử dụng. (âm thanh) |
uimsbf |
kiểu unsigned int, bít đầu là quan trọng nhất. |
vlclbf |
Mã chiều dài biến, bít đầu tiên bên trái, trong đó “bên trái” dùng để chỉ thứ tự mà mã VLC được viết trong phụ lục B. |
window |
Số khe thời gian hiện tại của block_type==2,0 ≤ window ≤ 2. (âm thanh) |
Thứ tự byte của các lệnh multi-byte là byte đầu tiên quan trọng nhất.
4.7 Hằng số
pi |
3.14159265359... |
e |
2.71828182846... |
5 Phương pháp mô tả cú pháp dòng bít
Dòng bít thu được từ bộ giải mã được mô tả trong mục 7. Mỗi mục dữ liệu trong dòng bít được in đậm. Nó được mô tả bằng tên, chiều dài của nó bằng các bít, và được lưu lại theo loại, thứ tự truyền của nó.
Căn nguyên của hành động giải mã một phần dữ liệu trong một dòng bít phụ thuộc vào giá trị của phần tử dữ liệu đó và các yếu tố dữ liệu được giải mã trước đây. Việc giải mã các phần tử dữ liệu và xác định các biến trạng thái được sử dụng trong bộ giải mã được mô tả trong mục 8. Các cấu trúc sau đây được sử dụng để diễn tả các điều kiện khi phần tử dữ liệu có mặt và là kiểu bình thường.
While (condition) data_element |
{Nếu điều kiện đúng, thì nhóm phần tử dữ liệu sẽ xuất hiện trong chuỗi dữ liệu tiếp theo. Quá trình này lặp lại cho đến khi điều kiện sai |
....... |
|
} |
|
Do { |
|
data_element |
Phần tử dữ liệu luôn luôn xảy ra ít nhất một lần...} |
while (condition) |
{Phần tử dữ liệu được lặp lại cho đến khi điều kiện sai.} |
lf (condition) |
{Nếu điều kiện đúng, thì nhóm dữ liệu
đầu tiên sẽ xuất hiện tiếp theo trong |
data_element else { |
|
data_element |
Nếu điều kiện sai, thì nhóm dữ liệu thứ hai của các phần tử dữ liệu sẽ xuất hiện trong dòng dữ liệu tiếp theo} |
for (i=0 ; i < n ; i++) |
{Nhóm các phần tử dữ liệu xuất hiện n lần. Cấu trúc có điều kiện trong nhóm |
data_element |
Các phần tử dữ liệu có thể phụ thuộc vào giá trị của vòng điều khiển biến i, được đặt bằng 0 cho lần xuất hiện đầu tiên, tăng lên 1 cho lần xuất hiện thứ hai, và vân vân. } |
Như đã lưu ý, nhóm các phần tử dữ liệu có thể chứa các cấu trúc có điều kiện lồng nhau. Chính xác, {} được bỏ qua khi chỉ có một phần tử dữ liệu.
data_element [ ] |
data_element [ ] là một mảng của dữ liệu. Số dữ liệu cơ bản chỉ ra trong từng ngữ cảnh. |
data_element [n] |
là phần tử thứ n + 1 của mảng dữ liệu.data_element [m] [n] data_element [m][n] thứ m+1, n+1 cơ bản của hai mảng thứ nguyên của dữ liệu data_element [l] [m] [n] data_element [l][m][n] là thứ l+1,m+1,n+1 cơ bản của ba thứ nguyên của dữ liệu |
data_element [m..n] |
là dải gồm các bít giữa bít m và bít n trong data_element. |
Trong khi cú pháp được thể hiện bằng các thuật ngữ thủ tục, không nên cho rằng mục 8.4.3 thực hiện một thủ tục giải mã thỏa đáng. Mặc dù, nó xác định một dòng bit đầu vào chính xác và không có lỗi. Bộ giải mã thực tế phải bao gồm một phương tiện để tìm mã bắt đầu để bắt đầu giải mã một cách chính xác.
Định nghĩa hàm bytealigned
Hàm bytealigned () trả về 1 nếu vị trí hiện tại nằm trên ranh giới byte, bit tiếp theo trong dòng bit là bit đầu tiên trong byte. Nếu không, nó trả về 0.
Định nghĩa hàm nextbits
Hàm nextbits () cho phép so sánh một dòng bít với bít tiếp theo được giải mã trong dòng bít.
Định nghĩa hàm next_start_code
Chức năng next_start_code () loại bỏ bất kỳ bít 0 và nhồi thêm byte và xác định đúng vị trí của mã bắt đầu tiếp theo.
Cú pháp |
Số bít |
Nhận dạng |
next_start_code () { while (!bytealigned() ) |
|
|
zero_bit |
1 |
‘0’ |
while ( nextbits() != '0000 0000 0000 0000 0000 0001' ) |
|
|
zero_byte |
8 |
‘00000000’ |
} |
|
|
6 Các yêu cầu của cấu trúc mã hóa và tham số
Cú pháp |
Số bít |
Nhận dạng |
|
audio sequence () |
|
|
|
{ |
|||
|
while (nextbits()==syncword) { |
||
|
frame () |
||
|
} |
||
} |
Cú pháp |
Số bít |
Nhận dạng |
|
frame () |
|
|
|
{ |
|
|
|
|
header() |
|
|
|
error_check() |
|
|
|
audio_data() |
|
|
|
ancillary() |
|
|
} |
|
|
Cú pháp |
Số bít |
Nhận dạng |
Header () { |
|
|
Syncword |
12 |
Bslbf |
ID |
1 |
Bslbt |
layer |
2 |
Bslbf |
protection_bit |
1 |
Bslbf |
bitrate_index |
4 |
Bslbf |
sampling_frequency |
2 |
Bslbf |
padding_bit |
1 |
Bslbf |
private_bit |
1 |
Bslbf |
mode |
2 |
Bslbf |
mode_extension |
2 |
Bslbf |
copyright |
1 |
Bslbf |
original/home |
1 |
Bslbf |
emphasis |
2 |
Bslbf |
} |
|
|
6.5 Hàm dữ liệu âm thanh, lớp I
6.6 Hàm dữ liệu âm thanh, lớp II
6.7 Hàm dữ liệu âm thanh lớp III
Dòng bít dữ liệu chính được định nghĩa dưới đây. Trường main_data trong cú pháp hàm audio_data() chứa các byte từ dòng bít dữ liệu chính. Tuy nhiên, do tính chất biến đổi của mã hóa Huffman được sử dụng trong lớp III, dữ liệu chính cho một khung thường theo sau thông tin tiêu đề và thông tin phụ cho khung đó. Trường main_data cho một khung bắt đầu tại một vị trí trong dòng bít đang xử lý tiêu đề của khung tại một bù giá trị âm được cho bởi giá trị main_data_begin. (Xem định nghĩa main_data_begin và Hình A.7.a).
Ý kiến bạn đọc
Nhấp vào nút tại mỗi ô tìm kiếm.
Màn hình hiện lên như thế này thì bạn bắt đầu nói, hệ thống giới hạn tối đa 10 giây.
Bạn cũng có thể dừng bất kỳ lúc nào để gửi kết quả tìm kiếm ngay bằng cách nhấp vào nút micro đang xoay bên dưới
Để tăng độ chính xác bạn hãy nói không quá nhanh, rõ ràng.