CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÍ TỰ TIẾNG VIỆT 16-BIT
Information Technology - 16-bit Coded Vietnamese Character Set
Lời nói đầu
TCVN 6909 : 2001 phù hợp với ISO/IEC 10646-1 : 2000;
TCVN 6909 : 2001 do Tiểu ban kỹ thuật Tiêu chuẩn TCVN/JTC1/SC2 Công nghệ Thông tin - Các tập ký tự và mã hóa thông tin biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị, Bộ Khoa học, Công nghệ và Môi trường ban hành
CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÍ TỰ TIẾNG VIỆT 16-BIT
Information Technology - 16-bit Coded Vietnamese Character Set
1.1. Tiêu chuẩn này qui định bộ mã 16-bit phục vụ việc biểu diễn, lưu trữ và trao đổi các ký tự tiếng Việt trong công nghệ thông tin.
1.2. Tiêu chuẩn này quy định cấu trúc của bộ mã kí tự tiếng Việt 16-bit thông qua việc mô tả các tập kí tự thành phần và qui ước mã hóa từng kí tự trong bảng mã.
1.3. Tiêu chuẩn này không quy định hình dạng cố định và kích thước của các kí tự tiếng Việt, kỹ thuật hiển thị và xử lí những kí tự này.
2.1. Các kí tự tiếng Việt trong tiêu chuẩn này phù hợp với ISO/IEC 10646-1:2000 và UNICODE 3.0 về vị trí trong mặt phẳng đa ngữ cơ bản (BMP); các kí tự khác cần được tham chiếu theo hai tiêu chuẩn trên.
2.2. Việc mã hóa kí tự văn bản tiếng Việt trong một hệ thống công nghệ thông tin được coi là phù hợp với tiêu chuẩn này nếu có sử dụng các tập kí tự qui định trong điều 5 và mã của những kí tự được sử dụng tuân theo đúng điều 6 của tiêu chuẩn này.
ISO/IEC 10646-1:2000 Công nghệ Thông tin - Bộ kí tự tổng hợp mã hóa bằng nhiều octet (UCS) - Phần 1: Cấu trúc và mặt phẳng đa ngữ cơ bản (BMP)
TCVN 6695-1:2000 Công nghệ Thông tin - Từ vựng - Phần 1: Các thuật ngữ cơ bản
UNICODE phiên bản 3.0
4.1. Kí tự: một thành viên của một tập chứa các phần tử được dùng để biểu diễn, tổ chức hoặc điều khiển dữ liệu. [TCVN 6695-1:2000].
4.2. Chức năng điều khiển: chức năng tác động đến việc ghi lưu, xử lí, truyền phát hoặc diễn đạt dữ liệu và có biểu diễn mã hóa bằng một hoặc một số octet.
4.3. Bit: chữ số 0 hoặc 1 dùng trong hệ đếm nhị phân. [TCVN 6695-1:2000].
4.4. Byte: một xâu bao gồm một số bit được xử lý như một đơn vị và thường biểu diễn cho một kí tự hoặc một bộ phận của kí tự. [TCVN 6695-1: 2000].
4.5. Octet: một byte chứa 8 bit; cụm 8. [TCVN 6695-1:2000].
4.6. Kí tự khả hiện: kí tự có hình dáng đồ họa ở dạng viết tay, dạng in hoặc hiển thị và không có chức năng điều khiển (những hình dáng đồ họa thể hiện trong tiêu chuẩn này là một minh họa ở dạng in).
4.7. Mã kí tự: giá trị số của một xâu các bit sắp xếp có thứ tự trong biểu diễn một kí tự mã hóa (mã kí tự trong tiêu chuẩn này có độ dài 16 bit và giá trị nằm trong khoảng từ 0000 đến FFFF theo cơ số 16).
4.8. Tập kí tự mã hóa: tập hợp những kí tự tuân theo các qui tắc thiết lập cấu trúc và quan hệ giữa từng kí tự trong đó với mã kí tự tương ứng.
4.9. Bộ mã kí tự: một hoặc một số tập kí tự mã hóa được xác định rõ ràng về thành phần cấu trúc và bảng mã của chúng.
4.10. Bảng mã: bảng trình bày các kí tự được sắp xếp trong các ô có tọa độ tương ứng với mã của chúng.
4.11. Kí tự dấu thanh: thành phần của nhóm kí tự dấu thanh điệu, có khả năng tổ hợp với một số kí tự nguyên âm thành những kí tự có thanh điệu khác.
4.12. Kí tự dấu nguyên âm: thành phần của nhóm kí tự dấu nguyên âm, có khả năng tổ hợp với một số kí tự nguyên âm (như A, E, O, U, a, e, o, u) thành những kí tự nguyên âm khác.
Các tập kí tự được quy định trong tiêu chuẩn này bao gồm tập kí tự cơ bản và tập kí tự mở rộng.
5.1. Tập kí tự cơ bản
Tập kí tự cơ bản gồm 119 kí tự khả hiện nằm trong sáu nhóm: nhóm chữ cái, nhóm dấu thanh, nhóm dấu nguyên âm, nhóm chữ số, nhóm kí hiệu và nhóm dấu câu.
5.1.1. Nhóm chữ cái
Có 33 chữ cái, thể hiện 12 nguyên âm và 21 phụ âm cơ bản.
Mỗi chữ cái có hai dạng: chữ hoa và chữ thường.
Nhóm chữ cái bao gồm 33 chữ hoa và 33 chữ thường (xem bảng 1 và bảng 2).
Mô tả của những kí tự nói trên xem trong bảng 14.
Bảng 1 - Các kí tự nguyên âm
Chữ hoa | A | Ă | Â | E | Ê | I | O | Ô | Ơ | U | Ư | Y |
Chữ thường | a | ă | â | e | ê | i | o | ô | ơ | u | ư | y |
Bảng 2 - Các kí tự phụ âm
Chữ hoa | B | C | D | Đ | F | G | H | J | K | L | M |
Chữ thường | b | c | d | đ | f | g | h | j | k | l | m |
Chữ hoa | N | P | Q | R | S | T | V | W | X | Z |
|
Chữ thường | n | p | q | r | s | t | v | w | x | z |
|
5.1.2. Nhóm dấu thanh
Nhóm dấu thanh gồm có 5 kí tự (xem bảng 3), mô tả của những kí tự này xem trong bảng 14.
Bảng 3 - Các dấu thanh
5.1.3. Nhóm dấu nguyên âm
Nhóm dấu nguyên âm gồm 3 kí tự (xem bảng 4), mô tả của những kí tự này xem trong bảng 14.
Bảng 4 - Các dấu nguyên âm
5.1.4. Nhóm chữ số
Nhóm chữ số gồm có 10 kí tự (xem bảng 5), mô tả của những kí tự này xem trong bảng 14.
Bảng 5 - Các chữ số
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
5.1.5. Nhóm kí hiệu
Nhóm kí hiệu gồm có 20 kí tự (xem bảng 6), mô tả của những kí tự này xem trong bảng 14.
Bảng 6 - Các kí hiệu
“ | # | $ | % | & | ‘ | * | + | - | / |
< | = | > | @ | \ | ^ | _ | | | ̉ | ~ |
5.1.6. Nhóm dấu câu
Nhóm các dấu câu gồm có 15 kí tự (xem bảng 7), mô tả của những kí tự này xem trong bảng 14.
Bảng 7 - Các dấu câu
SP | ! | ( | ) | , | . | : | ; | ? | [ | ] | { | } | “ | ” |
5.2. Tập kí tự mở rộng
Tập kí tự mở rộng gồm có 120 kí tự nguyên âm mang dấu thanh (xem bảng 8).
Tập kí tự này gồm có 60 kí tự chữ hoa và 60 kí tự chữ thường. Mô tả của những kí tự này xem trong bảng 14.
Bảng 8 - Các kí tự nguyên âm mang dấu thanh
Chữ hoa | À | Ả | Ã | Á | Ạ | Ằ | Ẳ | Ẵ | Ắ | Ặ |
Chữ thường | à | ả | ã | á | ạ | ằ | ẳ | ẵ | ắ | ặ |
Chữ hoa | Ầ | Ẩ | Ẫ | Ấ | Ậ | È | Ẻ | Ẽ | É | Ẹ |
Chữ thường | ầ | ẩ | ẫ | ấ | ậ | è | ẻ | ẽ | é | ẹ |
Chữ hoa | Ề | Ể | Ễ | Ế | Ệ | Ì | Ỉ | Ĩ | Í | Ị |
Chữ thường | ề | ể | ễ | ế | ệ | ì | ỉ | ĩ | í | ị |
Chữ hoa | Ò | Ỏ | Õ | Ó | Ọ | Ồ | Ổ | Ỗ | Ố | Ộ |
Chữ thường | ò | ỏ | õ | ó | ọ | ồ | ổ | ỗ | ố | ộ |
Chữ hoa | Ờ | Ở | Ỡ | Ớ | Ợ | Ù | Ủ | Ũ | Ú | Ụ |
Chữ thường | ờ | ở | ỡ | ớ | ợ | ù | ủ | ũ | ú | ụ |
Chữ hoa | Ừ | Ử | Ữ | Ứ | Ự | Ỳ | Ỷ | Ỹ | Ý | Ỵ |
Chữ thường | ừ | ử | ữ | ứ | ự | ỳ | ỷ | ỹ | ý | ỵ |
6.1. Bộ mã kí tự tiếng Việt 16-bit được quy định trong năm bảng mã từ bảng 9 đến bảng 13.
6.2. Vị trí mỗi ô trong bảng mã được biểu thị bằng tọa độ (x, y) theo cơ số 16, trong đó x chỉ số cột và y chỉ số hàng; xy cũng là giá trị số (mã) của kí tự trong ô.
6.3. Mã và mô tả của các kí tự được qui định trong bảng 14.
Bảng 9 - Bảng mã kí tự trong vùng 0000 - 00FF
Bảng 10 - Bảng mã kí tự trong vùng 0100 - 01FF
Bảng 11 - Bảng mã kí tự trong vùng 0300 - 03FF
Bảng 12 - Bảng mã kí tự trong vùng 1E00 - 1EFF
Bảng 13 - Bảng mã kí tự trong vùng 2000 - 20FF
Bảng 14 - Bảng mô tả các kí tự
Mã | Kí tự | Mô tả kí tự |
0020 | SP | Dấu cách (SPACE) |
0021 | ! | Dấu chấm than |
0022 | “ | Dấu nháy kép |
0023 | # | Dấu rào |
0024 | $ | Dấu đô la |
0025 | % | Dấu phần trăm |
0026 | & | Dấu và |
0027 | ‘ | Dấu nháy đơn |
0028 | ( | Dấu mở ngoặc đơn |
0029 | ) | Dấu đóng ngoặc đơn |
002A | * | Dấu hoa thị |
002B | + | Dấu cộng |
002C | , | Dấu phẩy |
002D | - | Dấu trừ, dấu gạch ngang |
002E | . | Dấu chấm |
002F | / | Dấu chia, dấu sổ thuận |
0030 | 0 | Số không |
0031 | 1 | Số một |
0032 | 2 | Số hai |
0033 | 3 | Số ba |
0034 | 4 | Số bốn |
0035 | 5 | Số năm |
0036 | 6 | Số sáu |
0037 | 7 | Số bảy |
0038 | 8 | Số tám |
0039 | 9 | Số chín |
003A | : | Dấu hai chấm |
003B | ; | Dấu chấm phẩy |
003C | < | Dấu nhỏ hơn |
003D | = | Dấu bằng |
003E | > | Dấu lớn hơn |
003F | ? | Dấu chấm hỏi |
0040 | @ | Dấu a còng |
0041 | A | Chữ A hoa |
0042 | B | Chữ B hoa |
0043 | C | Chữ C hoa |
0044 | D | Chữ D hoa |
0045 | E | Chữ E hoa |
0046 | F | Chữ F hoa |
0047 | G | Chữ G hoa |
0048 | H | Chữ H hoa |
0049 | I | Chữ I hoa |
004A | J | Chữ J hoa |
004B | K | Chữ K hoa |
004C | L | Chữ L hoa |
004D | M | Chữ M hoa |
004E | N | Chữ N hoa |
004F | O | Chữ O hoa |
0050 | P | Chữ P hoa |
0051 | Q | Chữ Q hoa |
0052 | R | Chữ R hoa |
0053 | S | Chữ S hoa |
0054 | T | Chữ T hoa |
0055 | U | Chữ U hoa |
0056 | V | Chữ V hoa |
0057 | W | Chữ W hoa |
0058 | X | Chữ X hoa |
0059 | Y | Chữ Y hoa |
005A | Z | Chữ Z hoa |
005B | [ | Dấu mở ngoặc vuông |
005C | \ | Dấu sổ ngược |
005D | ] | Dấu đóng ngoặc vuông |
005E | ^ | Dấu mũ |
005F | _ | Dấu gạch dưới |
0060 | ` | Dấu trầm |
0061 | a | Chữ a thường |
0062 | b | Chữ b thường |
0063 | c | Chữ c thường |
0064 | d | Chữ d thường |
0065 | e | Chữ e thường |
0066 | f | Chữ f thường |
0067 | g | Chữ g thường |
0068 | h | Chữ h thường |
0069 | i | Chữ i thường |
006A | j | Chữ j thường |
006B | k | Chữ k thường |
006C | l | Chữ l thường |
006D | m | Chữ m thường |
006E | n | Chữ n thường |
006F | o | Chữ o thường |
0070 | p | Chữ p thường |
0071 | q | Chữ q thường |
0072 | r | Chữ r thường |
0073 | s | Chữ s thường |
0074 | t | Chữ t thường |
0075 | u | Chữ u thường |
0076 | v | Chữ v thường |
0077 | w | Chữ w thường |
0078 | x | Chữ x thường |
0079 | y | Chữ y thường |
007A | z | Chữ z thường |
007B | { | Dấu mở ngoặc nhọn |
007C | | | Dấu sổ |
007D | } | Dấu đóng ngoặc nhọn |
007E | ~ | Dấu sóng |
00A0 | NBSP | Dấu cách phi dãn (NO - BREAK SPACE) |
00C0 | À | Chữ A hoa với dấu huyền |
00C1 | Á | Chữ A hoa với dấu sắc |
00C2 | Â | Chữ Â hoa |
00C3 | Ã | Chữ A hoa với dấu ngã |
00C8 | È | Chữ E hoa với dấu huyền |
00C9 | É | Chữ E hoa với dấu sắc |
00CA | Ê | Chữ Ê hoa |
00CC | Ì | Chữ I hoa với dấu huyền |
00CD | Í | Chữ I hoa với dấu sắc |
00D2 | Ò | Chữ O hoa với dấu huyền |
00D3 | Ó | Chữ O hoa với dấu sắc |
00D4 | Ô | Chữ Ô hoa |
00D5 | Õ | Chữ O hoa với dấu ngã |
00D9 | Ù | Chữ U hoa với dấu huyền |
00DA | Ú | Chữ U hoa với dấu sắc |
00DD | Ý | Chữ Y hoa với dấu sắc |
00E0 | à | Chữ a thường với dấu huyền |
00E1 | á | Chữ a thường với dấu sắc |
00E2 | â | Chữ â thường |
00E3 | ã | Chữ a thường với dấu ngã |
00E8 | è | Chữ e thường với dấu huyền |
00E9 | é | Chữ e thường với dấu sắc |
00EA | ê | Chữ ê thường |
00EC | ì | Chữ i thường với dấu huyền |
00ED | í | Chữ i thường với dấu sắc |
00F2 | ò | Chữ o thường với dấu huyền |
00F3 | ó | Chữ o thường với dấu sắc |
00F4 | ô | Chữ ô thường |
00F5 | õ | Chữ o thường với dấu ngã |
00F9 | ù | Chữ u thường với dấu huyền |
00FA | ú | Chữ u thường với dấu sắc |
00FD | ý | Chữ y thường với dấu sắc |
0102 | Ă | Chữ Ă hoa |
0103 | ă | Chữ ă thường |
0110 | Đ | Chữ Đ hoa |
0111 | đ | Chữ đ thường |
0128 | Ĩ | Chữ I hoa với dấu ngã |
0129 | ĩ | Chữ i thường với dấu ngã |
0168 | Ũ | Chữ U hoa với dấu ngã |
0169 | ũ | Chữ u thường với dấu ngã |
01A0 | Ơ | Chữ O hoa |
01A1 | ơ | Chữ ơ thường |
01AF | Ư | Chữ Ư hoa |
01B0 | ư | Chữ ư thường |
0300 | Dấu huyền | |
0301 | Dấu sắc | |
0302 | Dấu nón | |
0303 | Dấu ngã | |
0306 | Dấu võng | |
0309 | Dấu hỏi | |
031B | Dấu móc | |
0323 | Dấu nặng | |
1EA0 | Ạ | Chữ A hoa với dấu nặng |
1EA1 | ạ | Chữ a thường với dấu nặng |
1EA2 | Ả | Chữ A hoa với dấu hỏi |
1EA3 | ả | Chữ a thường với dấu hỏi |
1EA4 | Ấ | Chữ Â hoa với dấu sắc |
1EA5 | ấ | Chữ â thường với dấu sắc |
1EA6 | Ầ | Chữ Â hoa với dấu huyền |
1EA7 | ầ | Chữ â thường với dấu huyền |
1EA8 | Ẩ | Chữ Â hoa với dấu hỏi |
1EA9 | ẩ | Chữ â thường với dấu hỏi |
1EAA | Ẫ | Chữ Â hoa với dấu ngã |
1EAB | ẫ | Chữ â thường với dấu ngã |
1EAC | Ậ | Chữ Â hoa với dấu nặng |
1EAD | ậ | Chữ â thường với dấu nặng |
1EAE | Ắ | Chữ Ă hoa với dấu sắc |
1EAF | ắ | Chữ ă thường với dấu sắc |
1EB0 | Ằ | Chữ Ă hoa với dấu huyền |
1EB1 | ằ | Chữ ă thường với dấu huyền |
1EB2 | Ẳ | Chữ Ă hoa với dấu hỏi |
1EB3 | ẳ | Chữ ă thường với dấu hỏi |
1EB4 | Ẵ | Chữ Ă hoa với dấu ngã |
1EB5 | ẵ | Chữ ă thường với dấu ngã |
1EB6 | Ặ | Chữ Ă hoa với dấu nặng |
1EB7 | ặ | Chữ ă thường với dấu nặng |
1EB8 | Ẹ | Chữ E hoa với dấu nặng |
1EB9 | ẹ | Chữ e thường với dấu nặng |
1EBA | Ẻ | Chữ E hoa với dấu hỏi |
1EBB | ẻ | Chữ e thường với dấu hỏi |
1EBC | Ẽ | Chữ E hoa với dấu ngã |
1EBD | ẽ | Chữ e thường với dấu ngã |
1EBE | Ế | Chữ Ê hoa với dấu sắc |
1EBF | ế | Chữ ê thường với dấu sắc |
1EC0 | Ề | Chữ Ê hoa với dấu huyền |
1EC1 | ề | Chữ ê thường với dấu huyền |
1EC2 | Ể | Chữ Ê hoa với dấu hỏi |
1EC3 | ể | Chữ ê thường với dấu hỏi |
1EC4 | Ễ | Chữ Ê hoa với dấu ngã |
1EC5 | ễ | Chữ ê thường với dấu ngã |
1EC6 | Ệ | Chữ Ê hoa với dấu nặng |
1EC7 | ệ | Chữ ê thường với dấu nặng |
1EC8 | Ỉ | Chữ I hoa với dấu hỏi |
1EC9 | ỉ | Chữ i thường với dấu hỏi |
1ECA | Ị | Chữ I hoa với dấu nặng |
1ECB | ị | Chữ i thường với dấu nặng |
1ECC | Ọ | Chữ O hoa với dấu nặng |
1ECD | ọ | Chữ o thường với dấu nặng |
1ECE | Ỏ | Chữ O hoa với dấu hỏi |
1ECF | ỏ | Chữ o thường với dấu hỏi |
1ED0 | Ố | Chữ Ô hoa với dấu sắc |
1ED1 | ố | Chữ ô thường với dấu sắc |
1ED2 | Ồ | Chữ Ô hoa với dấu huyền |
1ED3 | ồ | Chữ ô thường với dấu huyền |
1ED4 | Ổ | Chữ Ô hoa với dấu hỏi |
1ED5 | ổ | Chữ ô thường với dấu hỏi |
1ED6 | Ỗ | Chữ Ô hoa với dấu ngã |
1ED7 | ỗ | Chữ ô thường với dấu ngã |
1ED8 | Ộ | Chữ Ô hoa với dấu nặng |
1ED9 | ộ | Chữ ô thường với dấu nặng |
1EDA | Ớ | Chữ Ơ hoa với dấu sắc |
1EDB | ớ | Chữ ơ thường với dấu sắc |
1EDC | Ờ | Chữ Ơ hoa với dấu huyền |
1EDD | ờ | Chữ ơ thường với dấu huyền |
1EDE | Ở | Chữ Ơ hoa với dấu hỏi |
1EDF | ở | Chữ ơ thường với dấu hỏi |
1EE0 | Ỡ | Chữ Ơ hoa với dấu ngã |
1EE1 | ỡ | Chữ ơ thường với dấu ngã |
1EE2 | Ợ | Chữ Ơ hoa với dấu nặng |
1EE3 | ợ | Chữ ơ thường với dấu nặng |
1EE4 | Ụ | Chữ U hoa với dấu nặng |
1EE5 | ụ | Chữ u thường với dấu nặng |
1EE6 | Ủ | Chữ U hoa với dấu hỏi |
1EE7 | ủ | Chữ u thường với dấu hỏi |
1EE8 | Ứ | Chữ Ư hoa với dấu sắc |
1EE9 | ứ | Chữ ư thường với dấu sắc |
1EEA | Ừ | Chữ Ư hoa với dấu huyền |
1EEB | ừ | Chữ ư thường với dấu huyền |
1EEC | Ử | Chữ Ư hoa với dấu hỏi |
1EED | ử | Chữ ư thường với dấu hỏi |
1EEE | Ữ | Chữ Ư hoa với dấu ngã |
1EEF | ữ | Chữ ư thường với dấu ngã |
1EF0 | Ự | Chữ Ư hoa với dấu nặng |
1EF1 | ự | Chữ ư thường với dấu nặng |
1EF2 | Ỳ | Chữ Y hoa với dấu huyền |
1EF3 | ỳ | Chữ y thường với dấu huyền |
1EF4 | Ỵ | Chữ Y hoa với dấu nặng |
1EF5 | ỵ | Chữ y thường với dấu nặng |
1EF6 | Ỷ | Chữ Y hoa với dấu hỏi |
1EF7 | ỷ | Chữ y thường với dấu hỏi |
1EF8 | Ỹ | Chữ Y hoa với dấu ngã |
1EF9 | ỹ | Chữ y thường với dấu ngã |
201C | “ | Dấu mở ngoặc kép |
201D | ” | Dấu đóng ngoặc kép |
Ý kiến bạn đọc
Nhấp vào nút tại mỗi ô tìm kiếm.
Màn hình hiện lên như thế này thì bạn bắt đầu nói, hệ thống giới hạn tối đa 10 giây.
Bạn cũng có thể dừng bất kỳ lúc nào để gửi kết quả tìm kiếm ngay bằng cách nhấp vào nút micro đang xoay bên dưới
Để tăng độ chính xác bạn hãy nói không quá nhanh, rõ ràng.