Tiêu chuẩn Việt Nam TCVN5712:1999

Tiêu chuẩn quốc gia TCVN 5712:1999 về Công nghệ thông tin - Bộ mã ký tự tiếng Việt 8-bit

Nội dung toàn văn Tiêu chuẩn quốc gia TCVN 5712:1999 về Công nghệ thông tin - Bộ mã ký tự tiếng Việt 8-bit


TIÊU CHUẨN QUỐC GIA

TCVN 5712:1999

CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÝ TỰ TIẾNG VIỆT 8-BIT

lnformation technology -8-bit coded Vietnamese character set

Lời nói đầu

TCVN 5712 : 1999 thay thế TCVN 5712 : 1993.

TCVN 5712 : 1999 do Ban kỹ thuật tiêu chuẩn TCVN/JTC1 “Công nghệ Thông tin” biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị; Bộ Khoa học, Công nghệ và Môi trường (nay là Bộ Khoa học và Công nghệ) ban hành.

Tiêu chuẩn này được chuyển đổi năm 2008 từ Tiêu chuẩn Việt Nam cùng số hiệu thành Tiêu chuẩn Quốc gia theo quy định tại khoản 1 Điều 69 của Luật Tiêu chuẩn và Quy chuẩn kỹ thuật và điểm a khoản 1 Điều 6 Nghị định số 127/2007/NĐ-CP ngày 1/8/2007 của Chính phủ quy định chi tiết thi hành một số điều của Luật Tiêu chuẩn và Quy chuẩn kỹ thuật.

 

CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÝ TỰ TIẾNG VIỆT 8-BIT

lnformation technology - 8-bit coded Vietnamese character set

1 Phạm vi áp dụng

1.1 Tiêu chuẩn này quy định một bộ mã 8-bit dùng để biểu diễn, lưu trữ và trao đổi các văn bản tiếng Việt trong công nghệ thông tin.

1.2 Tiêu chuẩn này quy định cấu trúc của bộ mã nói trên thông qua việc mô tả các tập ký tự thành phần và quy ước mã hóa từng ký tự trong bảng mã.

1.3 Tiêu chuẩn này không quy định hình dạng cố định và kích thước của các ký tự tiếng Việt, kỹ thuật hiển thị và xử lý những ký tự này.

2 Tính phù hợp

Việc mã hóa văn bản tiếng Việt trong một hệ thống công nghệ thông tin được coi là phù hợp với tiêu chuẩn này nếu nó có sử dụng ít nhất là tập ký tự cơ bản được quy định trong điều 5 với các mã của từng ký tự tương ứng được quy định trong điều 6 của tiêu chuẩn này.

3 Tài liệu viện dẫn

lSO/IEC 646 Công nghệ Thông tin - Bộ mã ký tự 7-bit dùng trong trao đổi thông tin.

4 Thuật ngữ và định nghĩa

4.1 Ký tự: thành viên trong tập hợp các phần tử cơ bản dùng để tổ chức, điều khiển hoặc biểu diễn dữ liệu văn bản.

4.2 Mặt chữ: hình dạng nhìn thấy được của một ký tự.

4.3 Ký tự khả hiện: ký tự có mặt chữ xác định, nhờ đó mà có thể nhìn thấy được văn bản.

4.4 Ký tự điều khiển: ký tự có chức năng đặc biệt, dùng để gây ra một hành động có ảnh hưởng trực tiếp đến việc vận hành các chương trình hoặc thiết bị lưu trữ, xử lý, diễn đạt hoặc trao đổi dữ liệu văn bản.

4.5 Tập ký tự: một (hoặc vài) nhóm ký tự có số lượng và thành phần phù hợp cho việc biểu diễn, lưu trữ hoặc trao đổi dữ liệu văn bản ở một mức độ xác định.

4.6 Bit: đơn vị nhỏ nhất của thông tin có hai giá trị nhị phân thường được biểu thị bằng số 0 và số 1.

4.7 Tổ hợp bit: một chuỗi các bit được sắp xếp thứ tự dùng để biểu diễn (mã hóa) các ký tự. Tổ hợp bit được sử dụng trong tiêu chuẩn này là một đơn vị thông tin có độ dài 8 bit còn gọi là một octet hoặc một byte.

4.8 Mã ký tự: giá trị của một tổ hợp bit mã hóa ký tự tương ứng, thường được biểu diễn theo cơ số 2, 8, 10 hoặc 16.

4.9 Bộ mã ký tự: một hoặc vài tập ký tự được xác định về thành phần cấu trúc với các quy tắc rõ ràng thiết lập mối quan hệ một - một giữa mỗi ký tự và mã của ký tự đó.

4.10 Bảng mã: bảng trình bày các ký tự được sắp xếp trong các ô có tọa độ tương ứng với mã của chúng.

4.11 Vị trí: một ô của bảng mã có tọa độ được xác định bởi số thứ tự cột và hàng của nó.

5 Các tập ký tự

Các tập ký tự được quy định trong tiêu chuẩn này bao gồm tập ký tự cơ bản, tập ký tự mở rộng và tập ký tự điều khiển.

5.1 Tập ký tự cơ bản

Tập ký tự cơ bản gồm 114 ký tự khả hiện, bao gồm nhóm chữ cái, nhóm dấu thanh, nhóm chữ số, nhóm ký hiệu và nhóm dấu câu.

5.1.1 Nhóm chữ cái

Có 33 chữ cái thể hiện 12 nguyên âm và 21 phụ âm cơ bản.

Mỗi chữ cái có hai dạng: chữ hoa và chữ thường.

Nhóm chữ cái bao gồm 33 ký tự chữ hoa và 33 ký tự chữ thường (xem Bảng 1 và Bảng 2).

Tên đầy đủ của các ký tự nói trên xem trong Bảng 10.

Bảng 1 - Các ký tự nguyên âm

Chữ hoa

A

Ă

Â

E

Ê

I

O

Ô

Ơ

U

Ư

Y

Chữ thường

a

ă

â

e

ê

i

o

ô

ơ

u

ư

y

Bảng 2 - Các ký tự phụ âm

Chữ hoa

B

C

D

Đ

F

G

H

J

K

L

M

Chữ thường

b

c

d

đ

f

g

h

j

k

l

m

 

Chữ hoa

N

P

Q

R

S

T

V

W

X

Z

Chữ thường

n

p

q

r

s

t

v

w

x

z

5.1.2 Nhóm dấu thanh

Nhóm dấu thanh gồm có 5 ký tự (xem bảng 3). Tên đầy đủ của các ký tự này xem trong Bảng 10.

Bảng 3 - Các dấu thanh

5.1.3 Nhóm chữ số

Nhóm chữ số gồm có 10 ký tự (xem Bảng 4). Tên đầy đủ của các ký tự này xem trong Bảng 10.

Bảng 4 - Các chữ số

1

2

3

4

5

6

7

8

9

5.1.4 Nhóm ký hiệu

Nhóm ký hiệu gồm có 20 ký tự (xem Bảng 5). Tên đầy đủ của các ký tự này xem trong Bảng 10.

Bảng 5 - Các ký hiệu

''

#

$

%

&

'

*

+

-

/

<>

=

@

\

^

-

|

~

5.1.5 Nhóm dấu câu

Nhóm dấu câu gồm có 13 ký tự (xem Bảng 6). Tên đầy đủ của các ký tự này xem trong Bảng 10.

Bảng 6 - Các dấu câu

SP

!

(

)

,

.

:

;

?

[

]

{

}

5.2 Tập ký tự mở rộng

Tập ký tự mở rộng gồm có 120 ký tự khả hiện, bao gồm 60 ký tự chữ hoa mang dấu thanh và 60 ký tự chữ thường mang dấu thanh. Tên đầy đủ của các ký tự này xem trong Bảng 10.

Bảng 7 - Các ký tự mang dấu thanh

Chữ hoa

À

Ã

Á

Chữ thường

à

ã

á

 

Chữ hoa

È

É

Chữ thường

è

é

 

Chữ hoa

Ì

Ĩ

Í

Chữ thường

ế

ì

ĩ

í

 

Chữ hoa

Ò

Õ

Ó

Chữ thường

ò

õ

ó

 

Chữ hoa

Ù

Ũ

Ú

Chữ thường

ù

ũ

ú

 

Chữ hoa

Ý

Chữ thường

ý

5.3 Tập ký tự điều khiển

Tập ký tự điều khiển dùng trong tiêu chuẩn này gồm có 21 ký tự. Các ký tự điều khiển không có mặt chữ riêng và được biểu thị bằng các chữ viết tắt theo tiêu chuẩn quốc tế ISO/IEC 646.

Bảng 8 - Các ký tự điều khiển

Ký tự

Tên

Ký tự

Tên

NUL

KÝ TỰ RỖNG (NULL)

DLE

THOÁT KẾT NỐI DỮ LIỆU (DATA LINK ESCAPE)

ETX

CUỐI VĂN BẢN (END OF TEXT)

CAN

HỦY (CANCEL)

BEL

RUNG CHUÔNG (BELL)

EM

CUỐI TỆP (END OF MEDIUM)

BS

LÙI KÝ TỰ (BACKSPACE)

SUB

THAY THẾ (SUBSTITUTE)

HT

NHẢY NGANG (HORIZONTAL TABULATION)

ESC

THOÁT (ESCAPE)

LF

XUỐNG DÒNG (LINEFEED)

FS

NGĂN CÁCH TỆP (FILE SEPERATOR)

VT

NHẢY DỌC (VERTICAL TABULATION)

GS

NGĂN CÁCH NHÓM (GROUP SEPERATOR)

FF

SANG TRANG (FORM FEED)

RS

NGĂN CÁCH BẢN GHI (RECORD SEPERATOR)

CR

VỀ ĐẦU DÒNG (CARRIAGE RETURN)

US

NGĂN CÁCH ĐƠN VỊ (UNIT SEPERATTOR)

SO

THAY ĐỔI NHÓM KÝ TỰ (SHIFT OUT)

DEL

XÓA (DELETE)

SI

TRỞ VỀ NHÓM KÝ TỰ GỐC (SHIP IN)

 

 

6 Bảng mã và tên ký tự

6.1 Bảng mã 8-bit gồm 256 ô xếp theo 16 hàng và 16 cột. Các hàng (hoặc cột) này được đánh số thứ tự từ 0 đến F theo cơ số 16.

6.2 Vị trí mỗi ô trong bảng mã được xác định bởi tọa độ (x, y), trong đó x chỉ số cột và y chỉ số hàng tương ứng của ô đó.

6.3 Tọa độ (x, y) của mỗi ô cho biết mã của ký tự đặt trong ô đó ở dạng cơ số 16. Mỗi ký tự trong ô còn được xác định bằng một mã thập phân gồm ba chữ số ghi trong ô đó.

6.4 Tất cả các ký tự được quy định trong điều 5 đều có mã tương ứng trong Bảng 9.

6.5 Tên đầy đủ của các ký tự và mã tương ứng của chúng được trình bày trong Bảng 10.

Bảng 9 - Bảng mã kí tự

Bảng 10 - Bảng tên các kí tự

Kí tự

Tên của kí tự

Kí tự

Tên của kí tự

00

NUL

Kí tự rỗng (null)

18

CAN

Hủy (cancel)

01

Ú

Chữ U hoa với dấu sắc

19

EM

Cuối tệp (end of medium)

02

Chữ U hoa với dấu nặng

1A

SUB

Thay thế (substitute)

03

ETX

Cuối văn bản (end of text)

1B

ESC

Thoát (escape)

04

Chữ Ư hoa với dấu huyền

1C

FS

Ngăn cách tệp (file separator)

05

Chữ Ư hoa với dấu hỏi

1D

GS

Ngăn cách nhóm (group separator)

06

Chữ Ư hoa với dấu ngã

1E

RS

Ngăn cách bản ghi (record separator)

07

BEL

Rung chuông (bell)

1F

US

Ngăn cách đơn vị (unit separator)

08

BS

Lùi kí tự (back space)

20

SP

Dấu cách (SPACE)

09

HT

Nhảy ngang (horizontal tabulation)

21

Dấu chấm than

0A

LF

Xuống dòng (line feed)

22

Dấu nháy kép

0B

VT

Nhảy dọc (vertical tabulation)

23

#

Dấu rào

0C

FF

Sang trang (form feed)

24

$

Dấu đô la

0D

CR

Về đầu dòng (carriage return)

25

%

Dấu phần trăm

0E

SO

Thay đổi nhóm kí tự (shift out)

26

&

Dấu và

0F

SI

Trở về nhóm kí tự gốc (shift in)

27

Dấu nháy đơn

10

DLE

Thoát kết nối dữ liệu (data link escape)

28

(

Dấu mở ngoặc đơn

11

Chữ Ư hoa với dấu sắc

29

)

Dấu đóng ngoặc đơn

12

Chữ Ư hoa với dấu nặng

2A

*

Dấu sao

13

Chữ Y hoa với dấu huyền

2B

+

Dấu cộng

14

Chữ Y hoa với dấu hỏi

2C

,

Dấu phảy

15

Chữ Y hoa với dấu ngã

2D

-

Dấu trừ

16

Ý

Chữ Y hoa với dấu sắc

2E

.

Dấu chấm

17

Chữ Y hoa với dấu nặng

2F

/

Dấu chia

Bảng 10 (tiếp theo)

Kí tự

Tên của kí tự

Kí tự

Tên của kí tự

30

0

Chữ số không

4A

J

Chữ J hoa

31

1

Chữ số một

4B

K

Chữ K hoa

32

2

Chữ số hai

4C

L

Chữ L hoa

33

3

Chữ số ba

4D

M

Chữ M hoa

34

4

Chữ số bốn

4E

N

Chữ N hoa

35

5

Chữ số năm

4F

O

Chữ O hoa

36

6

Chữ số sáu

50

P

Chữ P hoa

37

7

Chữ số bảy

51

Q

Chữ Q hoa

38

8

Chữ số tám

52

R

Chữ R hoa

39

9

Chữ số chín

53

S

Chữ S hoa

3A

:

Dấu hai chấm

54

T

Chữ T hoa

3B

;

Dấu chấm phẩy

55

U

Chữ U hoa

3C

<>

Dấu nhỏ hơn

56

V

Chữ V hoa

3D

=

Dấu bằng

57

W

Chữ W hoa

3E

Dấu lớn hơn

58

X

Chữ X hoa

3F

?

Dấu chấm hỏi

59

Y

Chữ Y hoa

40

@

Dấu a vòng

5A

Z

Chữ Z hoa

41

A

Chữ A hoa

5B

[

Dấu mở ngoặc vuông

42

B

Chữ B hoa

5C

\

Dấu sổ ngược

43

C

Chữ C hoa

5D

]

Dấu đóng ngoặc vuông

44

D

Chữ D hoa

5E

^

Dấu mũ

45

E

Chữ E hoa

5F

_

Dấu gạch dưới

46

F

Chữ F hoa

60

`

Dấu trọng âm

47

G

Chữ G hoa

61

a

Chữ a thường

48

H

Chữ H hoa

62

b

Chữ b thường

49

I

Chữ I hoa

63

c

Chữ c thường

Bảng 10 (tiếp theo)

Kí tự

Tên của kí tự

Kí tự

Tên của kí tự

64

d

Chữ d thường

7C

|

Dấu sổ đứng

65

e

Chữ e thường

7D

}

Dấu đóng ngoặc nhọn

66

f

Chữ f thường

7E

~

Dấu sóng

67

g

Chữ g thường

7F

DEL

Dấu xóa (DELETE)

68

h

Chữ h thường

80

À

Chữ A hoa với dấu huyền

69

i

Chữ i thường

81

Chữ A hoa với dấu hỏi

6A

j

Chữ j thường

82

Ã

Chữ A hoa với dấu ngã

6B

k

Chữ k thường

83

Á

Chữ A hoa với dấu sắc

6C

i

Chữ i thường

84

Chữ A hoa với dấu nặng

6D

m

Chữ m thường

85

Chữ Ă hoa với dấu nặng

6E

n

Chữ n thường

86

Chữ Â hoa với dấu nặng

6F

o

Chữ o thường

87

È

Chữ E hoa với dấu huyền

70

p

Chữ p thường

88

Chữ E hoa với dấu hỏi

71

q

Chữ q thường

89

Chữ E hoa với dấu ngã

72

r

Chữ r thường

8A

É

Chữ E hoa với dấu sắc

73

s

Chữ s thường

8B

Chữ E hoa với dấu nặng

74

t

Chữ t thường

8C

Chữ Ê hoa với dấu nặng

75

u

Chữ u thường

8D

Ì

Chữ I hoa với dấu huyền

76

v

Chữ v thường

8E

Chữ I hoa với dấu hỏi

77

w

Chữ w thường

8F

Ĩ

Chữ I hoa với dấu ngã

78

x

Chữ x thường

90

Í

Chữ I hoa với dấu sắc

79

y

Chữ y thường

91

Chữ I hoa với dấu nặng

7A

z

Chữ z thường

92

Ò

Chữ O hoa với dấu huyền

7B

{

Dấu mở ngoặc nhọn

93

Chữ O hoa với dấu hỏi

Bảng 10 (tiếp theo)

Kí tự

Tên của kí tự

Kí tự

Tên của kí tự

94

Õ

Chữ O hoa với dấu ngã

AC

ơ

Chữ ơ thường

95

Ó

Chữ O hoa với dấu sắc

AD

ư

Chữ ư thường

96

Chữ O hoa với dấu nặng

AE

đ

Chữ đ thường

97

Chữ Ô hoa với dấu nặng

AF

Chữ Ă hoa với dấu huyền

98

Chữ Ơ hoa với dấu huyền

B0

Dấu huyền

99

Chữ Ơ hoa với dấu hỏi

B1

Dấu hỏi

9A

Chữ Ơ hoa với dấu ngã

B2

Dấu ngã

9B

Chữ Ơ hoa với dấu sắc

B3

Dấu sắc

9C

Chữ Ơ hoa với dấu nặng

B4

Dấu nặng

9D

Ù

Chữ U hoa với dấu huyền

B5

à

Chữ a thường với dấu huyền

9E

Chữ U hoa với dấu hỏi

B6

Chữ a thường với dấu hỏi

9F

Ũ

Chữ U hoa với dấu ngã

B7

ã

Chữ a thường với dấu ngã

A0

NBSP

Dấu không dãn cách (NO - BREAK SPACE)

B8

á

Chữ a thường với dấu sắc

A1

Ă

Chữ Ă hoa

B9

Chữ a thường với dấu nặng

A2

Â

Chữ Â hoa

BA

Chữ Ă hoa với dấu hỏi

A3

Ê

Chữ Ê hoa

BB

Chữ ă thường với dấu huyền

A4

Ô

Chữ Ô hoa

BC

Chữ ă thường với dấu hỏi

A5

Ơ

Chữ Ơ hoa

BD

Chữ ă thường với dấu ngã

A6

Ư

Chữ Ư hoa

BE

Chữ ă thường với dấu sắc

A7

Đ

Chữ Đ hoa

BF

Chữ Ă hoa với dấu ngã

A8

ă

Chữ ă thường

C0

Chữ Ă hoa với dấu sắc

A9

â

Chữ â thường

C1

Chữ Â hoa với dấu huyền

AA

ê

Chữ ê thường

C2

Chữ Â hoa với dấu hỏi

AB

ô

Chữ ô thường

C3

Chữ Â hoa với dấu ngã

Bảng 10 (tiếp theo)

Kí tự

Tên của kí tự

Kí tự

Tên của kí tự

C4

Chữ Â hoa với dấu sắc

DD

í

Chữ i thường với dấu sắc

C5

Chữ Ê hoa với dấu huyền

DE

Chữ i thường với dấu nặng

C6

Chữ ă thường với dấu nặng

DF

ò

Chữ o thường với dấu huyền

C7

Chữ â thường với dấu huyền

E0

Chữ Ô hoa với dấu hỏi

C8

Chữ â thường với dấu hỏi

E1

Chữ o thường với dấu hỏi

C9

Chữ â thường với dấu ngã

E2

õ

Chữ o thường với dấu ngã

CA

Chữ â thường với dấu sắc

E3

ó

Chữ o thường với dấu sắc

CB

Chữ â thường với dấu nặng

E4

Chữ o thường với dấu nặng

CC

è

Chữ e thường với dấu huyền

E5

Chữ ô thường với dấu huyền

CD

Chữ Ê hoa với dấu hỏi

E6

Chữ ô thường với dấu hỏi

CE

Chữ e thường với dấu hỏi

E7

Chữ ô thường với dấu ngã

CF

Chữ e thường với dấu ngã

E8

Chữ ô thường với dấu sắc

D0

é

Chữ e thường với dấu sắc

E9

Chữ ô thường với dấu nặng

D1

Chữ e thường với dấu nặng

EA

Chữ ơ thường với dấu huyền

D2

Chữ ê thường với dấu huyền

EB

Chữ ơ thường với dấu hỏi

D3

Chữ ê thường với dấu hỏi

EC

Chữ ơ thường với dấu ngã

D4

Chữ ê thường với dấu ngã

ED

Chữ ơ thường với dấu sắc

D5

ế

Chữ ê thường với dấu sắc

EE

Chữ ơ thường với dấu nặng

D6

Chữ ê thường với dấu nặng

EF

ù

Chữ u thường với dấu huyền

D7

ì

Chữ i thường với dấu huyền

F0

Chữ Ô hoa với dấu ngã

D8

Chữ i thường với dấu hỏi

F1

Chữ u thường với dấu hỏi

D9

Chữ Ê hoa với dấu ngã

F2

ũ

Chữ u thường với dấu ngã

DA

Chữ Ê hoa với dấu sắc

F3

ú

Chữ u thường với dấu sắc

DB

Chữ Ô hoa với dấu huyền

F4

Chữ u thường với dấu nặng

DC

ĩ

Chữ i thường với dấu ngã

F5

Chữ ư thường với dấu huyền

 

Kí tự

Tên của kí tự

Kí tự

Tên của kí tự

F6

Chữ ư thường với dấu hỏi

FB

Chữ y thường với dấu hỏi

F7

Chữ ư thường với dấu ngã

FC

Chữ y thường với dấu ngã

F8

Chữ ư thường với dấu sắc

FD

ý

Chữ y thường với dấu sắc

F9

Chữ ư thường với dấu nặng

FE

Chữ y thường với dấu nặng

FA

Chữ y thường với dấu huyền

FF

Chữ Ô hoa với dấu sắc

 

Đã xem:

Đánh giá:  
 

Thuộc tính TCVN TCVN5712:1999

Loại văn bảnTiêu chuẩn Việt Nam
Số hiệuTCVN5712:1999
Cơ quan ban hành
Người ký
Ngày ban hành...
Ngày hiệu lực...
Ngày công báo...
Số công báoCòn hiệu lực
Lĩnh vựcĐiện - điện tử
Tình trạng hiệu lựcKhông xác định
Cập nhật4 năm trước
Yêu cầu cập nhật văn bản này

Lược đồ Tiêu chuẩn quốc gia TCVN 5712:1999 về Công nghệ thông tin - Bộ mã ký tự tiếng Việt 8-bit


Văn bản bị sửa đổi, bổ sung

    Văn bản liên quan ngôn ngữ

      Văn bản sửa đổi, bổ sung

        Văn bản bị đính chính

          Văn bản được hướng dẫn

            Văn bản đính chính

              Văn bản hiện thời

              Tiêu chuẩn quốc gia TCVN 5712:1999 về Công nghệ thông tin - Bộ mã ký tự tiếng Việt 8-bit
              Loại văn bảnTiêu chuẩn Việt Nam
              Số hiệuTCVN5712:1999
              Cơ quan ban hànhBộ Khoa học Công nghệ và Môi trường
              Người ký***
              Ngày ban hành...
              Ngày hiệu lực...
              Ngày công báo...
              Số công báoCòn hiệu lực
              Lĩnh vựcĐiện - điện tử
              Tình trạng hiệu lựcKhông xác định
              Cập nhật4 năm trước

              Văn bản thay thế

                Văn bản được dẫn chiếu

                  Văn bản hướng dẫn

                    Văn bản được hợp nhất

                      Văn bản được căn cứ

                        Văn bản hợp nhất

                          Văn bản gốc Tiêu chuẩn quốc gia TCVN 5712:1999 về Công nghệ thông tin - Bộ mã ký tự tiếng Việt 8-bit

                          Lịch sử hiệu lực Tiêu chuẩn quốc gia TCVN 5712:1999 về Công nghệ thông tin - Bộ mã ký tự tiếng Việt 8-bit