Câu hỏi:
Với 134 kí tự riêng phát sinh so với bảng chữ cái tiếng Anh, hoàn toàn có khả năng sắp xếp trong bảng chữ 8 bit với 256 kí tự. Theo em, tại sao Việt Nam vẫn cần sử dụng bảng mã Unicode?
Lời giải:
Mặc dù có thể xếp toàn bộ chữ Việt trong bảng 256 vị trí nhưng vẫn cần sử dụng Unicode vì các lí do sau:
Phải lấy thêm chỗ ở vùng mã điều khiển, có thể gây ra các bất cập như ví dụ Câu 3.5.
Thống nhất kí tự Việt trong tổng thể các kí tự chung của toàn thế giới, đặc biệt chúng ta luôn có nhu cầu sử dụng nhiều ngôn ngữ trong cùng một ứng dụng.
* Unicode là gì?
Unicode là một tiêu chuẩn mã hóa ký tự phổ biến. Nó xác định cách các ký tự riêng lẻ được biểu diễn trong các file văn bản, trang web và các loại tài liệu khác. Unicode (hay gọi là mã thống nhất; mã đơn nhất) là bộ mã chuẩn quốc tế được thiết kế để dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ khác nhau trên thế giới, kể cả các ngôn ngữ sử dụng ký tự tượng hình phức tạp như chữ Hán của tiếng Trung Quốc, tiếng Nhật, chữ Nôm của tiếng Việt, v.v. Vì những điểm ưu việt đó, Unicode đã và đang từng bước thay thế các bộ mã truyền thống, kể cả bộ mã tiêu chuẩn ISO 8859. Unicode đang được sử dụng trên rất nhiều phần mềm cũng như các trình ứng dụng, chẳng hạn Windows (theo wikipedia).
Bảng mã Unicode (hay còn gọi là bảng mã thống nhất , mã đơn nhất) : là bộ mã chuẩn quốc tế được thiết kế để dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ khác nhau trên thế giới, kể cả các ngôn ngữ sử dụng ký tự tượng hình phức tạp như tiếng Trung Quốc, tiếng Việt Nam , tiếng Thái Lan … Vì những điểm ưu việt đó, Unicode đã và đang từng bước thay thế các bộ mã truyền thống, kể cả bộ mã tiêu chuẩn ISO 8859 và hiện đang được hỗ trợ trên rất nhiều phần mềm cũng như các trình ứng dụng, chẳng hạn Windows.
* Đặc điểm của Unicode
Một tiêu chuẩn trên toàn quốc tế được tăng trưởng để giúp khắc phục những hạn chế của ASCII đã được phát hành lần tiên phong như một tiêu chuẩn vào tháng 10 năm 1991 .
Không giống như ASCII, được phong cách thiết kế để chỉ đại diện thay mặt cho những ký tự tiếng Anh cơ bản, Unicode được phong cách thiết kế để tương hỗ những ký tự từ tổng thể những ngôn từ trên quốc tế. Bộ ký tự ASCII tiêu chuẩn chỉ tương hỗ 128 ký tự, trong khi Unicode hoàn toàn có thể tương hỗ khoảng chừng một triệu ký tự. Trong khi ASCII chỉ sử dụng một byte để đại diện thay mặt cho mỗi ký tự, Unicode tương hỗ tối đa 4 byte cho mỗi ký tự .
>>> Xem thêm: Lí do ra đời bảng mã chuẩn quốc tế Unicode là gì?