UTF-16/UCS-2
หน้าตา
(เปลี่ยนทางจาก UCS-2)
บทความนี้มีชื่อเป็นภาษาอังกฤษ เนื่องจากยังไม่มีชื่อภาษาไทยที่กระชับ เหมาะสม, ไม่ปรากฏคำอ่านที่แน่ชัด หรือไม่ปรากฏคำแปลที่ใช้ในทางวิชาการ |
16 bit Unicode Transformation Format (UTF-16) เป็นการเข้ารหัสตัวอักษรสำหรับยูนิโคดในคอมพิวเตอร์ ซึ่งสามารถเข้ารหัสตัวอักษรในยูนิโคดได้ทั้งหมด โดยปกติแล้วแล้วหนึ่งตัวอักษรมีขนาด 16 บิตหรือ 2 ไบต์ ขึ้นอยู่กับวิธีการเข้ารหัสของเครื่อง
ตัวอย่าง
[แก้]รหัส | ตัวอักษร | ค่ารหัส UTF-16 | แบบแสดง* |
---|---|---|---|
122 (hex 7A) | Z ตัวเล็ก (อักษรลาติน) | 007A | z |
27700 (hex 6C34) | น้ำ (ภาษาจีน) | 6C34 | 水 |
119070 (hex 1D11E) | musical G clef | D834 DD1E | 𝄞 |
"水z𝄞" (น้ำ, z, G clef), ในการเข้ารหัสแบบ UTF-16 | ||
---|---|---|
แบบการเข้ารหัส | การเรียงลำดับไบต์ (byte order) | ลำดับไบต์ (byte sequence) |
UTF-16LE | little-endian | 34 6C, 7A 00, 34 D8 1E DD |
UTF-16BE | big-endian | 6C 34, 00 7A, D8 34 DD 1E |
UTF-16 | little-endian, with BOM | FF FE, 34 6C, 7A 00, 34 D8 1E DD |
UTF-16 | big-endian, with BOM | FE FF, 6C 34, 00 7A, D8 34 DD 1E |
แบบแสดงที่ท่านเห็นอาจไม่ถูกต้อง ขึ้นอยู่กับฟอนต์และซอฟต์แวร์ที่ท่านใช้
อ้างอิง
[แก้]ดูเพิ่ม
[แก้]แหล่งข้อมูลอื่น
[แก้]- บันทึกทางเทคนิค Unicode #12: UTF-16 for Processing (อังกฤษ)
- ติวในสิบนาที แนะนำ UTF-16 เก็บถาวร 2006-08-20 ที่ เวย์แบ็กแมชชีน (อังกฤษ)
- ดัชนีรายชื่อตัวอักษร Unicode (อังกฤษ)