首页 > 开发技术 > Unicode编码在线转换工具

Unicode编码在线转换工具

2013年12月22日 Terence 2,380 次阅读 发表评论 阅读评论

什么是Unicode编码

      Unicode是目前用来解决ASCII码256个字符限制问题的一种比较流行的解决方案。大家知道,ASCII字符集只有256个字符,用0-255之间的数字来表示。包括大小写字母、数字以及少数特殊字符;如标点符号、货币符号等。对于大多数拉丁语言来说,这些字符已经够用。但是,许多亚洲和东方语言所用的字符远远不止256个字符。人们为了突破ASCII码字符数的限制,试图用一种简单的方法来针对超过256个字符的语言编写计算机程序。于是 Unicode应运而生。Unicode通过用双字节来表示一个字符,从而在更大范围内将数字代码映射到多种语言的字符集。 Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode标准已经被这些工业界的领导者们所采用,最新的标准都需要Unicode,例如XML,Java,ECMAScript(JavaScript),LDAP,CORBA 3.0,WML等等,并且,Unicode是实现ISO/IEC 10646的正规方式。许多操作系统,所有最新的浏览器和许多其他产品都支持它。Unicode标准的出现和支持它工具的存在,是近来全球软件技术最重要的发展趋势。

为什么使用Unicode

      基本上,计算机只是处理数字。它们指定一个数字来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符。例如单单欧洲就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。这些编码系统也会互相冲突。也就是说两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机都需要支持许多不同的编码,但是不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。 比如简体中文(GB)、繁体中文(BIG5)、日文中,“赵”都是一个字,但是编码不同。在不同的编码下,BIG5的“赵”是0xBBAF,而0xBBAF在GB里面就被显示为“化”,这就是乱码。而Unicode采用统一的编码,“赵”只有一个,不必管他在哪种文字里。

Unicode编码在线转换工具

      由于网页中的字符为了避免乱码,故会把非ASCII字符转换为Unicode格式,例如“赵”的Unicode格式为\u8d75,但这样做的话就不会非常的不直观。所以下面提供了一个Unicode和原始文字互转的工具。

 





 » 转载请注明来源:Terence的窝 » 《Unicode编码在线转换工具》
分类: 开发技术 标签: ,
  1. 本文目前尚无任何评论.