utf-8编码是什么意思?utf-8编码基本特征
发布日期: 2022-02-14 16:25:49 来源: php中文网
UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。
基本特征
UCS字符U+0000到U+007F(ASCII)被编码为字节0×00到0x7F(ASCIⅡ兼容)。这意味着只包含7位ASCIl字符的文件在ASCIⅡ和UTF-8两种编码方式下是一样的。
所有大于0x007F的UCS字符被编码为一个有多个字节的串,每个字节都有标记位集。因此,ASCIl字节(0x00-0x7F)不可能作为任何其他字符的一部分。表示非ASCIl字符的多字节串的第一个字节总是在0xC0到0XFD的范围里,并指出这个字符包含多少个字节。多字节串的其余字节都在0x80到0xBF范围里。这使得重新同步非常容易,并使编码无国界,且很少受丢失字节的影响。
UTF-8编码字符理论上可以最多到6个字节长,然而16位BMP字符最多只用到3字节长,Bigendian UCS-4字节串的排列顺序是预定的,字节0xFE和OxFF在UTF-8编码中从未用到。
推荐内容
- utf-8编码是什么意思?utf-8编码基本特征 a>
- “关灯吃面”商标被注册 可以蹭网络热词的热度吗? a>
- 新兴铸管:拟回购注销171.22万股限制性股票 a>
- 离家不离心,网络拜年成新风尚 a>
- 科力尔:惠州子公司7948万元竞得土地使用权 将用于生产研发总部项目建设 a>
- 德庆贡柑搭上RCEP“顺风车” a>
- 绿的谐波(688017.SH)股东孙雪珍累计减持1.11%股份 a>
- 谱尼测试:向特定对象发行股票申请获得中国证监会同意注册批复 a>
- 国家知识产权局:对冬奥知识产权违法行为“零容忍” a>
- 宏华数科(688789.SH)股东新湖智脑质押230万股 a>
- 捷成股份:下属公司与腾讯签订18亿元影视节目授权合同 有助于提升公司盈利能力 a>
- 涪陵榨菜集团发布含奥运内容宣传图片,被罚15万 a>
- 阿拉丁(688179.SH)2021年度归母净利同比增长13.75%至8466.39万元 a>
- 男子专偷五菱面包车内这种“贵金属”,获利近七万被刑拘 a>
- 正邦科技:控股股东及其一致行动人所持合计2873.67万股质押 占公司总股本比例0.91% a>
- 东方财富跌13.36% 西部证券在其高点下跌后率先唱多 a>
- 奥精医疗(688613.SH)聘任仇志烨为董事会秘书 a>
- 南岭民爆:现有普通雷管产能15000万发/年、电子雷管产能2800万发/年 a>
- “果链”立讯精密豪掷100亿元 携手奇瑞硬闯造车领域 a>
- 迈威生物(688062.SH):注射用8MW2311获得药物临床试验申请受理通知书 a>