2024年4月8日发(作者:一般台式电脑多少钱一台)
汉字信息在计算机中的处理
随着计算机技术的发展,计算机具有了中文信息处理的能力,那么汉字信息在计算机
中是如何被存储、输入输出和显示的呢?
一、汉字信息在计算机中的处理与存储
计算机对每一个字符进行编码形成其对应的唯一一个内码就是汉字的存储,然而同一
个字符(例如“中”字)不同编码对应的内码不一样。计算机中汉字编码一般采用两个高
位(左边第一位)为1 的ASCⅡ码表示一个汉字,即用两个字节表示一个汉字。汉字在
计算机内的编码很复杂,涉及汉字的各种代码,如汉字输入码,汉字机内码,汉字交换码,
汉字字形码等。
1、汉字输入码
汉字输入码也叫外码,是为了通过键盘字符把汉字输入计算机而设计的一种编码。汉
字的输入码种类繁多,大致有4种类型,即音码、形码、数字码和音形码。
2、汉字机内码
汉字机内码又称内码或汉字存储码。该编码的作用是统一了各种不同的汉字输入码在
计算机内的表示。汉字机内码是计算机内部存储、处理的代码。
3、汉字交换码:汉字交换码主要是用作汉字信息交换的。
4、汉字字形码
汉字字形码是指确定一个汉字字形点阵的代码(汉字字形码)。一般采用点阵字形表
示字符。
目前普遍使用的汉字字型码是用点阵方式表示的,称为“点阵字模码”。所谓“点阵
字模码”,就是将汉字像图像一样置于网状方格上,每格是存储器中的一个位,16×16点
阵是在纵向16点、横向16点的网状方格上写一个汉字,有笔画的格对应1,无笔画的
格对应0。这种用点阵形式存储的汉字字型信息的集合称为汉字字模库,简称汉字字库。
通常汉字显示使用16×16点阵,而汉字打印可选用24×24点阵、32×32点阵、64×64
点阵等。汉字字形点阵中的每个点对应一个二进制位,1字节又等于8个二进制位,所以
16×16点阵字形的字要使用32个字节(16×16÷8字节=32字节)存储,64×64点阵
的字形要使用512个字节。在16×16点阵字库中的每一个汉字以32个字节存放,存储
一、二级汉字及符号共8836个,需要282.5KB磁盘空间。而用户的文档假定有10万个
汉字,却只需要200KB的磁盘空间,这是因为用户文档中存储的只是每个汉字(符号)
在汉字库中的地址(内码)。
建立汉字字库是处理汉字的主要思想之一,在显示器、打印机上输出的汉字的字形放
在计算机的外存储器中。
同时 ,汉字编码是有国家标准的,叫做“中华人民共和国国家标准信息交换汉字编
码”,简称 “国标码”,用“GB2312-80”表示。GB2312-80包括了汉字字符基本集,
共收录汉字、图形符号等共7445个,依据其位置,分为94个区,每区共94位。“区”
的序号由01至94,“位”的序号也是由01至94,“区”和“位”构成一个汉字的四位
数字编码,因此四位阿拉伯数字就可以唯一地确定一个汉字或一个字符。
发布者:admin,转转请注明出处:http://www.yc00.com/num/1712583622a2084111.html
评论列表(0条)