计算机最基础的编码
在计算机中对汉字进行存储、处理和传输的汉字码是什么码?
在计算机中对汉字进行存储、处理和传输的汉字码是什么码?
在计算机中对汉字进行存储、处理和传输的汉字码是机内码。 机内码是在计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。
输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。 汉字的机内码采用十六进制进行表示,且第1位和第三位必定大于8。因为汉字机内码的基础是汉字国际码,转换方式是:汉字机内码汉字国际码 8080H。
计算机中数的表示一般采用什么编码方法?
计算机中数的表示一般采用二进制编码方法,采用0和1来表示,8位的二进制数是1bit。
二进制是由1和0两个数字组成的。它可以表示两种状态,即开和关。这种状态可以由电位的高低来实现。计算机是由各种电子元器件组成的。其中有一种重要的元件就是半导体即我们熟悉的二极管、三极管等。半导体可以通过它的开关状态来传递和处理信息。如果用其它的进制必将使计算机的制造和信息的处理更为复杂。所以输入电脑的任何信息最终都要转化为二进制。目前通用的是ASCII码。最基本的单位为bit。
在计算机内字符,汉字是如何编码的?
在电脑内,汉字的编码分为四种:输入码、 国标码、内码和字型码。
输入码:包括拼音编码和字型编码。微软拼音ABC就是拼音编码,五笔字型输入法就是字型编码。
国标码:又称为汉字交换码,在计算机之间交换信息用。用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为2的14次幂,就是16384个。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。例如“中”字的国标码为8680(十进制)或7468(十六进制)。
内码:汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128(十进制)或80(十六进制)。例如,“中”字的内码以十六进制表示时应为F4E8。这样做的目的是使汉字内码区别于西文的ASCII,因为每个西文字母的ASCII的高位均为0,而汉字内码的每个字节的高位均为1。
字型码:表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式。通常用点阵、矢量函数等表示。用点阵表示时,字形码指的就是这个汉字字形点阵的代码。根据输出汉字的要求不同,点阵的多少也不同。简易型汉字为16′16点阵、提高型汉字为24′24点阵、48′48点阵等。如果是24′24点阵,每行24个点就是24个二进制位,存储一行代码需要3个字节。那么,24行共占用3′2472个字节。计算公式:每行点数/8′行数。依此,对于48′48的点阵,一个汉字字形需要占用的存储空间为48/8′486′48288个字节。