• 非数值数据的编码表示


    2.5非数值数据的编码表示

    2.5.1西文字符

    ASCLL码(美国标准信息交换码)

    2.5.2汉字字符

    汉字的输入码(外码)
    每个汉字都用一个或者几个键来表示,这种对每个汉字用相应的按键进行的编码表示就称为汉字的输入码,又称外码。
    字符集与汉字内码
    汉字被输入到计算机内部后,就按照一种称为内码的编码形式在系统中进行存储、查找、传送等处理。
    对于汉字内码的选择:
    1.不能有二义性,即不能和ascll码有相同的编码。
    2.要与汉字在字库中的位置有关系,以便于汉字的处理、查找。
    3.编码应尽量短。
    国标码(国际交换码)共6763个常用汉字。

    2.6数据的宽度和存储

    1.二进制数据的每一位是组成二进制信息的最小单位,称为一个比特(bit),也称为位元,简称位。比特是计算机中处理、存储、传输信息的最小单位。
    每个西文字符需要8个比特表示,每个汉字需要用16个比特表示。
    2.二进制信息的计量单位是字节(byte),也成位组。一个字节==8个比特。
    3.字长通常是指CPU内部用于整数运算的数据通路的宽度。

    2.7数据校检码

    1.方法大都采用冗余校验的思想,即除原数据信息外,还增加若干位编码,这些新增的代码称为校验位。
    2.由若干位代码组成的一个字叫码字,将两个码字逐位比较,具有不同代码的位的个数叫做这两个码字间的距离,也称为海明距离。一种码制可能有若干个码字,各码字间的最小距离称为码距。

    校验码的方式

    1.奇偶校验码
    2.海明校验码
    3.循环冗余码

  • 相关阅读:
    XGBoost原理解析
    变分贝叶斯学习(variational bayesian learning)及重参数技巧(reparameterization trick)
    Tensorflow Probability Distributions 简介
    树形dp--hdu 1520 anniversary party
    线段树II--区间修改
    leetcode---different ways to add parentheses
    线段树
    实现最大堆
    编写支持对齐分配的malloc和free函数
    指针和引用的区别,指针和数组的区别
  • 原文地址:https://www.cnblogs.com/coolyingying/p/13707325.html
Copyright © 2020-2023  润新知