• 尽量不要使用文本模式


     当我们使用C的库函数读取文件时,会有文本模式和二进制模式两种读取模式。一些传输数据的协议比如TFTP、FTP也有文本和二进制模式的区分。既可以使用文本模式也可以使用二进制模式时,尽量使用二进制模式。

       

        文本模式和二进制模式读取文件时,差别主要是在回车换行的处理上,不同系统对回车换行的处理不一致。

        CR:  Carriage Return,  0X0D,   “/r”

    LF:  Line Feed,         0X0A,   “/n”

    Dos和windows采用回车+换行(CR+LG)表示下一行

    UNIX采用换行符(LF)表示下一行

    MAC机采用回车符(CR)表示下一行

     

        Unix、Linux的C的库函数处理文件时不区分文本和二进制,但是Windows系统下C的库函数读取和写入文本文件时会自动处理回车换行。(测试通过)Windows下以文本模式读取文件时,读取到0D0A时会跳过0D,比如文件内容是0D 0D 0A 0A,则读取到的是0D 0A 0A;

    以文本模式写文件时,会自动在每个0A前面加上0D,如果读取到的是 0D 0A 0A,

    则写入到文件中的是 0D 0D 0A 0D 0A。我们可以看出文件内容发生了变化,与文件原来的内容已经不同了。

     

    具体Windows下C运行库如何处理可以参考VC2005附带的C运行库的源代码。

    文本模式下读取文件时处理回车换行的代码在/VC/crt/src/read.c 的265~356行。

    Line:291 /* *p is CR, so must check next char for LF */

     if (p < (char *)buf + bytes_read - 1) {

           if (*(p+1) == LF) {

                 p += 2;

                 *q++ = LF;  /* convert CR-LF to LF */

            }

            else

                *q++ = *p++;    /* store char normally */

        }

    文本模式下写文件时处理回车换行的代码在/VC/crt/src/write.c 的268~308行。

    Line:282 /* fill the lf buf, except maybe last char */

    while ( q - lfbuf < sizeof(lfbuf) - 1 &&

                  (unsigned)(p - (char *)buf) < cnt ) {

                ch = *p++;

                if ( ch == LF ) {

                      ++lfcount;

                      *q++ = CR;

                }

                *q++ = ch;

           }

       

       Windows下文本模式打开文件时,要慎用ftell()函数。由于ftell()函数实现中对LF进行了特殊处理,导致ftell()返回的结果可能不是我们需要。

    使用二进制模式可以保证文件的内容没有被修改,在需要进行特殊处理的地方我们自己可以进行特殊的处理,而类库自作聪明的处理很多时候反而弄巧成拙。

     

    转自:http://blog.csdn.net/someonea/article/details/2160378

  • 相关阅读:
    一文让你彻底了解卷积神经网络
    处理 3d 视频的简单理论基础
    ffmpeg 学习:000-概述和库的组成
    Linux 补丁 的简单使用: 制作补丁,打补丁,撤销补丁
    “反向传播算法”过程及公式推导
    机器学习:梯度下降算法原理讲解
    神经网络浅讲:从神经元到深度学习
    Git详解之安装
    Git详解之Git起步
    Git详解之协议/速度/安全
  • 原文地址:https://www.cnblogs.com/hnrainll/p/2782642.html
Copyright © 2020-2023  润新知