• 3.3.1 文本文件惯例


        由于 UNIX 鼓励使用文本型数据,因此系统上最常见的数据存储类型就是文本了,在文本文件下,一行表示一条记录。这里要介绍的是在一行内用来分隔字段的两种惯例。首先是直接使用空白(whitespace),也就是用空格键(space)或制表(tab)键:
     
        #字符起始的行表示注释,可忽略(这是一般的习惯,注释行的功能相当好用,不过软件必须可忽略这样的行才行)。各字段都以任意长度的空格键(space)或制表(tab)键字符隔开。第二种管理是使用特定的定界符来分隔字段,例如冒号。
     
        两种惯例都有其优缺点。使用空白作为分隔时,字段内容就最好不要有空白(若你使用指标字符(Tab)作分隔,字段里有空格时不会有问题的,但这么做视觉上会混淆,因为你在看文件时,很难马上分辨出它们的不同)。反过来说,若你使用显式的定界符,那么数据内容里的可能性降低到最低或不存在。
     
        注意:这两种方式最明显的不同,便是在处理多个连续重复的定界符之时。使用空白(whitespace)分隔时,通常多个连续出现的空格或制表字符都将看作一个定界符。然而,若使用的是特殊字符分隔,则每个定界符都隔开一个字段,例如,在myapp.data的第二个版本里使用的两个冒号字符("::")则会分隔出一个空的字段。
     
        以定界符分隔字段最好的例子就是 /etc/passwd 了,在这个文件里,一行表示系统里的一个用户,每个字段都以冒号隔开。在系统管理工作中,很多时候都是在处理这个文件。
  • 相关阅读:
    记第一场cf比赛(Codeforces915)
    Uva11468:Substring
    Uva11732:"strcmp()" Anyone?
    Uva1014:Remember the Word
    洛谷P2502:[HAOI2006]旅行
    bzoj3677: [Apio2014]连珠线
    bzoj4906: [BeiJing2017]喷式水战改
    海上孤独的帆
    Treap基本用法总结
    noip2017考前基础复习——数论数学
  • 原文地址:https://www.cnblogs.com/avention/p/10307369.html
Copyright © 2020-2023  润新知