• 【转载】scanf,sscanf高级用法


    最近遇到了解析配置的问题,用正规表达式感觉大题小做,使用sscanf因只会用基本用法,感觉功能不够,上网搜了下,解析起来不费吹灰之力,代码也很简洁。

    原帖出处不详,网上到处是,我做了点修改


    名称:
    sscanf() - 从一个字符串中读进与指定格式相符的数据.
     
    函数原型:
    Int  sscanf( string str, string fmt, mixed var1, mixed var2 ... );
    int  scanf( const char *format [,argument]... );
     
    说明:
    sscanf与scanf类似,都是用于输入的,只是后者以屏幕(stdin)为输入源,前者以固定字符串为输入源。
    其中的format可以是一个或多个{%[*] [width] [size]type | ' ' | '\t' | '\n' | 非%符号}
     
    注:
    1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)
     
    2、{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。
     
    3、width表示读取宽度。
     
    4、参数的size: 常用的有hh表示单字节size,h表示2字节 size,其他详见man sscanf或msdn
     
    5、type :这就很多了,就是%s,%d之类。
     
    控制字符 说明
    %c  一个单一的字符
    %d  一个十进制整数
    %i  一个整数
    %e, %f, %g 一个浮点数
    %o  一个八进制数
    %s  一个字符串
    %x  一个十六进制数
    %p  一个指针
    %n  一个等于读取字符数量的整数
    %u  一个无符号整数
    %[]  一个字符集
    %%  一个精度符


    6、特别的:%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉,不会向目标参数中写入值
     
    支持集合操作:

         %[a-z] 表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)

         %[aB'] 匹配a、B、'中一员,贪婪性

         %[^a] 匹配非a的任意字符,贪婪性

    还是用例子说话:

    #include <stdio.h>

    int main()
    {
     char buf[512] = {0};

    //1. 常见用法。
     sscanf("123456 asdf", "%s", buf);
     printf("%s\n", buf);

     printf("123456 Expect! %%s\n\n");
    //结果为:123456


    //2. 取指定长度的字符串。如在下例中,取最大长度为4字节的字符串。
     sscanf("123456 ", "%4s", buf);
     printf("%s\n", buf);

      printf("1234 Expect! %%4s\n\n");
    //结果为:1234


    //3. 取到指定字符为止的字符串。如在下例中,取遇到空格为止字符串。
     sscanf("123456 abcdedf", "%[^ ]", buf);
     printf("%s\n", buf);

     printf("123456 Expect! %%[^ ]\n\n");
    //结果为:123456


    //4.  取仅包含指定字符集的字符串。如在下例中,取仅包含1到9和小写字母的字符串。
     sscanf("123456abcdedfBCDEFxyz", "%[1-9a-z]", buf);
     printf("%s\n", buf);

     printf("123456abcdedf Expect! %%[1-9a-z]\n\n");

    //结果为:123456abcdedf


    //5.  取到指定字符集为止的字符串。如在下例中,取遇到大写字母为止的字符串。
     sscanf("123456 abcdedfBCDEFxyz", "%[^A-Z]", buf);
     printf("%s\n", buf);

      printf("123456 abcdedf Expect! %%[^A-Z]\n\n");
    //结果为:123456 abcdedf


    //6、给定一个字符串iios/12DDWDFF@122,获取 / 和 @ 之间的字符串,先将 "iios/"过滤掉,再将非'@'的一串内容送到buf中
     sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);
     printf("%s\n", buf);

     printf("12DDWDFF Expect! %%*[^/]/%%[^@]\n\n");

    //结果为:12DDWDFF


    //7、给定一个字符串““hello, world”,仅保留world。(注意:“,”之后有一空格)
     sscanf("hello, world",  "%*s%s",  buf);
     printf("%s\n", buf);

     printf("world Expect! %%*s%%s\n\n");

    //结果为:world 

    //8、参数size的控制

     unsigned char m[6] = {0};
     int n = 0;

    // sscanf 返回输入了几个参数
     n = sscanf("010203040506", "%hhx%hhx%hhx%hhx%hhx%hhx", &m[0], &m[1], &m[2], &m[3], &m[4], &m[5]);
     printf("hhx: %d :%02x%02x%02x%02x%02x%02x\n",n, m[0], m[1],m[2],m[3], m[4], m[5]);
    // 结果 n 为 1, 因为 hhx 把所有字符串作为一个数字,后面的都没有输入
            
     n = sscanf("010203040506", "%2hhx%2hhx%2hhx%2hhx%2hhx%2hhx", &m[0], &m[1], &m[2], &m[3], &m[4], &m[5]);
     printf("2hhx: %d :%02x%02x%02x%02x%02x%02x\n",n, m[0], m[1],m[2],m[3], m[4], m[5]);
    // 结果 n 为 6, 加了2,之后限制每次hhx只匹配2个字符,所以每个都被输入

     n = sscanf("010203040506", "%02x%02x%02x%02x%02x%02x", &m[0], &m[1], &m[2], &m[3], &m[4], &m[5]);
     printf(" 02x: %d :%02x%02x%02x%02x%02x%02x\n",n, m[0], m[1],m[2],m[3], m[4], m[5]);
    // 0 是填充字符,2表示匹配2个字符,x表示一个十六进制数
    // 注意:编译有warning,有时结果是正确的(跟具体的编译器、编译选项、编译环境有关),但x表示4个字节,大于被输入对象的大小
    // 这会导致相邻的3个字节会被覆盖!!这会导致分配在相邻内存的变量被清0
    //http://blog.csdn.net/rainharder/archive/2008/09/27/2989675.aspx里面有个覆盖的例子

     return 0;
    }

    sscanf的功能很类似于正则表达式, 但却没有正则表达式强大,所以如果对于比较复杂的字符串处理,建议使用正则表达式.

    个人认为正则表达式略显复杂,还是使用sscanf方便,搞不定再用正则表达式

  • 相关阅读:
    maven第三章 maven使用入门
    各个软件产生的原因
    maven的pom.xml深入理解
    批量同步订单信息(包括状态)到订单中心心得
    数据库连接超时和go away、如何检测数据库的最大连接数
    记录错误日志的技巧
    架构思想总结同步和事务的具体应用
    业务逻辑复杂性处理
    日志系统总结
    php捕获异常的处理
  • 原文地址:https://www.cnblogs.com/fx2008/p/2164598.html
Copyright © 2020-2023  润新知