我们最经常遇到的验证,就是电子邮件地址验证。网站上常见。各种网页脚本也都常用“正则表达式”(regular expression)对我们输入的电子邮件地址进行验证,判断是否合法。有的还能分解出用户名和域名。现在用C语言实现一下电子邮件地址验证程序,用的是POSIX正则表达式。由于用的是POSIX正则表达式,所以只能用gcc编译。
另外,据测试,只有Linux原版的gcc才能编译通过。如果用Windows中的MinGW或Cygwin的gcc编译不通过,错误是找不到<regex.h>头文件。
C语言源代码如下:
/* * regex.c - 用正则表达式验证电子邮件地址 * * POSIX正则表达式 * * * 编译命令: * gcc regex.c -o regex -Wall * * * Copyright 叶剑飞 2012 * */ #include <stdio.h> #include <stdlib.h> #include <string.h> #include <regex.h> /* regular expression 正则表达式 */ #define MAX_LENGTH 1000 int main (void) { size_t char_num; char email_address[MAX_LENGTH]; char user_name[MAX_LENGTH]; char domain_name[MAX_LENGTH]; regmatch_t pmatch[4]; regex_t match_regex; regcomp( &match_regex, "([0-9A-Za-z\\-_\\.]+)@([0-9a-z]+\\.[a-z]{2,3}(\\.[a-z]{2})?)", REG_EXTENDED ); while ( scanf( "%s", email_address ) != EOF ) { if ( regexec( &match_regex, email_address, 4, pmatch, 0 ) == 0 ) { char_num = pmatch[1].rm_eo - pmatch[1].rm_so; strncpy( user_name, &(email_address[pmatch[1].rm_so]), char_num ); user_name[char_num] = '\0'; char_num = pmatch[2].rm_eo - pmatch[2].rm_so; strncpy( domain_name, &(email_address[pmatch[2].rm_so]), char_num ); domain_name[char_num] = '\0'; puts( "您输入的电子邮件地址合法" ); printf ( "用户名:%s\n", user_name ); printf ( "域名:%s\n\n", domain_name ); } else puts( "您输入的电子邮件地址不合法\n\n" ); } regfree( &match_regex ); return EXIT_SUCCESS; }