• C++11标准 STL正则表达式 验证电子邮件地址


    转自:http://www.cnblogs.com/yejianfei/archive/2012/10/07/2713715.html

    我们最经常遇到的验证,就是电子邮件地址验证。网站上常见。各种网页脚本也都常用“正则表达式”(regular expression)对我们输入的电子邮件地址进行验证,判断是否合法。有的还能分解出用户名和域名。现在用C++语言实现一下电子邮件地址验证程序,用的是C++ 11标准新增加的STL正则表达式。

      源代码如下,该代码已在Visual Studio 2010上验证通过。g++ 4.6不支持C++ 11的STL正则表达式,g++ 4.6上编译可以通过,但运行时错误,抛出regex_error异常。因此,如果要在g++ 4.6上使用正则表达式,请用GNU正则表达式库或者用boost正则表达式库。

     

     1 /*
     2  * regex.cpp - 用正则表达式验证电子邮件地址
     3  *
     4  *  C++11标准  STL正则表达式
     5  *
     6  *
     7  *         
     8  *
     9  * 编译命令:
    10  *         cl regex.cpp /EHsc /link /out:regex.exe
    11  *
    12  */
    13 
    14 #include <iostream>
    15 #include <cstdlib>
    16 #include <string>
    17 #include <regex>  // regular expression 正则表达式
    18 
    19 using namespace std;
    20 
    21 int main ( )
    22 {
    23     string email_address;
    24     string user_name, domain_name;
    25 
    26     //regex pattern("([0-9A-Za-z\-_\.]+)@([0-9a-z]+\.[a-z]{2,3}(\.[a-z]{2})?)"); //这个不全
      regex pattern("([0-9A-Za-z\-_\.]+)@(([a-zA-Z0-9\-])+\.+[a-z]{2,3}(\.[a-z]{2})?)"); //这个最全
    27 // 正则表达式,匹配规则: 28 // 第1组(即用户名),匹配规则:0至9、A至Z、a至z、下划线、点、连字符之中 29 // 的任意字符,重复一遍或以上 30 // 中间,一个“@”符号 31 // 第二组(即域名),匹配规则:0至9或a至z之中的任意字符重复一遍或以上, 32 // 接着一个点,接着a至z之中的任意字符重复2至3遍(如com或cn等), 33 // 第二组内部的一组,一个点,接着a至z之中的任意字符重复2遍(如cn或fr等) 34 // 内部一整组重复零次或一次 35 36 37 // 输入文件结尾符(Windows用Ctrl+Z,UNIX用Ctrl+D)结束循环 38 while ( cin >> email_address ) 39 { 40 if ( regex_match( email_address, pattern ) ) 41 { 42 cout << "您输入的电子邮件地址合法" << endl; 43 44 // 截取第一组 45 user_name = regex_replace( email_address, pattern, string("$1") ); 46 47 // 截取第二组 48 domain_name = regex_replace( email_address, pattern, string("$2") ); 49 50 cout << "用户名:" << user_name << endl; 51 cout << "域名:" << domain_name << endl; 52 cout << endl; 53 } 54 else 55 { 56 cout << "您输入的电子邮件地址不合法" << endl << endl; 57 } 58 } 59 return EXIT_SUCCESS; 60 }

     

     2014-11-11补充 :

     1 string GetUrlDomainName(string url)
     2 {
     3     string user_name, domain_name,temp,com,cn;
     4     const std::regex pattern("([0-9A-Za-z\-_\.]+)@(([a-zA-Z0-9\-])+\.+[a-z]{2,3}(\.[a-z]{2})?)");
     5 
     6     if ( std::regex_match(url.c_str(), pattern ))
     7     {
     8         // 截取第一组
     9         user_name = regex_replace(url.c_str(), pattern, string("$1") );
    10 
    11         // 截取第二组
    12         domain_name = regex_replace(url.c_str(), pattern, string("$2") );
    13 
    14         const std::regex subPattern("([a-zA-Z0-9\-_]+)\.([a-z]{2,3}(\.[a-z]{2})?)");//这个正则对于.com和.com.cn都适合
    15         //const std::regex subPattern("([a-zA-Z0-9\-_]+)\.([a-z]{2,3})\.(([a-z]{2})?)");//这个正则只适合后面.com.cn
    16         if (std::regex_match(domain_name,subPattern))
    17         {
    18             temp = regex_replace(domain_name,subPattern,string("$1"));//@和com之间 
    19             com = regex_replace(domain_name,subPattern,string("$2"));//得到com
    20             cn = regex_replace(domain_name,subPattern,string("$3"));//得到cn
    21         }
    22     }
    23     return temp;
    24 }

     

  • 相关阅读:
    Codeforces-754D Fedor and coupons
    LightOJ
    LightOJ
    LightOJ
    LightOJ
    POJ
    HDU
    HDU
    HDU-2159
    方法的重写
  • 原文地址:https://www.cnblogs.com/chechen/p/3905290.html
Copyright © 2020-2023  润新知