• Excel-VBA正则表达式提取文本案例


      背景是这样的,我手上有一份统计表,需要将IP地址里的省市提取出来,以便于处理。因此我首先想到了Python里的正则表达式,打算写一个自定义函数去批量提取。然而之前没学VBA里的正则表达式语法,因此就去网上搜了一下,结果发现根本不能运行。几经辗转,总算搞定,因此总结一下,供后来者参考。

      有几点说明:

      1、我是先在 Python中验证了正则表达式再copy到VBA中应用的,结果发现根本不能用。可能VBA跟Python的正则表达式语法还是有点不同的。

      2、还有属性submatches,此处不能写成“提取省市 = mat.Submatches.Item(0)”

      编程目的:实现IP地址中省市信息的提取。    

      

      主要涉及的知识点:VBA函数、正则表达式

      代码如下:

    Function 提取省市(rng As Range, name)
        
        Application.Volatile
        Set regx = CreateObject("vbscript.regexp")
        
        With regx
            .Global = True
            .Pattern = "[u4e00-u9fa5]+"
            Set mat = .Execute(rng)
        End With
        
        Select Case name
        
            Case "省"
                提取省市 = mat.Item(0).Value
                
            Case "市"
                提取省市 = mat.Item(1).Value
            
            Case Else
                MsgBox ("输入有误")
                
        End Select
        
    End Function
    

         代码解释:

      1、rng As Range, name:传递两个参数,第一个参数为单元格参数。

      2、Application.Volatile  Set regx = CreateObject("vbscript.regexp"):创建正则表达式对象,固定语法。

      3、With regx

         .Global = True

         .Pattern = "[u4e00-u9fa5]+"

        Set mat = .Execute(rng)

        End With

      Global:表示是否进行全局检索,True表示将所有匹配的结果返回。False则是只返回第一个匹配结果。

      Pattern = "[u4e00-u9fa5]+"就是正则表达式了,其中[u4e00-u9fa5]+表示匹配中文字符串。

      4、Set mat = .Execute(rng):即执行正则表达式。返回一个matchcollection类型的集合,即匹配到的所有结果。

      5、接下来是一个多条件判断语句,相当于If ...Elif... Else...End If 。

      6、提取省市 = mat.Item(0).Value:前面我们提到mat是一个matchcollection类型的集合,mat.Item(0)表示读取第一个匹配结果,Value表示读取它的值。最后将这个值赋给函数。也可以不用后面的value。

  • 相关阅读:
    10. 正则表达式匹配(动态规划)
    8. 字符串转换整数 (atoi)
    5. 最长回文子串
    4. 寻找两个正序数组的中位数
    1109. 航班预订统计
    计算机网络面试整理
    HTTP 响应 代码
    Tomcat 安装 2019.1.20
    ubuntu 编译 jdk (三)
    ubuntu 编译 jdk (二)
  • 原文地址:https://www.cnblogs.com/yimengtianya1/p/9200917.html
Copyright © 2020-2023  润新知