使用Python做简单的字符串匹配

由于需要在半结构化的文本数据中提取一些特定格式的字段、数据辅助挖掘分析工作，以往都是使用Matlab工具进行结构化数据处理的建模，matlab擅长矩阵处理、结构化数据的计算，Python具有与matlab共同的特点：语法简洁、库丰富，对算法仿真来说都是一门简洁易用的语言。

Python做字符串匹配相对来说上手比较容易，且具有成熟的字符串处理库re供我们使用；

在re库的帮助下，只需简单的两步就可完成匹配工作，对做数据分析/算法的工作者来说，轻松了许多：

step1：构建正则表达式模式，并使用compile()函数生产正则表达式对象

step2：调用step1生成的正在表达式对象的方法、属性，返回匹配结果

<span style="color:#333300;"># 导入正则表达式匹配模块 Py 3.0
import re
text = "today is 01/04/2015, happy new year..."

#建立日期的正则表达式
detepat = re.compile('(d+)/(d+)/(d+)')

#进行匹配并打印结果
result = detepat.finditer(text)
for m in result:
    print(m.group())</span>

记录一下，下次用到直接翻出来就好了~

相关阅读:
新的工作开始
昨日的世界
【Drools-开源业务规则引擎】入门实例(含源码)
【cs229-Lecture7】支持向量机（SVM）
【2014年12月6日】HR交流会
【cs229-Lecture5】生成学习算法：1）高斯判别分析（GDA）;2）朴素贝叶斯（NB）
【图算法】Dijkstra算法及变形
【图算法】综述
【云迁移论文笔记】A Comparison of On-premise to Cloud Migration Approaches
【云迁移论文笔记】Cloud Migration Research:A Systematic Review

原文地址：https://www.cnblogs.com/cl1024cl/p/6205057.html