正则表达式和strings包相同,也是一个非常通用的包,在解析网页时肯定是没法略过它的。
转载请注明出处:http://www.cnblogs.com/SSSR/p/6347542.html
博客:
http://studygolang.com/articles/99 基础介绍
http://studygolang.com/articles/104
http://studygolang.com/articles/5565
以下为测试通过代码:
regexp.go
package regexplearning import ( "fmt" "regexp" ) import "bytes" func RegixAll(){ FindTest() FindIndexTest() FindStringTest() FindChinesString() FindNumOrLowerLetter() FindAndReplace() } //传入[]byte,返回[]byte func FindTest() { str := "ab001234hah120210a880218end" reg := regexp.MustCompile("\d{6}") //六位连续的数字 fmt.Println("------Find------") //返回str中第一个匹配reg的字符串 data := reg.Find([]byte(str)) fmt.Println(string(data)) fmt.Println("------FindAll------") //返回str中全部匹配reg的字符串 //第二个參数表示最多返回的个数。传-1表示返回全部结果 dataSlice := reg.FindAll([]byte(str), -1) for _, v := range dataSlice { fmt.Println(string(v)) } } //传入[]byte,返回首末位置索引 func FindIndexTest() { fmt.Println("------FindIndex------") //返回第一个匹配的字符串的首末位置 reg2 := regexp.MustCompile("start\d*end") //start開始。end结束。中间全是数字 str2 := "00start123endhahastart120PSend09start10000end" //index[0]表示開始位置,index[1]表示结束位置 index := reg2.FindIndex([]byte(str2)) fmt.Println("start:", index[0], ",end:", index[1], str2[index[0]:index[1]]) fmt.Println("------FindAllIndex------") //返回全部匹配的字符串首末位置 indexSlice := reg2.FindAllIndex([]byte(str2), -1) for _, v := range indexSlice { fmt.Println("start:", v[0], ",end:", v[1], str2[v[0]:v[1]]) } } //传入string,返回string(更加方便) func FindStringTest() { fmt.Println("------FindString------") str := "ab001234hah120210a880218end" reg := regexp.MustCompile("\d{6}") //六位连续的数字 fmt.Println(reg.FindString(str)) fmt.Println(reg.FindAllString(str, -1)) //下面两个方法是相似的 fmt.Println(reg.FindStringIndex(str)) fmt.Println(reg.FindIndex([]byte(str))) } //查找汉字 func FindChinesString() { str := "hello中国hello世界和平hi好" reg := regexp.MustCompile("[\p{Han}]+") fmt.Println(reg.FindAllString(str, -1)) //[中国 世界和平 好] } //查找数字或小写字母 func FindNumOrLowerLetter() { str := "HAHA00azBAPabc09FGabHY99" reg := regexp.MustCompile("[\d|a-z]+") fmt.Println(reg.FindAllString(str, -1)) //[00az abc09 ab 99] } //查找并替换 func FindAndReplace() { str := "Welcome for Beijing-Tianjin CRH train." reg := regexp.MustCompile(" ") fmt.Println(reg.ReplaceAllString(str, "@")) //将空格替换为@字符 //Welcome@for@Beijing-Tianjin@CRH@train. } func RegixBase() { //这个测试一个字符串是否符合一个表达式。 match, _ := regexp.MatchString("p([a-z]+)ch", "peach") fmt.Println(match) //上面我们是直接使用字符串,但是对于一些其他的正则任务,你需要使用 Compile 一个优化的 Regexp 结构体。 r, _ := regexp.Compile("p([a-z]+)ch") //这个结构体有很多方法。这里是类似我们前面看到的一个匹配测试。 fmt.Println(r.MatchString("peach")) //这是查找匹配字符串的。 fmt.Println(r.FindString("peach punch")) //这个也是查找第一次匹配的字符串的,但是返回的匹配开始和结束位置索引,而不是匹配的内容。 fmt.Println(r.FindStringIndex("peach punch")) //Submatch 返回完全匹配和局部匹配的字符串。例如,这里会返回 p([a-z]+)ch 和 `([a-z]+) 的信息。 fmt.Println(r.FindStringSubmatch("peach punch")) //类似的,这个会返回完全匹配和局部匹配的索引位置。 fmt.Println(r.FindStringSubmatchIndex("peach punch")) //带 All 的这个函数返回所有的匹配项,而不仅仅是首次匹配项。例如查找匹配表达式的所有项。 fmt.Println(r.FindAllString("peach punch pinch", -1)) //All 同样可以对应到上面的所有函数。 fmt.Println(r.FindAllStringSubmatchIndex( "peach punch pinch", -1)) //这个函数提供一个正整数来限制匹配次数。 fmt.Println(r.FindAllString("peach punch pinch", 2)) //上面的例子中,我们使用了字符串作为参数,并使用了如 MatchString 这样的方法。我们也可以提供 []byte参数并将 String 从函数命中去掉。 fmt.Println(r.Match([]byte("peach"))) //创建正则表示式常量时,可以使用 Compile 的变体MustCompile 。因为 Compile 返回两个值,不能用语常量。 r = regexp.MustCompile("p([a-z]+)ch") fmt.Println(r) //regexp 包也可以用来替换部分字符串为其他值。 fmt.Println(r.ReplaceAllString("a peach", "<fruit>")) //Func 变量允许传递匹配内容到一个给定的函数中, in := []byte("a peach") out := r.ReplaceAllFunc(in, bytes.ToUpper) fmt.Println(string(out)) }
regexp_test.go
package regexplearning import ( "fmt" "testing" //"regexplearning" ) var print=fmt.Println func TestFindTest(t *testing.T) { FindTest() fmt.Println("Hello World!这是测试") } func TestRegixBase(t *testing.T) { RegixBase() fmt.Println("Hello World!这是测试") } func TestRegixAll(t *testing.T) { print("测试所有的函数") RegixAll() fmt.Println("Hello World!这是测试") }