解决：return _compile(pattern, flags).search(string) TypeError: expected string or buffer

今天写爬虫，爬取MM图片页面的标题时，遇到了一个问题，上图：

看看我的代码：

 1 import urllib
 2 import urllib2
 3 import re
 4 
 5 class JPMSG:
 6 
 7     def __init__(self, baseUrl):
 8         self.baseUrl = baseUrl
 9 
10     def getPage(self, viewNum):
11         try:
12             url = self.baseUrl + str(viewNum) + '.html'
13             request = urllib2.Request(url)
14             response = urllib2.urlopen(request)
15             #print response
16             return response
17         except urllib2.URLError, e:
18             if hasattr(e, "reason"):
19                 print "爬取MM图片失败，失败原因", e.reason
20                 return None
21 
22     def getTitle(self):
23         page = self.getPage(13235)
24         pattern = re.compile('<div class="bttitke"><h2>(.*?)</h2>', re.S)
25         result = re.search(pattern, page)
26         if result:
27             print result.group(0)
28             return result.group(0).strip()
29         else:
30             return None

哈哈，发现问题了吗？原因是我的返回的response没加read()，应该是return response.read()

好了，一波未平，一波又起。上图：

为什么我的正则表达式匹配的标题连标签都匹配下来了，我们要的仅仅是标题啊。

原因就出在print result.group(0)身上，group()的方法，当有多个参数时是以元组形式返回，编号0表示整个匹配的子串，而group(1)才是我们要的第一个也是唯一一个元素。

修改后，我们得到了正确的标题：

相关阅读:
tf.function ：图执行模式（转载）
TFRecord：TensorFlow 数据集存储格式（转载）
tf.keras.Model和tf.keras.Sequential
tf.keras.Input
IOS逆向-砸壳笔记
ios调试-查看日志
用xcode9编译出ios越狱机程序使用的dylib
docker运行中的container怎么修改之前run时的env
（转）解决类似 /usr/lib64/libstdc++.so.6: version `GLIBCXX_3.4.21' not found 的问题
(转) mysql中left join,right join,inner join的区别

原文地址：https://www.cnblogs.com/my_captain/p/7349201.html