Python: Windows 7 64位安装、使用 pymongo 3.2

官网tutorial: http://api.mongodb.com/python/current/tutorial.html

本教程将要告诉你如何使用pymongo模块来操作MongoDB数据库。

一、先决条件
开始之前，我们需要确定电脑已经安装了pymongo和MongoDB.
1.安装pymongo
使用pip安装pymongo，在cmd命令行输入：
pip install pymongo
在python IDLE 中输入：import pymongo 没有报错表示安装成功。
2.安装MongoDB
参考这个链接：http://www.cnblogs.com/billyzh/p/5913687.html
如果不安装MongoDB会出现后面的一个问题。

3.MongoDB中的基本概念
　　在MongoDB中基本的概念是文档(document)、集合(collection)、数据库(database).
　　下图(盗的图)可能容易理解MongoDB中的一些概念:

　　通过下图实例，可以更直观的的了解MongoDB中的一些概念：

二、通过MongoClient建立一个连接
开始使用pymongo的第一步是创建一个MongoClient,来运行mongod实例。
>>> from pymongo import MongoClient
>>> client = MongoClient()
上面代码将会连接默认的host和port。也可指定：
>>> client = MongoClient('localhost',27017)
或者用MongoDB URI格式：
>>> client = MongoClient('mongodb://localhost:27017/')
默认状态下Mongo客户端是没有加密的,但是如果需要通过账户登录:
>>> client = MongoClient('mongodb://账号:密码@localhost:27017/')

三、获取一个数据库
一个MongoDB实例可以支持多个独立的数据库。使用PyMongo时，可以通过访问MongoClient的属性的方式来访问数据库。
>>> db = client.test_database
如果数据库名字使用属性方式不能访问(像test-database),也可以通过访问字典值的方式。
>>> db = client['test-database']

四、获取一个Collection
一个collection是一组存在MongoDB中的文件(documents)，大致可以认为是关系型数据库中表的概念。
　获取Collection方法与获取数据库方法一致:
>>> collection = db.test_collection #注意连接符是_不是-
或用字典方式：
>>> collection = db['test-collection']
需要注意的是，MongoDB里的collections(集合)和databases(数据库)都是惰性创建的，前面提到的所有命令
实际上没有对MongoDB server进行任何操作。当第一个文件插入后，collections和databases才会被创建。

五、文件(Documents)
数据在MongoDB中是用JSON类文件的形式表示和保存起来的。在pymongo中用字典来代表文件。
例如，下面这个字典可能被用来代表一篇博客文章:
>>> import datetime
>>> post = {
"author": "Mike",
　　　　　　　　　"text": "My first blog post!",
　　　　　　　　"tags": ["mongodb","python","pymongo"],
　　　　　　　　　"date": datetime.datetime.utcnow()
　　　　　　　　　}
　注意，文件里可以包含python原生(native)类型（datetime.datetime实例），这些类型的值会被自动在原生类型和BSON格式之间转换。

六、插入一个文件(Inserting a Document)
插入一个文件到collection中，可以使用insert_one()方法。
>>> posts = db.posts
>>> post_id = posts.insert_one(post).inserted_id
>>> post_id
ObjectId('57eb8f2177eddf292cbea0b3')
当一个文件被插入一个特殊的键值'_id',即使文件内没有_id这个键值，那么系统自动添加一个到文件里。
这是一个特殊键值，它的值在整个collection里是唯一的。insert()返回这个文件的_id值。
插入第一个文件后，这个posts collection 就真正的在server上创建了。我们可以通过查看数据库上的
所有collection来验证：
>>> db.collection_names(include_system_collections=False)
['posts']

七、获取单个文件 find_one()
在MongoDB中，最基本的查询是find_one。这个方法返回一个符合查询的文件，或者在没有匹配的时候返回None。
当只有一个文件符合条件的时候，或者只对第一个符合条件的文件感兴趣的时候，这个方法是很有用的。
我们用find_one()来获取posts collection 里的第一个文件：
>>> posts.find_one()
{'date': datetime.datetime(2016, 9, 27, 3, 56, 26, 78000), 'author': 'Mike',
'_id': ObjectId('57e9edea77eddf223cde3314'), 'tags': ['mongodb', 'python', 'pymongo'],
'text': 'My first blog post!'}
返回结果是一个我们之前插入的符合条件的字典类型值。
注意，返回的文件里包含_id这个键值，这是自动添加的。
find_one()还支持对特定元素进行匹配的查询。限制我们文档的作者是"Mike",可以这么做：
>>> posts.find_one({"author":"Mike"})
{'date': datetime.datetime(2016, 9, 27, 3, 56, 26, 78000), 'author': 'Mike',
'_id': ObjectId('57e9edea77eddf223cde3314'), 'tags': ['mongodb', 'python', 'pymongo'],
'text': 'My first blog post!'}
如果我们用不同的作者，比如："Eliot",将不会得到结果。
>>> posts.find_one({"author":"Eliot"})
>>>

八、按照ObjectId查询
通过_id也可以进行查询，在例子中就是ObjectId:
>>> post_id
ObjectId('57eb54a877eddf292cbea0a8')
>>> posts.find_one({"_id": post_id})
{'date': datetime.datetime(2016, 9, 28, 5, 25, 53, 6000), 'author': 'Mike',
'_id': ObjectId('57eb54a877eddf292cbea0a8'), 'tags': ['mongodb', 'python'],
'text': 'My first blog post!'}
注意：ObjectId 并不等同于它的字符串形式。
>>> post_id_as_str = str(post_id)
>>> posts.find_one({"_id": post_id_as_str}) #No result
>>>
在web应用的一个常见任务就是在request的URL里获取ObjectId，然后找到与之匹配的文件。
在本例中，必须要先从字符串转换为ObjectId，然后传给find_one:
>>> from bson.objectid import ObjectId
#从URL里获取post_id，然后把它作为字符串传入
>>> def get(post_id):
#将字符串转换为ObjectId
document = client.db.collection.find_one({"_id": ObjectId(post_id)})
小插曲：
MongoDB以BSON格式保存数据。BSON字符串都是UTF-8编码的，所以pymongo必须确保它保存的字符串值
包含有效地UTF-8数据.常规字符串(<type ‘str’>)都是有效的，可以不改变直接保存。
Unicode字符串(<type ‘unicode’>)就需要先编码成UTF-8格式。

九、批量插入
为了让查询更有趣，我们多插入几个文件。除了单个文件插入，也可以通过给insert_many()方法传入
一个列表(list)，作为该方法的第一个参数,进行批量插入操作。
这将会插入列表(list)中的每个文件(document)到集合中去，而且只向server发送一条命令:
new_posts = [{"author": "Mike",
　　　　　　　　　　 "text": "Another post!",
　　　　　　　　　　　 "tags": ["bulk", "insert"],
　　　　　　　　　　　 "date": datetime.datetime(2009, 11, 12, 11, 14)
　　　　　　　　　　　},
　　　　　　　　　　{"author": "Eliot",
　　　　　　　　　　 "title": "MongoDB is fun",
　　　　　　　　　　 "text": "and pretty easy too!",
　　　　　　　　　　 "date": datetime.datetime(2009, 11, 10, 10, 45)
　　　　　　　　　　}]
　　　　>>> result = posts.insert_many(new_posts)
　　　　>>> result.inserted_ids
　　　　[ObjectId('57eb700b77eddf292cbea0a9'), ObjectId('57eb700b77eddf292cbea0aa')]
这个例子里有一些比较有趣的地方：
insert_many()现在返回两个ObjectId实例，每个代表一个插入的文件。
new_posts[1]与其他的posts内容格式不相同,里面没有"tags”。另外我们增加了一个新的“title”域。这就是MongoDB所提到的无schema特点。

十、查询多个文件
为了得到更多的文件，我们使用find()方法。find()返回一个Cursor实例,可使我们遍历所有匹配的文件。
比如遍历每个posts collection里的文件:
>>> for post in posts.find():
　　 post
与使用find_one()时候相同，可以传入一个文件来限制查询结果。比如查询作者"Mike" 文件：
　　　>>> for post in posts.find({"author":"Mike"}):
post

十一、文件数量(Counting)
如果只想知道符合查询条件的文件有多少，可以用count()操作，而没必要进行完整的查询。
查询collection的文件总数：
>>> posts.count()
11
或者只是查询一些特定文件数量：
>>> posts.find({"author": "Mike"}).count()
10

十二、限定范围的查询
MongoDB支持多种高级查询。比如我们按照时间(小于某个时间)来查询,结果按作者名参数来排序:
>>> d = datetime.datetime(2009,11,12,12)
>>> for post in posts.find({"date":{"$lt":d}}).sort("author"):
print(post)
　　　{'date': datetime.datetime(2009, 11, 10, 10, 45), 'author': 'Eliot', 'text': 'and pretty easy too!', '_id': ObjectId('57eb700b77eddf292cbea0aa'), 'title': 'MongoDB is fun'}
　　　{'date': datetime.datetime(2009, 11, 12, 11, 14), 'author': 'Mike', '_id': ObjectId('57eb700b77eddf292cbea0a9'), 'tags': ['bulk', 'insert'], 'text': 'Another post!'}
这里使用了特殊的"$lt"操作符来进行范围查询，并调用sort()方法，对结果按照作者参数排序。

十三、索引(Indexing)
添加索引可以帮助加快某些查询，也可以添加额外的功能来查询和存储文件。
在这个示例中，我们将演示如何在一个键上创建一个唯一索引，这个索引将拒绝--那些已经在索引中存在该键值的文件。
首先，我们需要创建一个索引：
>>> result = db.profiles.create_index([('user_id',pymongo.ASCENDING)],unique = True)
>>> result
'user_id_1'
>>> list(db.profiles.index_information())
['_id_', 'user_id_1']
注意：现在我们有两个索引,一个索引 _id是MongoDB自己创建的。另外一个 user_id是我们刚刚创建的。
现在，让我们建立一些用户配置文件：
　　>>> user_profiles = [{'user_id':211,'name':'Luke'},{'user_id':212,'name':'Ziltoid'}]
　　>>> result = db.profiles.insert_many(user_profiles)
　该索引可以防止我们的user_id已经插入集合中的文档：
　　>>> new_profile = {'user_id': 213, 'name': 'Drew'}
　　>>> duplicate_profile = {'user_id': 212, 'name': 'Tommy'}
　　>>> result = db.profiles.insert_one(new_profile) # This is fine.
　　>>> result = db.profiles.insert_one(duplicate_profile)
　　Traceback (most recent call last):
　　pymongo.errors.DuplicateKeyError: E11000 duplicate key error collection: test_database.profiles index: user_id_1 dup key: { : 212 }
关于索引的MongoDB文档链接：

问题：
　　1.pymongo.errors.ServerSelectionTimeoutError: localhost:27017: [WinError 10061] 由于目标计算机积极拒绝，无法连接。

　原因：未装MongoDB或者MongoDB服务没有开启。(这个错误找了很长时间，哎。。。)
　　　参考链接：http://www.cnblogs.com/greenteaone/p/3745734.html

　　2.在数据库存入了文件，如何查看呢？就需要用到MongoDB可视化工具了。

　　　　1)MongoBooster(已用)
　　　　　　下载地址：http://mongobooster.com/home
　　　　2)Robomongo
　　　　　　下载地址：https://robomongo.org/

相关阅读:
Java中Bitmap的实现
链接备用
91家纺网，利用cookies登录
selenium验证码pic处理代码，以91家纺网为例
91家纺网，登录代码
91家纺网，模拟浏览器登录
91家纺网，models
91家纺网，setting文件
91家纺网，更新
91家纺网，更新

原文地址：https://www.cnblogs.com/billyzh/p/5918598.html

Python: Windows 7 64位 安装、使用 pymongo 3.2

Python: Windows 7 64位安装、使用 pymongo 3.2