• 【Python爬虫学习笔记6】JSON文件存储


    JSON简介

    JSON(全称JavaScript Obejct Notation,JavaScript对象标记),基于 ECMAScript (w3c制定的js规范)的一个子集,采用完全独立于编程语言的文本格式,通过对象和数组的组合来表示数据,构造方法简洁且其结构化程度高,是一种轻量级的数据交换格式。

    在JSON中,支持很多数据类型,包括有对象、数组、整型、浮点型、布尔型、NULL类型以及字符串类型(由于是JSON基于ES,在python中,字符串必须要用双引号,不能用单引号),而这些多个数据之间使用逗号分开。不过从本质上来说,JSON就是一个字符串。

    在这些所支持的数据类型里,对象和数组是比较特殊且常用的两种类型:

    对象:在JavaScript中使用花括号{}包裹起来的内容,数据结构为{key:value…}的键值对结构,类似于python中的字典。

    数组:在JavaScript中使用方括号[]包裹起来的内容,数据结构为[element1,element2…]的索引结构,类似于python中的列表。

    JSON可以由以上两种形式自由组合而成,并且可以无限次嵌套,是数据交换的极佳方式。

    例如,一个JSON对象可以写为如下形式:

    [{
             "username":"UnikFox",
             "age":20,
             "country":"China"
    },{
             "username":"Luna",
             "age":16,
             "country":"Britain"
    }
    ]

    为方便查看JSON数据,我们可以借助一个专门用于解析JSON数据的网址(https://www.json.cn/),将我们所要解析的JSON文本复制到左边的输入框,右边的显示框便会动态实时格式化显现,同时还能检查输入的文本是否符合JSON语法并给出提示。

    image

    JSON数据的写入和读取

    在python中,我们可以很轻松地使用内置的json库来完成对JSON数据的相关操作。常用的操作是写入和读取,接下来我们对此分别进行介绍。

    在此之前,我们先来做一些准备工作。

    #导入json库
    import json
    
    #设置一个用于JSON对象操作的列表
    persons = [
        {
            'username':'UnikFox',
            'age':20,
            'country':'China'
        },
        {
            'username':'Luna',
            'age':16,
            'country':'Britain'
        }
    ]

    1.JSON数据的写入

    json库中提供了dumps()和dump()两种方法来进行数据写入,其中前者适用于将python对象转化为JSON字符串,而后者则可以将python对象写入json文件。

    ##json库写入操作
    
    # 利用dumps()方法将python对象转化为json字符串
    json_str = json.dumps(persons)
    print(type(json_str))    #<class 'str'>
    print(json_str)          #[{"username": "UnikFox", "age": 20, "country": "China"}, {"username": "Luna", "age": 16, "country": "Britain"}]
    
    # 利用dump()方法将python对象存储到json文件中
    with open('person.json','w',encoding='utf-8') as fp:
        json.dump(persons,fp,ensure_ascii=False)

    这里要说明的地方有两处:1.有时候我们的字符串为中文,因此在打开文件时需要设置编码encoding;2.json文件的写入默认为Unicode编码,在写入数据后会自动转化为unicode字符,为方便中文的显示,我们需要关闭其默认编码’ensure_ascii=False’。

    person.json文件内容(这里我们可以看到,json写入时自动地帮我们格式化了数据,将原本地单引号转化为了双引号)

    [{"username": "UnikFox", "age": 20, "country": "China"}, {"username": "Luna", "age": 16, "country": "Britain"}]

    2.JSON数据的读取

    和写入操作类似,json库提供了loads()和load()两种方法,前者为从JSON字符串转化为python对象,而后者则是从文件中获取python对象。

    ##json库读取操作
    
    # 使用loads()方法将json字符串转化为python对象
    json_str = '[{"username": "UnikFox", "age": 20, "country": "China"}, {"username": "Luna", "age": 16, "country": "China"}]'
    persons = json.loads(json_str)
    print(persons)    #[{"username": "UnikFox", "age": 20, "country": "China"}, {"username": "Luna", "age": 16, "country": "Britain"}]
    
    # 利用load()方法从json文件中读取数据并存储为python对象
    with open('person.json','r',encoding='utf-8')as fp:
        persons = json.load(fp)
        print(type(persons))    #<class 'list'>
        print(persons)    #[{'username': 'UnikFox', 'age': 20, 'country': 'China'}, {'username': 'Luna', 'age': 16, 'country': 'Britain'}]

    以上便是有关JSON文件存储的简单介绍和基本使用,更详细的内容可以参考官方文档:https://docs.python.org/3.6/library/json.html

  • 相关阅读:
    最长递增子序列问题---动态规划
    Shell中判断语句if中-z至-d的意思
    Linux中shell变量$0,$?等含义
    LeetCode之链表
    linux命令之crontab定时执行任务
    linux命令之scp远程文件复制
    Linux命令之sed批量替换字符串操作
    tomcat安装出现问题及解决方法
    LeetCode之二叉树作题java
    mysql导入导出、阿里云内网传输
  • 原文地址:https://www.cnblogs.com/Unikfox/p/9690476.html
Copyright © 2020-2023  润新知