• 数据转化和字符编码


     数字类型的转化

    1. 转化数字   int  float
    2. 数字转化字符串  print(str( ))

    3.字符串与列表相互转化  

     

    s = 'abc123呵呵'
    print(list(s))  # ['a', 'b', 'c', '1', '2', '3', '呵', '呵']  没有对应的 str(ls)
    ls = ['a', 'b', 'c', '1', '2', '3', '呵', '呵']
    n_s = ''.join(ls)
    print(n_s)  ==>abc123呵呵

    s1 = 'a b c 1 2 3 呵 呵'
    res = s1.split()
    print(res)   ==》['a', 'b', 'c', '1', '2', '3', '呵', '呵']

     

     

    s2 = 'ie=UTF-8&wd=你好帅'

    res = s2.split('&')
    print(res)  # ['ie=UTF-8', 'wd=你好帅']

    ls2 = ['ie=UTF-8', 'wd=你好帅']
    n_s2 = '@'.join(ls2)
    print(n_s2)  # ie=UTF-8@wd=你好帅

     

     

    4."ie=UTF-8&wd=你好帅" => [('ie', 'UTF-8'), ('wd', '你好帅')]

    res = []
    s4 = "ie=UTF-8&wd=你好帅"
    ls4 = s4.split('&')  # ['ie=UTF-8', 'wd=你好帅']
    for ele in ls4:  # v = ie=UTF-8 | wd=你好帅
        k, v = ele.split('=')  # k: ie  v: UTF-8
        res.append((k, v))
    print(res)

     

     

    5."ie=UTF-8&wd=你好帅" => {'ie': 'UTF-8', 'wd': '你好帅'}

    res = {}
    s5 = "ie=UTF-8&wd=你好帅"
    ls5 = s5.split('&')  # ['ie=UTF-8', 'wd=你好帅']
    for ele in ls5:  # v = ie=UTF-8 | wd=你好帅
        k, v = ele.split('=')  # k: ie  v: UTF-8
        res[k] = v
    print(res)

     

    1. [('ie', 'UTF-8'), ('wd', '你好帅')] => {'ie': 'UTF-8','wd': '你好帅'}

    res = {}
    ls6 = [('ie', 'UTF-8'), ('wd', '你好帅')]
    for k, v in ls6:
        res[k] = v
    print(res)

     

    7. .list与tuple、set直接相互转化 - 直接 类型()

    8.将汉字转化为数字

    num_map = {
        '壹': 1,
        '贰': 2,
        '仟': 1000
    }
    ls8 = ['贰', '壹', '仟']
    res = []
    for v in ls8:
        num = num_map[v]  # 通过key去映射表拿到对应的值,完成 '贰' => 2
        res.append(num)
    print(res)

    字符编码

    1. 什么是字符编码:将人识别的字符转换计算机能识别的01,转换的规则就是 字符编码表、

    2. 常用的编码表:asciiunicodeGBKShift_JISEuc-kr

    3. 编码操作:编码encode()、解码decode()

    知识储备

    电脑三大核心:cpu - 内存 - 硬盘(数据的存取过程)

    # 软件及python解释器读取文件过程:启动 - 读取 - 展示|解释执行

    # python2环境的文件头:# coding: 编码格式

    简介与发展

    1. ascii - 各国编码 - 万国编码

    2. 存取不一致的乱码现象

    3. unicodeutf-8

    核心

    编码操作:编码encode()、解码decode()

    字符与字节

    1. 字节的存储方式:8个二进制位

    2. 字符所占字节数:根据编码的不同,所占字节数可能不同

    3. 三种格式字符串:u''b''r''

    ub格式字符串转换: str(b'', encode='utf-8')bytes(u'', encode='utf-8')

    文件操作

    1. 文件操作的三步骤:打开文件 - 使用文件 - 关闭文件

    2. 文件操作三要素:文件源、操作模式、编码

    3. with语法:with open(...) as 别名, ..., open(...) as 别名: pass

    4. 重点方法:read() | write() | readline() | close() | f.flush() | f.seek()

    操作方法

    读:read() | readline() | readlines()

    写:write() | writelines() | flush()

    光标:seek() | tell()

    特征:encoding | closed

    了解:readable() | writable() | name

    案例

    1. 文件复制

    2. 文件修改

     

    了解:py文件脚本机制

  • 相关阅读:
    常见排序算法及其C++实现
    Arc Engine二次开发——弹窗进行属性查询
    Python:Shapefile矢量转化为GeoJSON格式
    Python:GeoJson格式的多边形裁剪Tiff影像并计算栅格数值
    Java调用Python相关问题:指定python环境、传入参数、返回结果
    标准WPS框架下的空间信息处理服务部署方法
    AE开发—利用IQueryFilter接口进行属性查询
    Java调用Javascript、Python算法总结
    百度地图爬虫——获取某区域所有中学附近的网吧数据
    Python中使用面状矢量裁剪栅格影像,并依据Value值更改矢量属性
  • 原文地址:https://www.cnblogs.com/komorebi/p/10738819.html
Copyright © 2020-2023  润新知