• 【Python】读取各种文档(txt、csv、excel、pdf)方法


    1.读取txt文件

    注意事项:

    1..txt文件同下方脚本所在的.py文件需要在同一个文件夹下

    1 # coding=utf-8
    2 
    3 txt读取
    4 with open("1233.txt") as file:
    5     for line in file:
    6         print(line)

    2.读取csv文件

    注意事项:

    1).csv文件同下方脚本所在的.py文件需要在同一个文件夹下

    2).csv文件由来必须是,创建完excel文件后另存为csv文件,如果只是修改后缀名读取是不能成功读到csv文件中的内容的。

    1 # coding=utf-8
    2 import csv
    3 
    4 csv_file = open('csvfile_input.csv','r')
    5 reader=csv.reader(csv_file)
    6 for item in reader:
    7     print(item)

    3)读取+写入在一起时候的组合代码

     1 # 读取csv文件方式2
     2 csvFile = open("csvfile_input.csv", "r")
     3 reader = csv.reader(csvFile)  # 返回的是迭代类型
     4 data = []
     5 for item in reader:
     6     print(item)
     7     data.append(item)
     8 print(data)
     9 #csvFile.close()
    10 
    11 # 从列表写入csv文件
    12 csvFile2 = open('csvFile3.csv', 'w', newline='')  # 设置newline,否则两行之间会空一行
    13 writer = csv.writer(csvFile2)
    14 m = len(data)
    15 for i in range(m):
    16     writer.writerow(data[i])
    17 csvFile2.close()

     3.读取excel文件

    文件内容(文件所在位置:E:scriptpython-scriptTestData.xlsx):

     1 # -*- coding: utf-8 -*-
     2 
     3 import xlrd
     4 
     5 from datetime import date,datetime
     6 
     7 def read_excel():
     8 
     9     ExcelFile=xlrd.open_workbook(r'E:scriptpython-scriptTestData.xlsx')
    10 
    11 #获取目标EXCEL文件sheet名
    12 
    13     print(ExcelFile.sheet_names())
    14 
    15 #------------------------------------
    16 
    17 #若有多个sheet,则需要指定读取目标sheet例如读取sheet2
    18 
    19 #sheet2_name=ExcelFile.sheet_names()[1]
    20 
    21 #------------------------------------
    22 
    23 #获取sheet内容【1.根据sheet索引2.根据sheet名称】
    24 
    25 #sheet=ExcelFile.sheet_by_index(1)
    26 
    27     sheet=ExcelFile.sheet_by_name('TestCase002')
    28 
    29 #打印sheet的名称,行数,列数
    30 
    31     print(sheet.name,sheet.nrows,sheet.ncols)
    32 
    33 #获取整行或者整列的值
    34 
    35     rows=sheet.row_values(2)#第三行内容
    36 
    37     cols=sheet.col_values(1)#第二列内容
    38 
    39     print(cols,rows)
    40 
    41 #获取单元格内容
    42 
    43     print(sheet.cell(1,0).value.encode('utf-8'))
    44 
    45     print(sheet.cell_value(1,0).encode('utf-8'))
    46 
    47     print(sheet.row(1)[0].value.encode('utf-8'))
    48 
    49 #打印单元格内容格式
    50 
    51     print(sheet.cell(1,0).ctype)
    52 
    53 if __name__ == '__main__':
    54     read_excel()

    运行结果:

    4.读取pdf文件(暂不研究)

  • 相关阅读:
    logstash收集nginx日志
    logstash收集java日志,多行合并成一行
    一个配置文件收集多个日志-if根据type类型判断
    CentOS 7 kibana安装配置
    CentOS7 logstash配置部署
    Centos7 Elasticsearch部署
    awk命令
    top命令
    java中的getClass()函数
    java容器
  • 原文地址:https://www.cnblogs.com/zhuzhubaoya/p/9264061.html
Copyright © 2020-2023  润新知