• 用Python和FFmpeg查找大码率的视频文件


    用Python和FFmpeg查找大码率的视频文件

    本文使用Python2.7, 这个工作分两步

    1. 遍历目录下的视频文件
    2. 用ffprobe获取是视频文件的码率信息

    用ffprobe 获取json格式的视频信息

    用ffprobe.exe是FFmpeg自带的查看视频信息的工具。其获取json格式的信息命令例如以下

    ffprobe -v quiet -print_format json -show_format -show_streams -i filename

    这个命令会输出 带有 streams和format项的json结构

    Python读取json

    1. 用os.popen(strCmd).read() 来获取命令行的输出
    2. 用json.loads 解析json, 这个必须加try。否则某些乱码会导致挂机
    import os,re,json
    # ffprobe 需放置在 system32, not user's PATH
    # 调用ffprobo 获取信息的json格式
    def getJsonString(strFileName):
        strCmd =  'ffprobe -v quiet -print_format json -show_format -show_streams -i "' +  strFileName  + '"'  
        mystring = os.popen(strCmd).read()
        return  mystring
    
    # UnicodeDecodeError: 'utf8' codec can't decode byte 0xc0 in position 57: invalid start byte
    filecontent = getJsonString(strFileName)
    
    try:
        js = json.loads(filecontent)
    except Exception,e:   
        print Exception,":",e, strFileName 
        return

    获取视频信息

    有时候video项中没有bit_rate这一项,这时须要从format项中取

    iVideoWidth = 0
    iVideoHeight = 0
    iVideoBitRate = 0
    iAllBitRate = 0
    strCodecName = ''
    
    
    for stream in arrStreams:
        if(stream['codec_type'] == 'video'):
    
            strCodecName = stream['codec_name']
            iVideoWidth = int(stream['width'])
            iVideoHeight = int(stream['height'])
    
            # h264 可能没有这一项
            if  'bit_rate'  in stream.keys() :
                iVideoBitRate = int (stream['bit_rate'])
    
            break
    
    
    iAllBitRate = int(js['format']['bit_rate'])
    
    print  'CodecName (%s), width(%d), height(%d), video bit_rate(%d), all bit_rate (%d)' % (strCodecName, iVideoWidth, iVideoHeight, iVideoBitRate, iAllBitRate )

    获取目录里的全部文件名

    这个网上比較多,取了一个实现简单的递归版本号

    g_fileList = []
    
    def getFiles(path):
        if os.path.exists(path):   
            files = os.listdir(path)
            for f in files :
                subpath=os.path.join(path,f)
                if os.path.isfile(subpath):
                    g_fileList.append(subpath)
                else:
                    getFiles(subpath) 

    过滤视频文件

    # 按扩展名过滤        
    def filterExname (fileList, arrExtnames):
        filterList = []
        for strFile in fileList:
            strLowFileName = strFile.lower() # 转小写先
    
            for strExtName in arrExtnames :            
                if strLowFileName.endswith(strExtName) :
                    filterList.append(strFile)    
    
        return filterList
    
    g_fileList = []
    
    # 假设是网络路径,能够先映射到本地, python有可能不支持网络路径 \
    getFiles('.')
    
    print 'g_fileList len = ', len(g_fileList)        
    arrExtName = ['.mkv', '.rmvb', '.rm', '.wmv', '.avi', '.mp4', '.mov', '.mpg', '.xvid', '.asf', '.mpeg', '.vob', '.3gp', '.flv', '.ts']
    arrVideoFiles = filterExname (g_fileList, arrExtName)    

    过滤大的码率文件

    # 设置单位像素 比特率 阈值 2.5 - 4.0
    PIEXL_RATE_MAX = 3.9
    
    def isLargeBps(iWidth, iHeight, iBitrate):
        # 基准 每像素字节数
    
        fCurrentBitRatePixel = float(iBitrate) / (iWidth * iHeight)
    
        print  'isNeedConvert input = ', iWidth, iHeight, iBitrate, fCurrentBitRatePixel
        return (fCurrentBitRatePixel > PIEXL_RATE_MAX)

    总结

    大致就是这样,至于输出batch命令行,输出csv结果就不必细讲了。

  • 相关阅读:
    第二期冲刺站立会议个人博客6(2016/5/30)
    第二期冲刺站立会议个人博客5(2016/5/29)
    “进度条”博客——第十三周
    第二次冲刺个人工作总结07
    第二次冲刺个人工作总结06
    第十三周学习进度
    第二次冲刺个人工作总结05
    第二次冲刺个人工作总结04
    课堂实验--贴吧找水王问题续
    第二次冲刺个人工作总结03
  • 原文地址:https://www.cnblogs.com/blfshiye/p/5244893.html
Copyright © 2020-2023  润新知