• 通过文件头准确识别PHP上传的文件类型


    通过文件头准确识别PHP上传的文件类型

    在做web应用时候,通过web扩展名判断上存文件类型,这个是我们常使用的。有时候我们这样做还不完善。可能有些人上存一些文件,但是他通过修改扩展名,让在我们的文件类型之内。 单实际访问时候又不能展示(因为扩展名与文件内容不符)。下面这个php类,可能能够给我们带来帮助。

    首先说明下,上面文件头与文件类型映射关系来自网上,如果你有新的文件需要检查,只需要将映射加入即可。 如果你需要知道文件头信息,可以通过工具:winhex打开标准文件查找。如:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    <?php     
                   
    /*通过文件名,获得文件类型*    
    *@author chengmo QQ:8292669*    
    *@copyright <A href="http://www.xuehuwang.com">http://www.xuehuwang.com/</A> 2010-10-17    
    *@version 0.1    
    *$filename="d:/1.png";echo cFileTypeCheck::getFileType($filename); 打印:png    
    */
    class cFileTypeCheck    
    {    
        private static $_TypeList=array();    
        private static $CheckClass=null;    
        private function __construct($filename)    
        {    
            self::$_TypeList=$this->getTypeList();    
        }    
                   
        /**    
         *处理文件类型映射关系表*    
         *    
         * @param string $filename 文件类型    
         * @return string 文件类型,没有找到返回:other    
         */
        private function _getFileType($filename)    
        {    
            $filetype="other";    
            if(!file_exists($filename)) throw new Exception("no found file!");    
            $file = @fopen($filename,"rb");    
            if(!$file) throw new Exception("file refuse!");    
            $bin = fread($file, 15); //只读15字节 各个不同文件类型,头信息不一样。    
            fclose($file);    
                           
            $typelist=self::$_TypeList;    
            foreach ($typelist as $v)    
            {    
                $blen=strlen(pack("H*",$v[0])); //得到文件头标记字节数    
                $tbin=substr($bin,0,intval($blen)); ///需要比较文件头长度    
                               
                if(strtolower($v[0])==strtolower(array_shift(unpack("H*",$tbin))))     
                {    
                    return $v[1];    
                }    
            }    
            return $filetype;    
        }    
                       
        /**    
         *得到文件头与文件类型映射表*    
         *    
         * @return array array(array('key',value)...)    
         */
        public function getTypeList()    
        {    
            return array(array("FFD8FFE1","jpg"),    
            array("89504E47","png"),    
            array("47494638","gif"),    
            array("49492A00","tif"),    
            array("424D","bmp"),    
            array("41433130","dwg"),    
            array("38425053","psd"),    
            array("7B5C727466","rtf"),    
            array("3C3F786D6C","xml"),    
            array("68746D6C3E","html"),    
            array("44656C69766572792D646174","eml"),    
            array("CFAD12FEC5FD746F","dbx"),    
            array("2142444E","pst"),    
            array("D0CF11E0","xls/doc"),    
            array("5374616E64617264204A","mdb"),    
            array("FF575043","wpd"),    
            array("252150532D41646F6265","eps/ps"),    
            array("255044462D312E","pdf"),    
            array("E3828596","pwl"),    
            array("504B0304","zip"),    
            array("52617221","rar"),    
            array("57415645","wav"),    
            array("41564920","avi"),    
            array("2E7261FD","ram"),    
            array("2E524D46","rm"),    
            array("000001BA","mpg"),    
            array("000001B3","mpg"),    
            array("6D6F6F76","mov"),    
            array("3026B2758E66CF11","asf"),    
            array("4D546864","mid"));    
        }    
                   
        public static function   getFileType($filename)    
        {    
            if(!self::$CheckClass) self::$CheckClass=new self($filename);    
            $class=self::$CheckClass;    
            return $class->_getFileType($filename);    
        }    
    }

    通过WinHex软件来获取文件的头信息:

    可以看到:png 文件,头是4个字节(头标记是多少字节需要自己查相关资料确定),对应是:89504E47

    调用方法:

    1
    2
    3
    4
    $filename="d:/1.png";
    echo $filename,"\t",cFileTypeCheck::getFileType($filename),"\r\n";
    $filename="d:/test.doc";
    echo $filename,"\t",cFileTypeCheck::getFileType($filename),"\r\n";

    输出为:

    1
    2
    d:/1.png    png
    d:/test.doc    xls/doc
  • 相关阅读:
    进程与线程的介绍
    内存结构篇:直接内存
    内存结构篇:方法区
    内存结构篇:堆
    内存结构篇:本地方法栈
    内存结构篇:虚拟机栈
    内存结构篇:程序计数器
    Error: Rule can only have one resource source (provided resource and test + include + exclude) in {
    iview-admin(cli3 + webpack4 )解决兼容ie9+ 方案
    日期插件 js
  • 原文地址:https://www.cnblogs.com/fx2008/p/2974913.html
Copyright © 2020-2023  润新知