• PHP文件上传处理逻辑


    文件名字处理

    文件名字得看业务要求。不需要保留原始名字,则随机生成名字,拼接上白名单校验过的后缀即可。

    反之要谨慎处理:

    1. //允许上传的后缀白名单
    2. $extension_white_list = ['jpg', 'pdf'];
    3. //原始文件的名字
    4. $origin_file_name = 'xx/xxx/10月CPI同比上涨2.1%.php.pdf';
    5. //提取文件后缀,并校验是否在白名单内
    6. $extension = strtolower(pathinfo($origin_file_name, PATHINFO_EXTENSION));
    7. if (!in_array($extension, $extension_white_list)) {
    8.     die('错误的文件类型');
    9. }
    10. //提取文件名
    11. $new_file_name = pathinfo($origin_file_name, PATHINFO_BASENAME);
    12. //截取掉后缀部分
    13. $new_file_name = mb_substr($new_file_name, 0, mb_strlen($new_file_name) - 1 - mb_strlen($extension));
    14. //只保留有限长度的名字
    15. $new_file_name = mb_substr($new_file_name, 0, 20);
    16. //替换掉所有的 . 避免攻击者构造多后缀的文件,缺点是文件名不能包含 .
    17. $new_file_name = str_replace('.', '_', $new_file_name);
    18. //把处理过的名字和后缀拼接起来构造成一个名字
    19. $new_file_name = $new_file_name . '.' . $extension;
    20. print_r($new_file_name); //10月CPI同比上涨2_1%_php.pdf

    文件内容处理

    文件后缀只是表面,一个 php 文件,把后缀改成 jpg,也改变不了它携带 php 代码的事实。

    针对图片文件,可以读取图片文件头判断图片类型,当然我也没测试过这个方法,感兴趣的可以自测。

    另外即便上述方法可行,依然可以绕过,只要在 php 文件的头部写入某个图片类型的头部特征的字节即可伪装。

    针对图片文件内容处理,真正的大招是重绘图片。

    windows 系统下用 copy 命令可以制作一个包含 php 代码的图片文件,命令如下:

    Copy 1.jpg/b + test.php/a 2.jpg

    上述命令的意思是,把 test.php 合并到 1.jpg 的尾部,并重新导出到 2.jpg 里面,如此一来,这个 2.jpg 就是一个包含 php 代码的图片文件,可以用记事本打开它,拖滚动条到底部看到 php 代码。

    像这种不干净的图片,用重绘图片的方式可以剔除掉不干净的部分。下面是重绘图片的 php 代码:

    1. try {
    2.     $jpg = '包含php代码的.jpg';
    3.     list($width, $height) = getimagesize($jpg);
    4.     $im = imagecreatetruecolor($width, $height);
    5.     $image = imagecreatefromjpeg($jpg);
    6.     imagecopyresampled($im, $image, 0, 0, 0, 0, $width, $height, $width, $height);
    7.     $target = '重绘后干净的图片.jpg';
    8.     imagejpeg($image, $target);
    9. } finally {
    10.     isset($im) && is_resource($im) && imagedestroy($im);
    11. isset($image) && is_resource($image) && imagedestroy($image);
    12. }

    这个处理办法的缺点是,耗费内存,图片失真,而且只能处理图片。

    当然其它的文件格式,我也不知道能不能用重绘的思路去处理。

    文件权限处理

    只讨论 Linux 下的权限,先简单介绍 Linux 的权限:

    1. 读取,字母 r 或数字 4 表示
    2. 写入,字母 w 或数字 2 表示
    3. 执行,字母 x 或数字 1 表示

    对文件来讲,rwx 是如下含义:

    1. r:可打开读取此文件
    2. w:可写入此文件
    3. x:可执行此文件

    对目录来讲,rwx 的含义又有点差别:

    1. r:可读取此目录的内容列表
    2. w:可在此目录里面进行:增、删、改文件和子目录
    3. x:可进入此目录

    另外 Linux 里面,针对一个文件,用户是会被分成三种,分别是:创建该文件的用户、和创建该文件的用户处于同一用户组的用户、既不是创建者也不是同一个小组的其它用户。

    有了对 Linux 的权限了解,针对上传的文件所在的目录,应该设定 755 权限,表示:

    • 创建该目录的用户有读取、写入、进入此目录的权限

    • 和创建该目录的用户处于同一用户组的用户有读取、进入此目录的权限

    • 既不是创建者也不是同一个小组的其它用户有读取、进入此目录的权限

    755 的权限设定,可以让 nginx 代理静态文件的时候不会报 403 错误。

    代码示例:

    mkdir($save_path, 0755, true);

    针对上传的文件,采用更严格的权限设定,应该设定 644 权限,表示:

    • 创建该文件的用户有读取、写入此文件的权限,无法执行

    • 和创建该文件的用户处于同一用户组的用户只有读取权限

    • 既不是创建者也不是同一个小组的其它用户只有读取权限

    644 的权限设定,可以确保即便是上传了一个非法文件也无法串改内容、执行。

    代码示例:

    chmod($file, 0644);

  • 相关阅读:
    Cookie注入和X-Forwarded-For注入
    贪心算法-均分纸牌-JAVA
    rosjava零散
    1 秒完成授权,Authing 全新上线一键登录功能
    C++模板编程(15)---模板解析(Parsing Templates)
    【单片机】单片机入门指南
    VFS-FUSE用户态文件系统设计说明
    .NET Core 中插件式开发实现
    代码审计(某个人发卡系统V6.0(php))
    Spring八股 常见面试题
  • 原文地址:https://blog.csdn.net/lwf3115841/article/details/128078393