php使用curl下载指定大小的文件实例代码

发布时间 - 2026-01-11 03:29:38    点击率:

php中使用基于libcurl的curl函数,可以对目标url发起http请求并获取返回的响应内容。通常的请求方式类似如下的代码:

public function callFunction($url, $postData, $method, header='')
{
  $maxRetryTimes = 3;
  $curl = curl_init();
  /******初始化请求参数start******/
  if(strtoupper($method) !== 'GET' && $postData){
    curl_setopt($curl, CURLOPT_POSTFIELDS, json_encode($postData));
  }elseif (strtoupper($method) === 'GET' && $postData){
    $url .= '?'. http_build_query($postData);
  }
  /******初始化请求参数end******/
  curl_setopt_array($curl, array(
    CURLOPT_URL => $url,
    CURLOPT_TIMEOUT => 10,
    CURLOPT_NOBODY => 0,
    CURLOPT_RETURNTRANSFER => 1
  ));
  if(method == 'POST'){
    curl_setopt($curl, CURLOPT_POST, true);
  }
  if(false == empty()){
    curl_setopt($curl, CURLOPT_HTTPHEADER, $header);
  }
  $response = false;
  while(($response === false) && (--$maxRetryTimes > 0)){
    $response = trim(curl_exec($curl));
  }
  return $response;
}

上面代码中的这个$response是curl发起的这次http请求从$url获取到的数据,如果没有在$header中通过range来指定要下载的大小,无论这个资源多大,那么都要请求完整的并返回的是这个URI的完整内容。通常只用curl来请求求一些接口或者远程调用一个函数获取数据,,所以这个场景下CURLOPT_TIMEOUT这个参数很重要。

对于curl的使用场景不止访问数据接口,还要对任意的url资源进行检测是否能提供正确的http服务。当用户填入的url是一个资源文件时,例如一个pdf或者ppt之类的,这时候如果网络状况较差的情况下用curl请求较大的资源,将不可避免的出现超时或者耗费更多的网络资源。之前的策略是完全下载(curl会下载存储在内存中),请求完后检查内容大小,当超过目标值就把这个监控的任务暂停。这样事发后限制其实治标不治本,终于客户提出了新的需求,不能停止任务只下载指定大小的文件并返回md5值由客户去校验正确性。

经过了一些尝试,解决了这个问题,记录过程如下文。

1、尝试使用 CURLOPT_MAXFILESIZE。

对php和libcurl的版本有版本要求,完全的事前处理,当发现目标大于设置时,直接返回了超过大小限制的错误而不去下载目标了,不符合要求。

2、使用curl下载过程的回调函数。

参考 http://php.net/manual/en/function.curl-setopt-array.php ,最终使用了CURLOPT_WRITEFUNCTION参数设置了on_curl_write,该函数将会1s中被回调1次。

$ch = curl_init();
$options = array(CURLOPT_URL    => 'http://www.php.net/',
CURLOPT_HEADER    => false,
CURLOPT_HEADERFUNCTION  => 'on_curl_header',
CURLOPT_WRITEFUNCTION  => 'on_curl_write'
);

最终我的实现片段:

function on_curl_write($ch, $data)
{
  $pid = getmypid();
  $downloadSizeRecorder = DownloadSizeRecorder::getInstance($pid);
  $bytes = strlen($data);
  $downloadSizeRecorder->downloadData .= $data;
  $downloadSizeRecorder->downloadedFileSize += $bytes;
//  error_log(' on_curl_write '.$downloadSizeRecorder->downloadedFileSize." > {$downloadSizeRecorder->maxSize} \n", 3, '/tmp/hyb.log');
  //确保已经下载的内容略大于最大限制
  if (($downloadSizeRecorder->downloadedFileSize - $bytes) > $downloadSizeRecorder->maxSize) {
    return false;
  }
  return $bytes; //这个不正确的返回,将会报错,中断下载 "errno":23,"errmsg":"Failed writing body (0 != 16384)"
}

DownloadSizeRecorder是一个单例模式的类,curl下载时记录大小,实现返回下载内容的md5等。

class DownloadSizeRecorder
{
  const ERROR_FAILED_WRITING = 23; //Failed writing body
  public $downloadedFileSize;
  public $maxSize;
  public $pid;
  public $hasOverMaxSize;
  public $fileFullName;
  public $downloadData;
  private static $selfInstanceList = array();
  public static function getInstance($pid)
  {
    if(!isset(self::$selfInstanceList[$pid])){
      self::$selfInstanceList[$pid] = new self($pid);
    }
    return self::$selfInstanceList[$pid];
  }
  private function __construct($pid)
  {
    $this->pid = $pid;
    $this->downloadedFileSize = 0;
    $this->fileFullName = '';
    $this->hasOverMaxSize = false;
    $this->downloadData = '';
  }
  /**
   * 保存文件
   */
  public function saveMaxSizeData2File(){
    if(empty($resp_data)){
      $resp_data = $this->downloadData;
    }
    $fileFullName = '/tmp/http_'.$this->pid.'_'.time()."_{$this->maxSize}.download";
    if($resp_data && strlen($resp_data)>0)
    {
      list($headerOnly, $bodyOnly) = explode("\r\n\r\n", $resp_data, 2);
      $saveDataLenth = ($this->downloadedFileSize < $this->maxSize) ? $this->downloadedFileSize : $this->maxSize;
      $needSaveData = substr($bodyOnly, 0, $saveDataLenth);
      if(empty($needSaveData)){
        return;
      }
      file_put_contents($fileFullName, $needSaveData);
      if(file_exists($fileFullName)){
        $this->fileFullName = $fileFullName;
      }
    }
  }
  /**
   * 返回文件的md5
   * @return string
   */
  public function returnFileMd5(){
    $md5 = '';
    if(file_exists($this->fileFullName)){
      $md5 = md5_file($this->fileFullName);
    }
    return $md5;
  }
  /**
   * 返回已下载的size
   * @return int
   */
  public function returnSize(){
    return ($this->downloadedFileSize < $this->maxSize) ? $this->downloadedFileSize : $this->maxSize;
  }
  /**
   * 删除下载的文件
   */
  public function deleteFile(){
    if(file_exists($this->fileFullName)){
      unlink($this->fileFullName);
    }
  }
}

curl请求的代码实例中,实现限制下载大小

……
curl_setopt($ch, CURLOPT_WRITEFUNCTION, 'on_curl_write');//设置回调函数
……
$pid = getmypid();
$downloadSizeRecorder = DownloadSizeRecorder::getInstance($pid);
$downloadSizeRecorder->maxSize = $size_limit;
……
//发起curl请求
$response = curl_exec($ch);
……
//保存文件,返回md5
$downloadSizeRecorder->saveMaxSizeData2File(); //保存
$downloadFileMd5 = $downloadSizeRecorder->returnFileMd5();
$downloadedfile_size = $downloadSizeRecorder->returnSize();
$downloadSizeRecorder->deleteFile();

到这里,踩了一个坑。增加了on_curl_write后,$response会返回true,导致后面取返回内容的时候异常。好在已经实时限制了下载的大小,用downloadData来记录了已经下载的内容,直接可以使用。

if($response === true){
  $response = $downloadSizeRecorder->downloadData;
}

总结

以上所述是小编给大家介绍的php使用curl下载指定大小的文件,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!


# php  # curl  # 下载  # 文件  # php使用curl实现ftp文件下载功能  # php使用curl模拟浏览器表单上传文件或者图片的方法  # PHP使用curl请求实现post方式上传图片文件功能示例  # PHP实现通过CURL上传文件功能示例  # 可兼容php5与php7的cURL文件上传功能实例分析  # PHP5.0~5.6 各版本兼容性cURL文件上传功能实例分析  # PHP使用curl模拟post上传及接收文件的方法  # php curl 上传文件代码实例  # php下利用curl判断远程文件是否存在的实现代码  # PHP使用CURL实现下载文件功能示例  # 是一个  # 回调  # 将会  # 小编  # 的是  # 保存文件  # 治标不治本  # 都要  # 在此  # 这个问题  # 不去  # 提出了  # 就把  # 给大家  # 如果没有  # 很重要  # 多大  # 可以使用  # 不符合  # 要对 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: Chrome浏览器标签页分组怎么用_谷歌浏览器整理标签页技巧【效率】  Laravel如何使用Gate和Policy进行权限控制_Laravel权限判定与策略规则配置  JavaScript模板引擎Template.js使用详解  Midjourney怎么调整光影效果_Midjourney光影调整方法【指南】  海南网站制作公司有哪些,海口网是哪家的?  如何在宝塔面板中创建新站点?  Windows家庭版如何开启组策略(gpedit.msc)?(安装方法)  linux写shell需要注意的问题(必看)  手机网站制作平台,手机靓号代理商怎么制作属于自己的手机靓号网站?  如何用5美元大硬盘VPS安全高效搭建个人网站?  Laravel Docker环境搭建教程_Laravel Sail使用指南  成都品牌网站制作公司,成都营业执照年报网上怎么办理?  Laravel怎么自定义错误页面_Laravel修改404和500页面模板  html5audio标签播放结束怎么触发事件_onended回调方法【教程】  米侠浏览器网页背景异常怎么办 米侠显示修复  制作无缝贴图网站有哪些,3dmax无缝贴图怎么调?  用yum安装MySQLdb模块的步骤方法  JavaScript中的标签模板是什么_它如何扩展字符串功能  如何自定义建站之星模板颜色并下载新样式?  开心动漫网站制作软件下载,十分开心动画为何停播?  b2c电商网站制作流程,b2c水平综合的电商平台?  Laravel如何集成第三方登录_Laravel Socialite实现微信QQ微博登录  浅析上传头像示例及其注意事项  Laravel Blade组件怎么用_Laravel可复用视图组件的创建与使用  jimdo怎样用html5做选项卡_jimdo选项卡html5实现与切换效果【指南】  如何在七牛云存储上搭建网站并设置自定义域名?  Laravel如何发送邮件和通知_Laravel邮件与通知系统发送步骤  网站制作大概要多少钱一个,做一个平台网站大概多少钱?  Laravel Fortify是什么,和Jetstream有什么关系  微信小程序 闭包写法详细介绍  如何在腾讯云服务器上快速搭建个人网站?  QQ浏览器网页版登录入口 个人中心在线进入  Python结构化数据采集_字段抽取解析【教程】  JS中使用new Date(str)创建时间对象不兼容firefox和ie的解决方法(两种)  js实现点击每个li节点,都弹出其文本值及修改  济南网站建设制作公司,室内设计网站一般都有哪些功能?  什么是JavaScript解构赋值_解构赋值有哪些实用技巧  如何将凡科建站内容保存为本地文件?  香港服务器建站指南:免备案优势与SEO优化技巧全解析  悟空浏览器如何设置小说背景色_悟空浏览器背景色设置【方法】  Angular 表单中正确绑定输入值以确保提交与验证正常工作  如何在不使用负向后查找的情况下匹配特定条件前的换行符  Laravel如何实现密码重置功能_Laravel密码找回与重置流程  MySQL查询结果复制到新表的方法(更新、插入)  购物网站制作费用多少,开办网上购物网站,需要办理哪些手续?  Java Adapter 适配器模式(类适配器,对象适配器)优缺点对比  公司网站制作价格怎么算,公司办个官网需要多少钱?  Laravel如何构建RESTful API_Laravel标准化API接口开发指南  Laravel事件和监听器如何实现_Laravel Events & Listeners解耦应用的实战教程  SQL查询语句优化的实用方法总结