如何在不直接传递字节流的情况下读取 Excel 文件

发布时间 - 2026-01-09 00:00:00    点击率:

本文介绍解决 pandas `read_excel` 函数因直接传入字节数据(bytes)而触发弃用警告的问题,推荐使用 `bytesio` 封装字节流以构造文件类对象,确保代码兼容未来版本。

当从云存储(如 Azure Blob Storage、AWS S3)或内存中读取 Excel 文件时,常通过 .readall() 或 .getvalue() 获取原始字节(bytes),但 pandas.read_excel() 已明确弃用直接接收 bytes 类型参数的方式,否则会抛出如下警告:

FutureWarning: Passing bytes to 'read_excel' is deprecated and will be removed in a future version. 
To read from a byte string, wrap it in a `BytesIO` object.

✅ 正确做法是将字节数据包装为类文件对象(file-like object),io.BytesIO 是标准且轻量的解决方案:

from io import BytesIO
import pandas as pd

# 假设 blob_data 是来自 Azure BlobServiceClient 的 BlobClient 下载响应
# 或其他返回 bytes 的源(如 requests.get(...).content)
excel_bytes = blob_data.readall()  # type: bytes

# ✅ 关键:用 BytesIO 包装字节流,使其支持 seek()/read() 等文件操作
df = pd.read_excel(BytesIO(excel_bytes), engine='openpyxl')

? 补充说明与最佳实践:

  • 引擎选择:engine='openpyxl' 适用于 .xlsx/.xlsm 文件;若处理旧版 .xls,请改用 engine='xlrd'(注意:xlrd ≥ 2.0 仅支持 .xls,已不再支持 .xlsx);
  • 内存效率优化:若文件较大,避免一次性 .readall() 加载全部内容,可改用流式读取(如 BytesIO(blob_data.read()) 配合分块逻辑),但 read_excel 本身暂不支持真正流式解析,因此 BytesIO 仍是当前最通用、最稳定的方案;
  • 替代库? 目前无主流替代库能绕过此封装步骤——openpyxl、xlrd、pyxlsb 等底层引擎均要求文件路径或类文件对象,而非裸字节;pandas 作为统一接口层,其设计正是基于此约定;
  • 扩展场景:该模式同样适用于 pd.read_csv()、pd.read_json() 等函数处理内存中的二进制数据。

? 总结:不要传 bytes,要传 BytesIO(bytes) —— 这不是权宜之计,而是 Pandas 官方推荐的标准化做法,兼顾向后兼容性与代码健壮性。


# excel  # js  # json  # 字节  # csv  # 云存储  # pandas  # Object  # 封装  # 接口  # 对象  # azure  # 适用于  # 流式  # 权宜之计  # 推荐使用  # 这不是  # 仍是  # 或其他  # 使其  # 而非  # 则会 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: 网站页面设计需要考虑到这些问题  Win11怎么关闭专注助手 Win11关闭免打扰模式设置【操作】  iOS UIView常见属性方法小结  做企业网站制作流程,企业网站制作基本流程有哪些?  Laravel怎么清理缓存_Laravel optimize clear命令详解  网站制作软件免费下载安装,有哪些免费下载的软件网站?  如何在 Pandas 中基于一列条件计算另一列的分组均值  在Oracle关闭情况下如何修改spfile的参数  如何快速搭建高效香港服务器网站?  网站广告牌制作方法,街上的广告牌,横幅,用PS还是其他软件做的?  如何破解联通资金短缺导致的基站建设难题?  零服务器AI建站解决方案:快速部署与云端平台低成本实践  Laravel如何实现多级无限分类_Laravel递归模型关联与树状数据输出【方法】  Laravel如何使用Seeder填充数据_Laravel模型工厂Factory批量生成测试数据【方法】  Laravel Eloquent模型如何创建_Laravel ORM基础之Model创建与使用教程  如何用5美元大硬盘VPS安全高效搭建个人网站?  iOS中将个别页面强制横屏其他页面竖屏  iOS发送验证码倒计时应用  Swift开发中switch语句值绑定模式  如何在 Telegram Web View(iOS)中防止键盘遮挡底部输入框  JavaScript中如何操作剪贴板_ClipboardAPI怎么用  Win11怎么开启自动HDR画质_Windows11显示设置HDR选项  Android滚轮选择时间控件使用详解  Windows Hello人脸识别突然无法使用  手机网站制作平台,手机靓号代理商怎么制作属于自己的手机靓号网站?  php嵌入式断网后怎么恢复_php检测网络重连并恢复硬件控制【操作】  网站建设要注意的标准 促进网站用户好感度!  Claude怎样写结构化提示词_Claude结构化提示词写法【教程】  如何在阿里云部署织梦网站?  中山网站制作网页,中山新生登记系统登记流程?  Python文件操作最佳实践_稳定性说明【指导】  太平洋网站制作公司,网络用语太平洋是什么意思?  DeepSeek是免费使用的吗 DeepSeek收费模式与Pro版本功能详解  Java Adapter 适配器模式(类适配器,对象适配器)优缺点对比  海南网站制作公司有哪些,海口网是哪家的?  如何用搬瓦工VPS快速搭建个人网站?  Laravel怎么定时执行任务_Laravel任务调度器Schedule配置与Cron设置【教程】  如何用腾讯建站主机快速创建免费网站?  Windows11怎样设置电源计划_Windows11电源计划调整攻略【指南】  Laravel Pest测试框架怎么用_从PHPUnit转向Pest的Laravel测试教程  齐河建站公司:营销型网站建设与SEO优化双核驱动策略  Laravel如何处理CORS跨域问题_Laravel项目CORS配置与解决方案  如何在阿里云购买域名并搭建网站?  Laravel怎么使用Collection集合方法_Laravel数组操作高级函数pluck与map【手册】  Laravel怎么创建自己的包(Package)_Laravel扩展包开发入门到发布  如何用IIS7快速搭建并优化网站站点?  laravel怎么使用数据库工厂(Factory)生成带有关联模型的数据_laravel Factory生成关联数据方法  laravel怎么配置Redis作为缓存驱动_laravel Redis缓存配置教程  Laravel如何处理CORS跨域请求?(配置示例)  如何用AWS免费套餐快速搭建高效网站?