首页 游戏 软件 资讯 排行榜 专题
首页
编程语言
Python3.12怎么快速遍历深层目录下的所有文件_使用os.walk与glob递归检索

Python3.12怎么快速遍历深层目录下的所有文件_使用os.walk与glob递归检索

热心网友
92
转载
2026-05-06

Python3.12怎么快速遍历深层目录下的所有文件_使用os.walk与glob递归检索

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在文件系统操作中,os.walk 通常比 glob(“**/”) 更稳健。原因在于,os.walk 是原生为目录遍历设计的,天生支持错误捕获,能自动跳过不可读的目录。反观 glob,要实现递归必须显式设置 recursive=True,一旦遇到权限拒绝或路径过长等问题,往往会直接抛出异常导致整个遍历过程中断。

os.walk 为什么比 glob(“**/*”) 更稳?

这里有个关键点:在 Python 3.12 里,glob.glob 默认并不支持递归通配符 **,必须手动传入 recursive=True 才行。即便开启了递归,它在面对权限问题、符号链接循环或者超长路径时,也容易直接抛出 FileNotFoundErrorOSError,让整个任务戛然而止。相比之下,os.walk 的“体质”就强韧得多——它本就是为遍历目录而生的,不仅能捕获错误,路径控制也更灵活,无需额外参数就能自然地跳过那些无法访问的文件夹。

几个实操建议,能让你用得更顺手:

  • 使用 os.walk 时,保持 topdown=True(这是默认值)。这让你能在进入子目录前,就提前过滤掉不想处理的路径,比如轻松跳过 .git 目录。
  • 如果只需要遍历文件(不包括目录本身),记得处理每一层返回的 files 列表,可别误用了 dirs 列表。
  • 遇到 PermissionError 怎么办?可以用 try/except 块把 os.walk 的调用包起来,或者更优雅地,使用 os.walk(..., onerror=handler) 来指定错误处理函数。

glob(“**/*”, recursive=True) 的三个关键限制

在 Python 3.12 下使用 glob.glob 进行递归,recursive=True 这个参数是必须的,否则 ** 会被当作普通字符处理——这大概是新手最容易踩的坑。除此之外,它还有两个不那么明显的限制:

  • 路径类型受限:它接受的路径必须是字符串,不能直接是 pathlib.Path 对象,否则会报 TypeError
  • 不区分对象类型**/* 这个模式会同时匹配文件和目录。如果你只想获取文件,就得额外用 os.path.isfile()pathlib.Path.is_file() 做一遍过滤。
  • 错误处理脆弱:其底层依赖 os.listdir,但不会像 os.walk 那样自动跳过无法访问的子目录。一旦某个子目录打不开,整个 glob 调用就会宣告失败。

来看个例子:正确的写法是 glob.glob(“src/**/*”, recursive=True)。而 glob.glob(“src/**/*”)(缺少参数)或 glob.glob(Path(“src”) / “**” / “*”)(类型错误)都是行不通的。

立即学习“Python免费学习笔记(深入)”;

怎么安全地拿到所有文件路径(含绝对路径、相对路径、大小)?

实际开发中,需求往往不只是列出路径那么简单,我们通常还需要快速获取文件的元信息,比如大小。这时,os.walk 配合 os.path.joinos.stat 的组合,堪称最轻量高效的方案:

import os
for root, dirs, files in os.walk(“project”):
    for f in files:
        path = os.path.join(root, f)
        try:
            st = os.stat(path)
            print(f”{path} {st.st_size}”)
        except (OSError, FileNotFoundError):
            continue  # 跳过无法 stat 的文件(如被删除、权限不足)

有个细节值得注意:os.stat 通常比 pathlib.Path(path).stat() 略快一些,而且不会触发任何隐式的路径解析。如果你已经在使用 pathlibp.resolve() 之前,先判断路径是否存在,否则 resolve() 方法本身也可能抛出异常。

Windows 下路径分隔符和编码问题怎么避坑?

Python 3.12 在 Windows 上依然默认使用反斜杠 \ 作为路径分隔符,不过好消息是,globos.walk 都接受正斜杠 / 作为输入,它们会在内部自动完成转换。真正需要警惕的坑在这里:

  • 当使用 glob 匹配包含中文或特殊符号的路径时,务必确保源字符串是 UTF-8 编码。一个简单的做法是在脚本开头加上 # -*- coding: utf-8 -*-,否则 Windows 控制台可能会解码失败。
  • os.walk 返回的 rootdirsfiles 都是 str 类型,而非 bytes。但如果路径本身包含非法字节(这种情况比较罕见),os.walk 会直接跳过该层级且不报错——这给调试带来了困难。因此,在处理复杂路径时,优先考虑使用 pathlib.Path 来替代原始的字符串操作。
  • 避免在拼接路径时混用 \/。统一使用 os.path.join() 或者 pathlib.Path / “sub” 的写法,能让代码更清晰、更安全。

最后,关于目录深度:理论上嵌套层数没有上限,但 Windows 对单个路径的长度限制在 260 个字符(除非启用了长路径支持)。这时,os.walkglob 的表现会截然不同——os.walk 会默默跳过超长路径,而 glob 则会直接报错。这个差异在进行自动化批量处理时,显得尤为关键。

来源:https://www.php.cn/faq/2323869.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Python怎么将多个特征处理步骤组合_FeatureUnion合并多种提取器
编程语言
Python怎么将多个特征处理步骤组合_FeatureUnion合并多种提取器

Python怎么将多个特征处理步骤组合_FeatureUnion合并多种提取器 FeatureUnion 在 scikit-learn 中早已被弃用 先说一个明确的结论:FeatureUnion 这个工具,从 scikit-learn 1 2 版本开始就被官方标记为弃用(deprecated)了。如

热心网友
05.06
Python如何监听全局键盘按键实现自动化快捷键触发
编程语言
Python如何监听全局键盘按键实现自动化快捷键触发

Python如何监听全局键盘按键实现自动化快捷键触发 你是否希望在Python中设置一个全局快捷键?例如,无论你当前正在编辑文档、浏览网页还是运行游戏,只需按下Ctrl+Shift+X这样的组合键,就能自动执行预设的自动化任务。这个需求听起来直观,但在实际开发中,会面临跨平台兼容性、系统权限以及逻辑

热心网友
05.06
Python如何统计分组内不重复的元素个数_聚合时指定nunique统计函数
编程语言
Python如何统计分组内不重复的元素个数_聚合时指定nunique统计函数

Python分组去重计数:掌握nunique()函数,提升数据分析效率 在数据分析工作中,按组统计唯一值数量是一项常见且关键的任务。例如,分析每个产品类别下的独立访客数,或计算每个销售区域每年上架的不同商品种类。此时,pandas库中的nunique()函数便成为高效解决此类问题的首选工具。 nun

热心网友
05.06
Python自动化识别验证码图片_tesseract-ocr实现OCR识别
编程语言
Python自动化识别验证码图片_tesseract-ocr实现OCR识别

Tesseract OCR 识别失败的核心原因在于输入图像质量不佳且缺乏针对性预处理。必须进行二值化、形态学去噪、倾斜校正等操作,并配合使用 --psm 8 参数和字符白名单;通过 Python 调用时需显式传递配置参数,在 Windows 系统上还需指定 tesseract_cmd 路径;调试过程

热心网友
05.06
Python怎么销毁一个对象_探究__del__析构函数与垃圾回收机制
编程语言
Python怎么销毁一个对象_探究__del__析构函数与垃圾回收机制

Python对象销毁机制详解:__del__析构函数与垃圾回收的正确使用 Python中__del__方法的局限性:为何它不是可靠的销毁钩子 需要明确的是,Python的__del__方法**无法保证一定会被执行**,因此不适合用于释放文件句柄、网络连接或数据库事务等关键系统资源。它仅仅是CPyth

热心网友
05.06

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

史上最长寿标准版!iP17生产周期延长:苹果刀法变了
科技数码
史上最长寿标准版!iP17生产周期延长:苹果刀法变了

iPhone 17:为何成为苹果史上最长寿的爆款? 最近科技圈有个消息传得挺热:iPhone 17标准版的生产周期被大幅拉长了。这可不是简单的产能调整,背后是苹果近期完成的大规模产能扩展。看来,这款热门机型已经瞄准了今年下半年的双11战场,准备再掀一波销售热潮。 消息一出,不少网友都在猜测原因。矛头

热心网友
05.06
小米有品新款mini智能电动平衡车深度体验:便携智能,解锁城市出行新方式
科技数码
小米有品新款mini智能电动平衡车深度体验:便携智能,解锁城市出行新方式

在快节奏的都市生活中,一款兼具便携性与环保特性的出行工具正成为越来越多人的选择 城市通勤的“最后一公里”难题,催生了对灵活出行方案的持续探索。近期,小米有品推出的mini智能电动平衡车,以其独特的设计理念和深度智能化功能,迅速吸引了市场的目光。它不仅仅是一款酷玩装备,更切实地为青少年和上班族提供了高

热心网友
05.06
护眼与智能兼备:科大讯飞AI学习机深度评测,为孩子选对学习好帮手
科技数码
护眼与智能兼备:科大讯飞AI学习机深度评测,为孩子选对学习好帮手

在数字化教育蓬勃发展的当下,家长们为孩子挑选学习设备时,既希望设备具备护眼功能,又期望能满足多样化的学习需求。传统平板电脑功能虽丰富,但长时间使用易引发视力疲劳;普通学习机功能又相对单一,难以契合现代教育的发展趋势。在此背景下,科大讯飞AI学习机系列凭借先进的护眼技术与智能学习系统,成为众多家长和学

热心网友
05.06
以太坊(ETH)财库黑马ETHZilla解析:蒂尔和EF深度加持 mNAV高达6
web3.0
以太坊(ETH)财库黑马ETHZilla解析:蒂尔和EF深度加持 mNAV高达6

目录 ethzilla是谁? ETHZilla独特其他ETH DAT之处 1、Peter Thiel持股ETHZilla近30% 2、Vitalik和以太坊基金会入局 3、聚焦DeFi和链上策略 结语 以太坊财库概念的热度,最近真是肉眼可见。伴随着这股热潮,ETH价格也强势突破了4700美元,距离历

热心网友
05.06
国内彩电一年仅卖2763万台 创10年新低
科技数码
国内彩电一年仅卖2763万台 创10年新低

全球彩电市场:存量博弈下的冰与火之歌 最近,行业调研机构奥维睿沃(A VC Revo)发布了一份引人关注的报告,揭示了2025年全球彩电市场的真实图景。数据显示,全球彩电整体出货量达到2 64亿台,同比仅微跌0 1%,市场基本盘看似稳固。 然而,拆开来看,内部结构正在发生深刻变化。LCD液晶电视依然

热心网友
05.06