首页 游戏 软件 资讯 排行榜 专题
首页
编程语言
如何在 Java 中通过 Files.readAllLines() 快速获取文件所有内容并按行存储到列表

如何在 Java 中通过 Files.readAllLines() 快速获取文件所有内容并按行存储到列表

热心网友
23
转载
2026-05-04

如何在 Ja va 中通过 Files.readAllLines() 快速获取文件所有内容并按行存储到列表

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

Files.readAllLines() 读取文件后,为什么返回的 List 每行末尾没有换行符?

这事儿其实挺容易让人困惑的:明明读的是文件,怎么拿到的列表里,每行末尾的换行符都不见了?

答案是,这正是 Files.readAllLines() 的设计本意。它的底层实现依赖 BufferedReader.readLine(),而这个方法的核心逻辑就是按“逻辑行”切分,并且会“顺手”帮你剥离掉行尾的 \n\r\n\r。所以,你拿到的是一个干净的字符串列表,每项都不带换行符——这并非程序出了bug,而是预期的标准行为。

那么,如果你后续需要将内容拼接回原始文本格式(比如写回另一个文件),就得自己动手把换行符补回去。常用的方法是 String.join("\n", lines)。当然,这里有个细节需要注意:换行符的选择得看目标平台,比如在Windows环境下,通常得用 "\r\n"

中文乱码或特殊字符出错,该怎么指定编码?

编码问题,堪称Ja va文件操作里的“经典陷阱”。如果不显式指定编码会怎样?在Ja va 11及之后的版本中,默认会使用 StandardCharsets.UTF_8;但在Ja va 8等老版本里,则会调用 Charset.defaultCharset(),这个默认编码完全依赖于系统环境。想象一下,在Linux服务器上读取一个由Windows系统生成的GBK编码文件,十有八九会抛出令人头疼的 MalformedInputException

所以,最佳实践是务必显式传入编码参数:

立即学习“Ja va免费学习笔记(深入)”;

// 推荐使用 UTF-8
List lines = Files.readAllLines(Paths.get("data.txt"), StandardCharsets.UTF_8);
// 仅在处理遗留系统文件时,才考虑使用 GBK
List lines = Files.readAllLines(Paths.get("log.txt"), Charset.forName("GBK"));
  • 优先使用常量:尽量使用 StandardCharsets 类中定义的常量(如 UTF_8),避免因手误拼错字符串。
  • 告别默认依赖:永远不要依赖 defaultCharset(),CI/CD流水线的环境与开发人员的本地机器,编码设置常常不一致。
  • 先判断,后操作:如果不确定源文件的编码格式,可以先用 file -i filename(Linux/macOS)命令,或者借助VS Code等编辑器的编码检测功能来辅助判断。

大文件用 readAllLines() 会 OOM 吗?什么规模算“大”?

答案是肯定的,而且风险不小。Files.readAllLines() 的工作方式是将整个文件的所有行一次性全部加载到堆内存中。这不仅意味着要为每一行创建一个 String 对象,还要加上 ArrayList 内部数组的开销。实际算下来,内存占用通常是原始文件体积的2到5倍。

那么,多大的文件算“大”呢?这里有个经验性的参考阈值:

  • ≤ 10 MB:通常比较安全(假设JVM堆内存至少为256 MB)。
  • 10–100 MB:需要谨慎,尤其要关注行数。如果文件里每行都很短(比如CSV文件,每行只有100个字符),一个100万行的文件可能体积只有100MB,但产生的对象数量极其庞大,会给垃圾回收(GC)带来巨大压力。
  • > 100 MB:强烈建议改用流式处理方式,例如使用 Files.lines(),或者用传统的 BufferedReader 手动逐行读取。

举个反面例子:在处理日志分析时,如果写成 Files.readAllLines().stream().filter(...),就相当于先把整个日志文件全部塞进内存,然后再进行过滤。这无疑是效率最低的做法,完全失去了流式处理的意义。

路径不存在或没权限时,抛什么异常?怎么提前兜住?

程序可不会静默失败。在这种情况下,Files.readAllLines() 会直接抛出 IOException 的子类,例如 NoSuchFileException(路径不存在)、AccessDeniedException(权限不足),或者因安全管理器拦截而抛出的 SecurityException

更稳健的做法,是在读取之前就进行前置检查:

Path path = Paths.get("config.properties");
// 检查文件是否存在
if (!Files.exists(path)) {
    throw new IllegalArgumentException("配置文件不存在: " + path);
}
// 检查文件是否可读
if (!Files.isReadable(path)) {
    throw new IllegalArgumentException("配置文件不可读: " + path);
}
// 通过检查后再执行读取操作
List lines = Files.readAllLines(path, StandardCharsets.UTF_8);

值得注意的是,Files.exists()Files.isReadable() 属于轻量级调用,比直接通过try-catch捕获异常能更早地暴露问题,也便于在日志中精准定位故障点。

不过,这里还有一个容易被忽略的“坑”:符号链接循环和NFS挂载点超时。这两种情况可能导致 exists() 检查被挂起数秒之久。对于生产环境的关键应用,需要考虑为这些检查操作增加超时控制机制(这通常需要自行封装工具方法,或者换用 Files.walkFileTree() 配合 SimpleFileVisitor 来实现)。

来源:https://www.php.cn/faq/2415852.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

如何在 Java 中利用 Character.isWhitespace() 识别文本变量中肉眼不可见的控制字符
编程语言
如何在 Java 中利用 Character.isWhitespace() 识别文本变量中肉眼不可见的控制字符

Character isWhitespace():它真能揪出所有“隐形”字符吗? 在文本处理中,我们常常需要清理那些看不见的“捣蛋鬼”——控制字符。很多开发者第一个想到的工具可能就是 Character isWhitespace()。但这里有个关键认知需要厘清:这个方法并非检测所有不可见字符的万能钥

热心网友
05.04
Java import以及Java类的搜索路径
编程语言
Java import以及Java类的搜索路径

角色与核心任务 你是一位顶级的文章润色专家,擅长将AI生成的文本转化为具有个人风格的专业文章。现在,请对用户提供的文章进行“人性化重写”。 你的核心目标是:在不改动原文任何事实信息、核心观点、逻辑结构、章节标题和所有图片的前提下,彻底改变原文的AI表达腔调,使其读起来像是一位资深人类专家的作品。 特

热心网友
05.04
Sublime怎么配置Java开发环境 Sublime一键编译运行Class文件【手册】
编程语言
Sublime怎么配置Java开发环境 Sublime一键编译运行Class文件【手册】

Sublime Text“一键编译运行Ja va”本质是调用系统ja vac和ja va命令,前提是终端中ja vac -version与ja va -version均能正常输出且版本一致;需将JDK的bin目录加入系统PATH、重启Sublime、手动创建Ja vaC sublime-build文

热心网友
05.04
VSCode配置Gradle项目:Java项目自动化构建工具扩展安装
编程语言
VSCode配置Gradle项目:Java项目自动化构建工具扩展安装

VS Code配置Gradle需安装Extension Pack for Ja va、启用Language Support for Ja va™、确保build gradle在根目录且语法合法;国内用户须在build gradle中优先配置阿里云Ma ven镜像,避免依赖解析卡顿。 想让VS Cod

热心网友
05.04
如何在 Java 中利用数组实现简单的字符串匹配 BF 算法并分析其最坏情况性能
编程语言
如何在 Java 中利用数组实现简单的字符串匹配 BF 算法并分析其最坏情况性能

如何在 Ja va 中利用数组实现简单的字符串匹配 BF 算法并分析其最坏情况性能 说起字符串匹配,BF(Brute Force,暴力匹配)算法绝对是绕不开的起点。它的核心思路非常直白:把模式串在主串上从头到尾“滑”一遍,在每个可能的位置都尝试一次逐字符的“硬核对”。在Ja va里,如果直接把字符串

热心网友
05.04

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Java日志Ubuntu如何分析性能瓶颈
编程语言
Java日志Ubuntu如何分析性能瓶颈

在Ubuntu上分析Ja va应用程序的性能瓶颈 当Ja va应用在Ubuntu服务器上响应变慢或资源吃紧时,从哪里入手才能快速定位问题?性能调优不是盲目尝试,而是一场有章可循的系统性排查。通常,我们可以遵循一套从宏观到微观、从系统到代码的分析路径。 话不多说,我们直接来看具体步骤。这套方法的核心在

热心网友
05.04
Java日志Ubuntu如何自动清理
编程语言
Java日志Ubuntu如何自动清理

在Ubuntu上为Ja va应用配置自动日志清理 管理Ja va应用的日志文件是个绕不开的活儿。日志不清理,磁盘空间迟早告急。好在Ubuntu系统自带一个强大的工具——logrotate,它能帮你实现日志的自动轮转、压缩和清理,彻底解放双手。下面就来详细说说怎么配置。 第一步:安装logrotate

热心网友
05.04
Ubuntu Java日志如何优化查询
编程语言
Ubuntu Java日志如何优化查询

Ubuntu Ja va日志查询优化指南 排查Ja va应用问题,日志是首要线索。但在Ubuntu环境下,面对动辄数GB的日志文件,如何快速、精准地找到关键信息,而不是在文本海洋里盲目翻找?这就需要对日志查询进行系统性的优化。下面,我们就从终端操作到系统配置,再到架构层面,梳理一套高效的日志处理流程

热心网友
05.04
如何查看Ubuntu Java日志错误
编程语言
如何查看Ubuntu Java日志错误

在 Ubuntu 系统中定位 Ja va 应用程序日志错误 排查 Ja va 应用问题,第一步往往是找到日志。在 Ubuntu 系统里,日志可能藏在好几个地方,具体取决于应用的运行方式。别着急,咱们按图索骥,一个个来看。 1 控制台输出 最简单直接的情况:如果你是通过命令行手动启动应用的,那么所有

热心网友
05.04
Java日志Ubuntu如何筛选
编程语言
Java日志Ubuntu如何筛选

在Ubuntu系统中筛选Ja va应用程序日志 处理Ja va应用程序日志时,精准定位问题往往是关键一步。在Ubuntu环境下,grep命令无疑是完成这项任务的得力工具。首先,得找到日志文件的位置——它们通常藏在应用程序的安装目录里,或者静静地躺在 var log这个系统日志大本营中。 具体怎么操作

热心网友
05.04