首页 游戏 软件 资讯 排行榜 专题
首页
编程语言
Sublime Text如何删除重复行_Sublime Text去重复行教程【简明】

Sublime Text如何删除重复行_Sublime Text去重复行教程【简明】

热心网友
36
转载
2026-05-03

Sublime Text无原生保序去重功能:Remove Duplicate Lines仅删相邻重复,Sort Lines: Unique必打乱顺序;真正保序需用正则^(.*$)\n(?=.*^\1$)或外部命令如awk '!seen[$0]++'。

Sublime Text如何删除重复行_Sublime Text去重复行教程【简明】

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这里有个核心事实需要明确:Sublime Text 并没有真正意义上的“一键保序去重”功能。它自带的两个工具,一个只能处理相邻的重复行,另一个则必然会打乱你原有的行序。如果你想要的效果是“保留首次出现的行,删除后面所有重复项”,那就得借助正则表达式或者调用外部命令了。

为什么 Remove Duplicate Lines 总是删不干净?

这个命令的工作原理其实很简单:它只判断“当前行”和“紧挨着的上一行”是否完全一致。一旦两行相同的文本中间被其他内容隔开,它就无能为力了。举个例子:

apple
banana
apple

你看,第二个 apple 并不会被删除,因为它前面是 banana,而不是另一个 apple

除此之外,这个命令还有一些“固执”的特性:

  • 它对任何细微差别都零容忍,包括行尾的空格、制表符,甚至是不可见的零宽字符。只要多一个空格,就会被判定为不同的行。
  • 它不支持忽略大小写,也不能自动跳过空行,更不用说按指定列进行匹配了。
  • 默认情况下,它没有绑定快捷键,你需要手动在命令面板里搜索 Remove Duplicate Lines 才能调用它。

为什么 Sort Lines: Unique 会乱序?

这个命令的名字有点“误导性”。它本质上是一个组合操作:先对全文所有行进行字典序排序,然后再合并相邻的重复行。所以,无论原文中 zebra 出现在哪里,排序后它都会跑到 apple 前面去,原始顺序完全丢失。

这里有几个关键点需要注意:

  • 它保留的是“排序后”每组重复行里的第一行,而不是“原文中”第一次出现的那一行。
  • 如果你想使用它,通常需要手动配置快捷键,例如:{"keys": ["ctrl+alt+u"], "command": "sort_lines", "args": {"unique": true}}
  • 对于包含数字的字符串(比如 log2.txtlog10.txt),字典序排序会产生不符合直觉的结果(log10.txt 会排在 log2.txt 前面),这时可能需要借助 Natural Sort 这类插件来辅助。

怎么真正保序去重?用正则 ^(.*$)\n(?=.*^\1$)

要想在不打乱顺序的前提下删除重复行,正则表达式是一个强大而精准的工具。上面这个正则模式,能够匹配那些“在后面还会再次出现”的重复行(但会巧妙地跳过每组中的第一行)。这对于处理代码片段、配置文件等对行序有依赖的文本尤其有用。

操作步骤其实很清晰:

  • 打开查找面板(Ctrl+F),务必勾选 Regular Expression(正则表达式)和 Whole Line(整行匹配)。
  • 在查找框输入:^(.*$)\n(?=.*^\1$),然后点击 Find All
  • 此时,所有后续的重复行都会被选中。按下 Ctrl+Shift+L 将它们转换为多个光标,再按一次 Delete 键,就大功告成了——首行会自动被保留下来。
  • 有个细节值得注意:如果文件是Windows格式(\r\n换行),而正则只匹配了 \n,可能会导致失败。保险起见,可以先用 File → Line Endings → Unix 统一换行符格式。

大文件(>5 万行)别硬扛,换系统命令

当文本行数膨胀到数万甚至更多时,在Sublime Text内部使用正则或排序命令可能会感到明显的卡顿,内存占用也会飙升。这时候,把任务交给系统终端或脚本往往是更高效、更稳定的选择。

  • Linux/macOS:保序去重可以交给经典的 awk 命令:awk '!seen[$0]++' file.txt > dedup.txt。如果不需要保序,直接用 sort -u file.txt > dedup.txt 更快。
  • Windows PowerShell:实现保序去重需要稍微绕一下:Get-Content file.txt | ForEach-Object {$seen[$_.Trim()]++ -eq 1} | Set-Content dedup.txt。这里手动调用了 Trim() 来处理可能存在的尾部空格差异。
  • 跨平台 Python:用一行Python脚本也能轻松搞定:python3 -c "import sys; seen=set(); [print(l.rstrip()) for l in sys.stdin if l not in seen and not seen.add(l)]" < file.txt > dedup.txt

最后,分享一个经常被忽略却极其有效的预处理建议:很多所谓的“重复行”,其实罪魁祸首是行尾看不见的空格或特殊字符。在执行任何去重操作之前,不妨先用正则 \s+$ 全局替换一下,清理所有行的尾部空白。这个简单的步骤,往往比后续纠结选用哪个去重命令更能从根本上解决问题。

来源:https://www.php.cn/faq/2333919.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Sublime Text如何使用Goto Anything搜索符号_Sublime Goto Anything搜索符号要点
编程语言
Sublime Text如何使用Goto Anything搜索符号_Sublime Goto Anything搜索符号要点

Sublime中Ctrl+P输@才能跨文件搜函数或类,因@显式声明搜符号;需文件已保存、语法标识正确,小众语言需插件;组合写法(如utils py@class DatabaseConfig)更精准;首次大项目索引会卡顿属正常。 Ctrl+P输@才能跨文件找函数或类 很多朋友第一次用这个功能时,可能会

热心网友
05.02
Sublime Text如何使用GitGutter行内修改提示_Sublime GitGutter行内修改提示攻略
编程语言
Sublime Text如何使用GitGutter行内修改提示_Sublime GitGutter行内修改提示攻略

Sublime Text GitGutter 行内修改提示不生效?这份排查指南请收好 当你兴致勃勃地在 Sublime Text 里装好 GitGutter,期待它像一位贴心的助手,在代码行旁清晰标注出增删改时,却发现它毫无反应——这感觉确实有点扫兴。别急着怀疑插件,很多时候问题出在配置和环境上。下

热心网友
05.02
Sublime怎么设置鼠标滚轮缩放字体?Sublime自由调节视距的设置
编程语言
Sublime怎么设置鼠标滚轮缩放字体?Sublime自由调节视距的设置

Sublime Text 滚轮缩放字体:从失效到丝滑,一篇讲透 先说一个核心事实:Sublime Text 从 3143 版本开始,包括最新的 ST4,其实都原生支持通过 Ctrl(或 macOS 的 Cmd)加滚轮来缩放字体。在 Windows 和 Linux 上,这功能基本是开箱即用的。但到了

热心网友
05.02
Sublime如何实现正则查找替换?Sublime正则表达高级搜索实战
编程语言
Sublime如何实现正则查找替换?Sublime正则表达高级搜索实战

Sublime Text 正则查找替换:从引擎差异到实战避坑指南 Sublime 的正则引擎用的是什么? 很多开发者习惯把其他编辑器里的正则表达式直接复制到 Sublime Text 里用,但偶尔会碰到报错 Invalid regular expression。这背后其实有个引擎切换的问题:Subl

热心网友
05.02
Sublime Text如何查看Git提交历史_Sublime Git提交历史查看方案
编程语言
Sublime Text如何查看Git提交历史_Sublime Git提交历史查看方案

Sublime Text如何查看Git提交历史:从插件配置到行级追溯的完整方案 开门见山地说,Sublime Text 本身并不自带 Git 历史查看功能,想实现这个需求,必须依赖插件或外部命令集成。很多开发者遇到的第一个拦路虎就是:明明装了插件,右键点击“Git History”却毫无反应。其实,

热心网友
05.02

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

最新公司2026年度工作总结会议主持词
职业与学业
最新公司2026年度工作总结会议主持词

最新公司2026年度工作总结会议主持词 各位领导、各位来宾、同事们,请就坐。 现在,我宣布,×公司——××××年度工作会议正式开始! 首先,请允许我荣幸地向大家介绍今天亲临会场的各位领导和来宾:集团公司董事长×先生、×公司总经理×先生、×公司总经理×女士、集团公司财务总监×先生。同时,出席本次会议的

热心网友
05.03
学生做最好的自己演讲稿    做最好的自己演讲稿600字左右
职业与学业
学生做最好的自己演讲稿 做最好的自己演讲稿600字左右

学生做最好的自己演讲稿,成为最好的自己,从来不是一句空谈,它需要持续的努力、踏实的实践,以及在漫长岁月里对自我的不断打磨与提升。下面为大家整理了几篇学生做最好的自己演讲稿,希望能带来一些启发和思考。 学生做最好的自己演讲稿一 尊敬的老师们,亲爱的同学们: 大家好! 你是否也曾有过这样的时刻?羡慕旁人

热心网友
05.03
幼儿园家长会主持词开场白系列
职业与学业
幼儿园家长会主持词开场白系列

为了确保活动流程顺畅、氛围融洽,一份好的主持词至关重要。它不仅能有效串联各个环节,更能营造出恰当的氛围。那么,如何撰写一份出色的主持词呢?借鉴诗词和散文诗的写作手法,往往能带来意想不到的效果。如果您正在寻找灵感,不妨参考以下由我们精心整理的“幼儿园家长会主持词开场白”系列范例,相信能为您提供切实的帮

热心网友
05.03
贪吃小气的弟弟
职业与学业
贪吃小气的弟弟

我有一个弟弟 我有个弟弟,叫浩浩。小家伙长着一双水汪汪的大眼睛,一张小嘴总惦记着吃,脸蛋儿胖乎乎的,别提多可爱了。不过啊,这浩浩除了贪吃,还有个挺出名的特点——那就是相当“小气”。 一次“护食”风波 有回我去他家玩,人还没进门呢,就被他给拦住了。只见他嘟着嘴,两脚一叉,小手一张,牢牢挡在门口,嘴里还

热心网友
05.03
我最难忘的同学
职业与学业
我最难忘的同学

说起最难忘的同学 细数下来,从幼儿园到现在,认识周鑫鑫竟然已经有十年了。时间过得可真快。 这事儿说来也巧。从三岁踏入幼儿园开始,一直到六年级的今天,我和她始终都在同一个班级。更巧的是,我的爷爷奶奶还认识她的父母,这么算下来,我俩真算得上是名副其实的“发小”了。 关于“认识”的起点 周鑫鑫总说“我们从

热心网友
05.03