570
文章
·
28751
阅读
570
文章
·
28751
阅读

有58人阅读过 使用notepad++批量快速删除重复的行
发布于2022/06/16 更新于2022/06/16
[ 教程仅保证更新时有效,请自行测试。]

此操作可解决太多行在excel里去重困难问题。

方法1:

  1. 先对文档内容排序:

    image.png

  2. 删除连续的重复行

    image.png



方法2:

  1. 使用notepad++打开文档

  2. 快捷键 ctrl+F,切换到“替换”标签,查找目标输入:^(.*?)$\s+?^(?=.*^\1$),替换为留空,选择“正则表达式”,勾选.匹配新行

    image.png

  3. 点击全部替换

  4. 文件中重复的行将被保留最后一次出现的位置,达到去重目的。

    image.png

原理[引用]:

从Notepad ++ Version 6开始,您可以在搜索和替换对话框中使用此正则表达式:^(.*?)$\s+?^(?=.*^\1$)并且什么也没有替换。这将从文件中最后一次出现的所有重复行中留下。不需要排序,重复的行可以在文件中的任何位置!您需要选中“正则表达式”和“。匹配换行符”选项:^ 匹配行的开头。(.*?)匹配任何字符0次或更多次,但尽可能少(它完全匹配行,因为“匹配换行”选项,这是必需的)。匹配的行被存储,因为括号周围和可访问使用\1$ 匹配行的结尾。\s+?^ 此部分匹配所有空白字符(换行符!),直到下一行的开头==>这将删除匹配行之后的换行符,以便在替换后没有空行。(?=.*^\1$)这是一个积极的前瞻性断言。这是此正则表达式中的重要部分,只有在文件中的其他位置之后存在完全相同的行时,才会匹配(并删除)行。

文章对你有帮助吗?
  • 一般[0]
  • 很赞[0]
  • 没用[0]
  • 垃圾[0]
  • 无语[0]

继续阅读:

扫一扫,手机浏览手机访问本站