紧急求助:如何删除文本中所有文字,只保留<>标记?

有大量txt文本,平均4千词长,用十几对标签,如<IET1>和</IET1>,<IPR3>和</IPR3> 做了标记,现欲删除所有文字,但保留所有标签,并合并成一个文本。求高手帮助解决,衷心感谢谢。
附件是一个sample
 

附件

  • LAE_01.txt
    42.9 KB · 浏览: 1
回复: 紧急求助:如何删除文本中所有文字,只保留<>标记?

在EditPad Lite 7中使用正则表达式就可以搞定。EditPad Lite 7(免费版)下载地址:http://www.editpadlite.com/

1.在Editpad中调入要处理的文本。

2.工具栏中依次选择:Search--Multiple-line Search Panel

3.在界面下方弹出的检索控制面板的Search中敲入(<\w+>)|(</\w+>),并在该面板上方的工具栏中选取Regex和Files(多个文本时选用),此时文本中所要提取对象会变成黄色(软件默认颜色)。

4.点击检索面板中的Cut Matches(剪刀状图标的那个选项),然后使用EditPad主界面工具栏的File---New新建一个文本文档,在该新文档中右击鼠标并选择“Paste”即可。

新文档中的内容就是提取出来的带有<>的部分。
 
回复: 紧急求助:如何删除文本中所有文字,只保留<>标记?

Tons of thanks, Chris Yang, for your timely help. EditPad did take care of my problem.
 
Back
顶部