B Byron B. Chang 2015-05-26 #1 有大量txt文本,平均4千词长,用十几对标签,如<IET1>和</IET1>,<IPR3>和</IPR3> 做了标记,现欲删除所有文字,但保留所有标签,并合并成一个文本。求高手帮助解决,衷心感谢谢。 附件是一个sample 附件 LAE_01.txt 42.9 KB · 浏览: 1
有大量txt文本,平均4千词长,用十几对标签,如<IET1>和</IET1>,<IPR3>和</IPR3> 做了标记,现欲删除所有文字,但保留所有标签,并合并成一个文本。求高手帮助解决,衷心感谢谢。 附件是一个sample
chrisyang 普通会员 2015-05-26 #2 回复: 紧急求助:如何删除文本中所有文字,只保留<>标记? 在EditPad Lite 7中使用正则表达式就可以搞定。EditPad Lite 7(免费版)下载地址:http://www.editpadlite.com/ 1.在Editpad中调入要处理的文本。 2.工具栏中依次选择:Search--Multiple-line Search Panel 3.在界面下方弹出的检索控制面板的Search中敲入(<\w+>)|(</\w+>),并在该面板上方的工具栏中选取Regex和Files(多个文本时选用),此时文本中所要提取对象会变成黄色(软件默认颜色)。 4.点击检索面板中的Cut Matches(剪刀状图标的那个选项),然后使用EditPad主界面工具栏的File---New新建一个文本文档,在该新文档中右击鼠标并选择“Paste”即可。 新文档中的内容就是提取出来的带有<>的部分。
回复: 紧急求助:如何删除文本中所有文字,只保留<>标记? 在EditPad Lite 7中使用正则表达式就可以搞定。EditPad Lite 7(免费版)下载地址:http://www.editpadlite.com/ 1.在Editpad中调入要处理的文本。 2.工具栏中依次选择:Search--Multiple-line Search Panel 3.在界面下方弹出的检索控制面板的Search中敲入(<\w+>)|(</\w+>),并在该面板上方的工具栏中选取Regex和Files(多个文本时选用),此时文本中所要提取对象会变成黄色(软件默认颜色)。 4.点击检索面板中的Cut Matches(剪刀状图标的那个选项),然后使用EditPad主界面工具栏的File---New新建一个文本文档,在该新文档中右击鼠标并选择“Paste”即可。 新文档中的内容就是提取出来的带有<>的部分。
chrisyang 普通会员 2015-05-26 #3 回复: 紧急求助:如何删除文本中所有文字,只保留<>标记? 操作时的截图见:http://www.corpus4u.org/forum/showthread.php?p=51085#post51085
B Byron B. Chang 2015-05-27 #4 回复: 紧急求助:如何删除文本中所有文字,只保留<>标记? Tons of thanks, Chris Yang, for your timely help. EditPad did take care of my problem.
回复: 紧急求助:如何删除文本中所有文字,只保留<>标记? Tons of thanks, Chris Yang, for your timely help. EditPad did take care of my problem.