用正则表达应该怎样才能找到()中的任意中文并去除呢?

回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

昨天弄了一整晚也没能成功。求教各位大侠,请问如何利用正则表达式(本人会操作PowerGREP和RegexBuddy),只抽取附件中的以下几部分的相关内容,清除其它部分。有劳各位了,谢谢先!
“““
Author:
Title:
Keywords:
Abstract:
Cited References:

”””
 

附件

  • 求教正则表达式之样本.txt
    18.1 KB · 浏览: 10
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

用word查找替换(通配符),分两步骤,最后是将非红色字符全部删除. 方法很笨但很有效.如果大批量,用个宏就全部解决了.

如Abstract: "Abstract\:*^13"
其它可类推.
结果见附件.
xxx1含reference是内容,而xxx2不含;xxx3是xxx2的最后效果.

你用editplus or ultraedit或高级工具时,用逻辑"或",可一次处理,应是同样的道理.
 

附件

  • xxx1.doc
    69.5 KB · 浏览: 1
  • xxx2.doc
    69.5 KB · 浏览: 1
  • xxx3.doc
    25 KB · 浏览: 1
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

十分感谢xusun575 这么及时的回复,在论坛里也泡了些日子,早就听说过您的“电风扇”,曾经还为了求证到底什么是“电风扇”而翻遍了坛子。不过本人愚钝,还是没弄懂您的意思,刚在Word里试了一下,通过您提供的“Abstract\:*^13”用查找的方式,可以选中Abstract部分,可是接下来该怎么办?表达式中的13是什么意思?烦劳您解释一下,谢谢!!!
 
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

十分感谢xusun575 这么及时的回复,在论坛里也泡了些日子,早就听说过您的“电风扇”,曾经还为了求证到底什么是“电风扇”而翻遍了坛子。不过本人愚钝,还是没弄懂您的意思,刚在Word里试了一下,通过您提供的“Abstract\:*^13”用查找的方式,可以选中Abstract部分,可是接下来该怎么办?表达式中的13是什么意思?烦劳您解释一下,谢谢!!!

看来我真该举办个"电风扇"培训班了:D
有人认为word浪费资源,但word人人都在用,电风扇用起来也没觉得有啥问题?浪费就浪费吧,反正不会污染环境的.我们几千万字全靠的它,可能电能是会浪费点儿的:p.

^13=\n; 接下来将选中的替换为"红色"或"粗体"等.然后再将非"红色"或非"粗体"清除,替换为"空",即"替换为"中什么都不填.
Abstract 可以根据你的需要换成Title,或Author等,注意大小写.只不过你的那个cited references你要稍思考一下.真的小意思啦!
 
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

谢谢!学了一招。

只不过你的那个cited references你要稍思考一下.真的小意思啦!

可惜,还是没能“思考“出来。不好意思再多问,留在这里存疑。

顺手在网上搜了一把,找了个“Word查找与替换通配符使用教程”贴在这备忘。看来“电风扇”功能还挺强大的。得好好学习一下。原文在这里:http://www.pootor.com/search-and-replace-in-word-using-a-wildcard-tutorial/

刚提交时提示我:



“信息提交时发生如下错误:
  1. 您输入的文字太长 (11267 字符)。请缩短到 10000 字符以内。”
  看样子贴不上来。想要知道“Word查找与替换通配符使用教程”详情的C友请点击上面的link吧。或者在股沟里摸一把,顺手就能摸出一大把来。
 
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

求教给我non-finite adverbial clauses (including infinitival, present participial and past participial)的正则表达式应如何编写
 
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

求教各位non-finite adverbial clauses (including infinitival, present participial and past participial)的正则表达式应如何编写
 
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

求教各位non-finite adverbial clauses (including infinitival, present participial and past participial)的正则表达式应如何编写
正确的做法是:先做标注/赋码,然后才谈得上regex检索.不妨先去corpus.byu.edu看看吧.
 
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

谢谢你的建议和帮助,我就是要在赋码了的文本里来检索non-finite adverbial clauses (including infinitival, present participial and past participial),但不知道如何编写该正则表达式,还望各位指教!
 
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

谢谢你的建议和帮助,我就是要在赋码了的文本里来检索non-finite adverbial clauses (including infinitival, present participial and past participial),但不知道如何编写该正则表达式,还望各位指教!
有了赋码语料,就可以使用任何concordancer直接检索了.若用WST,concord的setting 设置 "tags to ignore"不激活(activated不选中)即可.
 
回复: 用正则表达应该怎样才能找到()中的任意中文并去除呢?

我就是要在赋码了的文本里来检索non-finite adverbial clauses (including infinitival, present participial and past participial),但不知道如何编写该正则表达式,还望各位指教!

或许这几本有关regular expression的图书对你有帮助:
1. Mastering Regular Expressions(精通正则表达式), by Jeffrey E.F. Friedl from O'Reilly。这是一本关于regular expression的经典图书(但可能不适合初学者), 东南大学出版社有引进的影印版、电子工业出版社有中文版。

2. Regular Expressions Cookbook,by Jan Goyvaerts and Steven Levithan from O'Reilley。ISBN: 978-0-596-52068-7。

3. Beginning Regular Expressions, by Andrew Watt from Wrox。ISBN 0-7645-7489-2。清华大学出版社有中文版,书名叫《正则表达式入门经典》,ISBN:7302183821。

4. Regular Expression Pocket Reference: Regular Expressions for Perl, Ruby, PHP, Python, C, Java and .NET by Tony Stubblebine from O'Reilly。ISBN-10: 0596514271。
 
Last edited:
Back
顶部