如何更改赋码_TAG-><TAG> MS Word + Perl Script

xiaoz

永远的超级管理员
Staff member
shooter wrote at 2006-3-21 22:17:41 in the Literature section -

Dr. Xu:
请教在使用Gotagger附码后,如何将附码前的下划线更改成包括附码在内的尖括号?

[本贴已被 xujiajin 于 2006年03月24日 19时48分04秒 编辑过]
 
单个文件可以用MS Word中的查找替换更改,然后使用宏,将每个文件打开进行替换就行了。

批量替换在PowerGrep中用正则表达式替换。
 
我尝试过使用Word的查找替换,如要查找名词时,原来的Gotagger标识是_NN,_NNP,和_NNS,我想改为>NN<,>NNP<或>NNS<, 将_替换为空格+>,但是左边的尖括号该如何添加呢?
***********************************
关于PowerGrep,能力有限,已经都还给梁老师啦!
 
回复:如何更改附码?

以下是引用 xiaoz2006-3-22 1:36:37 的发言:
shooter wrote at 2006-3-21 22:17:41 in the Literature section -

Dr. Xu:
请教在使用Gotagger附码后,如何将附码前的下划线更改成包括附码在内的尖括号?

[face=黑体]
用Word 的"查找和替换"的高级功能即可,但前两轮操作要分两步:
1. 将"_"和附码,替换成>_附码<; 2. 用"查找/替换"功能,除去"_"
我看了 gotagger的附码表,附码长度 最大为4字符,其中3个是字母,1个$为字符。
在操作时,从最高字母数开始,即第一轮操作的查找内容为“_^$^$^$”,替换为 “>^&<”;然后 除去"_"(必须除去再下一步)。
第二轮操作的查找内容为“_^$^$”,替换为 “>^&<”(这无需改变);然后 除去"_"。
这里 "^$"为任意字母;"^&"为所要查找的文字
如有必要,可在最后一轮处理“ $”,和<作位置调换。查找内容为“<$”,替换为 “$<”

[/face]
2006032222521316.jpg
 
回复:如何更改附码?

STOP HERE - A little dose of programming makes the world feel a lot easier and better. I have written a program to convert the underscore style annotation to the BNC style. You can download it here: http://forum.corpus4u.org/upload/forum/2006032223392489.zip

and...
1) Inatall Perl interpreter;
2) Make a new directory on the machine;
3) COPY the selected files to be processed to the dir;
4) Unzip the perl script into the same dir;
5) Double click the program file

A new file will be created for each selected file (named new_<your file>). These new files are what you want.

For instruction of how to install Perl interpreter, see
http://www.corpus4u.com/forum_view.asp?view_id=1368&forum_id=7

以下是引用 xiaoz2006-3-22 1:36:37 的发言:
shooter wrote at 2006-3-21 22:17:41 in the Literature section -

Dr. Xu:
请教在使用Gotagger附码后,如何将附码前的下划线更改成包括附码在内的尖括号?
 
Back
顶部