请问:如何用PARACONC进行英汉词与词对应标注

回复: 请问:如何用PARACONC进行英汉词与词对应标注

Paraconc does not do the markup but search.
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

Paraconc does not do the markup but search.

呵,谢谢您的回复.那么请问,同一中文词对应的不同的英语表达(词组),用PARACONC怎样检索呢.

期待您再次回复,谢谢!
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

You can look up in the manual of paraconc for answers to this question.
Before you get started, align you texts at the sentence level.
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

Dr. Xu is right, you need segment and align your texts before you make use of the tool. Here is an example:
http://forum.corpus4u.org/showthread.php?t=2228&highlight=paraconc

看到您也用《红楼梦》做语料库真是很高兴。燕山大学申请了个国家课题,就是关于红楼梦双语语料库及其应用研究的。这个问题我很感兴趣,只是不想被他们抢了先,呵。他们可以做得有广度,但是我们可以在某一点的深度上超过他们,一定能的。
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

Dr. Xu is right, you need segment and align your texts before you make use of the tool. Here is an example:
http://forum.corpus4u.org/showthread.php?t=2228&highlight=paraconc

比方说,我要用PARACONC比较一下杨译、霍译《红楼梦》中所有“笑道”的翻译,把“笑道”译文起始部分标注<XD>,结束标注</XD>,再用&XD@&XD进行高级检索,@的范围定为1-9字。可是可是,我怎么什么都检索不到呢?百思不得其解。我哪里错了?请您指教。谢谢!
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

可能是你在软件的赋码设置上面有什么不当的地方。
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

You cannot search for something in <> in Paraconc. Change your annotation style first
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

衷心感谢楼上各位的回复。
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

Xiao is right. You need segment your Chinese text into words, that is, to add space between Chinese characters. There are also some other formating requirements, you'd better read my earlier posts and try out with the texts there:

http://forum.corpus4u.org/showthread.php?t=2228&highlight=paraconc

and

http://forum.corpus4u.org/showthread.php?t=2274

谢谢laohong,已拜读过您教的标注方法,此方法行之有效.受益菲浅!

我在践行您教的方法的基础上,为了找到我需要的内容我又自设了一对标注符号:<mzy>和</mzy>,您请看一个小例子:

(中文本)1.txt:

<seg>我 爱 <mzy>马致远</mzy>.</seg>
<seg>马致远 是 <mzy>谁</mzy>?</seg>
<seg>马致远 是 <mzy>我的 儿子</mzy>.</seg>

(英文本)2.txt:
<seg>I love <mzy>Ma Zhiyuan</mzy>.</seg>
<seg><mzy>Who</mzy> is Ma Zhiyuan?</seg>
<seg>Ma Zhiyuan is <mzy>my son</mzy>.</seg>

我先选择检索英文本,想得到这样一种检索结果:

I love Ma Zhiyuan.
Who is Ma Zhiyuan?
Ma Zhiyuan is my son.

我使用的命令是: &mzy@&mzy

相关的设置如下:
Align format: New line deliminer.
Tag Setting 选 Special Tags 再选 Outside Word, 在Tag Start 填入"<", "</" (真正填时没有引号,且<和</各占一行), Tag Stag 填 ">" (真正填时也没有引号)

高级检索选项如下:
Language: English
Enter pattern to search for: &mzy@&mzy
Search Syntax: Tag Search
@选择范围是1至6个单词.

但是没有出现任何检索结果.

求教laohong.谢谢您!
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

下面几点需要修改:

1、既然你已经用<seg></seg>断句了,在Align Format的选项里就不应该选New line delimiter,而应该选Start/stop tags的Options,并在Start Tag中填入<seg>,在Stop Tag中填入</seg>;

2、Tag Search 是用来检索经过词性标注的文本的,如<w NP>book 或 book_NP 格式的。如果你想用这个办法来检索自己定义的标注,最好重置你的文本,这里是经过我改后的文本:

<seg>我 爱 <w mzy>马致远.</seg>
<seg>马致远 是 <w mzy>谁?</seg>
<seg>马致远 是 <w mzy>我的_儿子.</seg>

<seg>I love <w mzy>Ma_Zhiyuan.</seg>
<seg><w mzy>Who is Ma Zhiyuan?</seg>
<seg>Ma Zhiyuan is <w mzy>my_son.</seg>

注意:你标注中的分开的词我用英文下划线 _ 把它们连接起来了,如上面的"<w mzy>我的_儿子","<w mzy>my_son"等,这样就让程序认为它们是一个词。

3、在Tag Settings里的Special Tags设置如下:把Outside Word和Before Word都打勾,然后在 Tag Start里填入 <w,在 Tag Stop的默认的是 >,不做改动。


4、在高级检索里,应该用下面的:
Language: English
Enter pattern to search for: &mzy
Search Syntax: Tag Search

试试看。
 
Last edited:
回复: 请问:如何用PARACONC进行英汉词与词对应标注

谢谢您,laohong!!我用的是PARACONC演示版,照您说的步骤做,竟也成功了!
您的声望已到了最高值,我还是为您加了声望,聊表谢意!!
Hug and kiss you!
 
回复: 请问:如何用PARACONC进行英汉词与词对应标注

谢谢你为我的声望扔了块砖 -- 以前还没有注意到有声望这个咚咚。Also thanks to your virtual hug and kiss!
 
Back
顶部