怎么用wordsmith检索“名词+动词+名词+介词短语”构式

本人自学wordsmith才不久,很多检索功能都不会。在下有一个问题想请教各位,怎么用wordsmith从文档中检索“名词+动词+名词+介词短语”?该文档一定要先通过赋码后才能被检索吗?
progress.gif
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

是的,先赋码,再根据码组合进行检索.
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

本人自学wordsmith才不久,很多检索功能都不会。在下有一个问题想请教各位,怎么用wordsmith从文档中检索“名词+动词+名词+介词短语”?该文档一定要先通过赋码后才能被检索吗?
progress.gif

加了词性标注也不行吧,这个好像要正则表达式才可以吧,wordsmith 好像不支持正则表达式。
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

是的,先赋码,再根据码组合进行检索.
可不可以麻烦您说一下具体怎么操作啊?我在“search word”的方块栏里输入赋码标注,但是检索不出结果:mad:,按照说明书上的"<w NN1>"进行检索,也检索不到结果。也不知道是哪里出错了。
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

加了词性标注也不行吧,这个好像要正则表达式才可以吧,wordsmith 好像不支持正则表达式。

我看过胡学文老师写的一篇文章《中国学生英语双宾构式的习得—一项基于语料库的对比研究》中就用到wordsmith来提取双宾构式的语境共现行。文中写到:第一步提取所有含“动词+人称代词+名词”的语境共现行;第二步提取出所有含“动词+名词+名词”的语境共现行。
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

如果语料进行了词性标注,比较简单的句法检索在WordSmith中应该是可以实现的。比如以SWECCL 1.0的语料为例,如果要检索 have 作为基本动词的用法,可在检索框中输入“have <VH0>”(检索框中不输入引号,下同),得到的结果如附件 01 have所示;
如果要检索 have 后接过去分词的形式,则输入“have <VH0> * <VVN>”,结果见附件02 have done;如果要检索have to +动词 +带定冠词的名词,则输入“have <VH0> * <TO> * <VDI> * <AT>”,结果见附件03 have to do the。其他检索可以依次类推。
但是如果检索词项中间的干扰性因素太多,就无法使用WST来实现了。
 

附件

  • 01 have.jpg
    01 have.jpg
    109.3 KB · 浏览: 14
  • 02 have done.jpg
    02 have done.jpg
    134.3 KB · 浏览: 8
  • 03 have to do the.jpg
    03 have to do the.jpg
    21.6 KB · 浏览: 7
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

我按照您的说法在search word框中输入have<VH0>,也没有加双引号,但是wordsmith显示"no concordance entries found",但是当我单独输入have 或VH0(VH0不加尖括号,如果输入的是“<VH0>”也搜索不出结果)时,就能搜到相应的结果。另外我想请问您,当我想搜索一个“名词+动词”的时候,因为不确定这个名词的单复数以及动词的时态,我能否这样搜索呢,“NN* VV*”?搜索时不加引号,之间有空格。如果可以的话,为什么我搜索不出来,我不知道是不是我使用wordsmith的方法不正确?
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

我按照您的说法在search word框中输入have<VH0>,也没有加双引号,但是wordsmith显示"no concordance entries found",但是当我单独输入have 或VH0(VH0不加尖括号,如果输入的是“<VH0>”也搜索不出结果)时,就能搜到相应的结果。另外我想请问您,当我想搜索一个“名词+动词”的时候,因为不确定这个名词的单复数以及动词的时态,我能否这样搜索呢,“NN* VV*”?搜索时不加引号,之间有空格。如果可以的话,为什么我搜索不出来,我不知道是不是我使用wordsmith的方法不正确?

1. 你的检索之所以没有得到结果,是因为你没有看清楚所要检索语料的格式:我给你提供的检索项中have和<VH0>之间有个空格,而你则是将它们两个直接连起来了。检索之前一定要弄清楚你所使用的语料的标注格式。
2. 你所要检索的"名词+动词"这样的形式太泛,操作起来肯定有难度。以SWECCL 1.0的附码为例,名词类有22个,其中以<NN?>标记的有21个,以<ND1>标注的有1个;动词的附码的类别差异更大,有31类。可以在对“名词+动词”的具体形式进行分类后进行附码组合检索应该是可行的。如附件01是以<NN?> * <VD?> *为检索项的结果;附件02是以<NN?> * <VH?> *为检索项的结果。
 

附件

  • 01.jpg
    01.jpg
    115.9 KB · 浏览: 6
  • 02.jpg
    02.jpg
    99.8 KB · 浏览: 2
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

我在搜索的时候有注意中间的空格,也注意了这个尖括号,另外我也按您的方法用wordsmith去搜索了<NN?> * <VV?>,<NN?> * <VH?>,也搜索不结果。我用的是CLEC语料库,用JCLAWS对其进行赋码的。
我在使用wordsmith检索的过程中遇到的问题有这些:
1、在输入检索码的时候,不能加“<>”;
2、可以检索出“NN*VV*”的构式,但是检索不了如您所说的<NN?> * <VV?>,<NN?> * <VH?>。以下是用JCLAWS赋码后一部分的语料
<s>
That_DD1 is_VBZ important_JJ ._.
</s>
<s>
When_CS a_AT1 society_NN1 is_VBZ uncivilised_JJ ,_, we_PPIS2 must_VM act_VVI as_II what_DDQ the_AT old_JJ thought_NN1 says_VVZ ._.
</s>
<s>
Thus_RR ,_, we_PPIS2 ought_VMK to_TO punish_VVI the_AT criminals_NN2 ._.
</s>
<s>
Because_CS there_EX was_VBDZ not_XX a_AT1 good_JJ surrounding_JJ &lsqb;_( np6_FO ,_, s-_NN1 &rsqb;_) in_II the_AT society_NN1 ,_, people_NN did_VDD not_XX know_VVI or_CC just_RR knew_VVD little_RR about_II what_DDQ was_VBDZ right_JJ and_CC what_DDQ was_VBDZ wrong_JJ ._.
</s>
<s>
For_IF not_XX all_DB people_NN were_VBDR rich_JJ enough_RR ,_, a_AT1 lot_NN1 of_IO criminals_NN2 appeared_VVD ._.
</s>
<s>
They_PPHS2 cheated_VVD or_CC robbed_JJ or_CC did_VDD other_JJ nasty_JJ things_NN2 ._.
</s>
另外我用的是wordsmith6.0的版本,不知道是不是和我使用的这两个工具有关系啊。
我将检索出来的“NN*VV*”这个结果用附件发给您看看哈,麻烦您帮我分析一下是什么原因呀。谢谢了啊!!!!
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

回复#9:
真的是CLEC不对SWECCL1.0的嘴啊!我一直在说SWECCL 1.0的格式,你那边却是另外的附码格式。
只要把检索项改变一下就行了:“*_JJ”可以检索出形容词;*_JJ *_JJ 可以检索出两个形容词连用的(如附件01,用你提供的语料做的检索);*_JJ *_JJ *_NN? 可以检索出形容词+形容词+名词(某类)的形式。
 

附件

  • 01.jpg
    01.jpg
    19 KB · 浏览: 5
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

忘了补充一句:我用的是WST 4.0。
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

忘了补充一句:我用的是WST 4.0。

真的非常感谢您!!!
总算是解决了困扰了我很长时间的一个难题啊!!
真是隔行如隔山呀~~~~~
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

老师您好!!
上次按照您给我的提示,我已经掌握了检索的方法了。但是另外有一事相求。
Goldberg将英语中的典型致使移动结构构式为“NP1+VP+NP2+PP”即为“名词短语+动词+名词短语+介词短语”我参照他的这种构式,将可能出现的情况分类成为以下四种
1)名词+动词+名词+介词,
2)名词+动词+代词+介词,
3)代词+动词+名词+介词,
4)代词+动词+代词+介词。
然后经过赋码后,需要检索的应该包括如下的情况:
1)* _NN? *_VV? *_NN? *_II?
2)* _NN? *_VV? *_PP? *_II?
3)* _PP? *_VV? *_NN? *_II?
4)* _PP? *_VV? *_NN? *_II?
但是我发现按照这种方法检索得到的语境共现行并不全面,不包括所有的移动致使结构,例如
He_PPHS1 throws_VVZ the_AT stone_NN1 into_II the_AT river_NN1
Tom_NP1 throwed_VVD the_AT stone_NN1 into_II the_AT river_NN1
they_PPHS2 were_VBDR forced_VVN into_II formulating_VVG an_AT1 option.
he_PPHS1 had_VHD been_VBN coered_VVN and_CC terrorized_VVN into_II absconding._NNU
我知道以上的例句之所以检索不出来是因为很多句子在动词和名词之间还存在另外的成分,如the,另外还有时态问题等。
所以我的问题是,那我是不是要考虑到这些如动词和名词之间可能出现的某些词的所有情况呢?
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

另外,一个独立的星号也只能相当于一个词,也不确定两个单词之间可能会出现多少个词。。。。
 
回复: 怎么用wordsmith检索“名词+动词+名词+介词短语”构式

老师您好!!
上次按照您给我的提示,我已经掌握了检索的方法了。但是另外有一事相求。
Goldberg将英语中的典型致使移动结构构式为“NP1+VP+NP2+PP”即为“名词短语+动词+名词短语+介词短语”我参照他的这种构式,将可能出现的情况分类成为以下四种
1)名词+动词+名词+介词,
2)名词+动词+代词+介词,
3)代词+动词+名词+介词,
4)代词+动词+代词+介词。
然后经过赋码后,需要检索的应该包括如下的情况:
1)* _NN? *_VV? *_NN? *_II?
2)* _NN? *_VV? *_PP? *_II?
3)* _PP? *_VV? *_NN? *_II?
4)* _PP? *_VV? *_NN? *_II?
但是我发现按照这种方法检索得到的语境共现行并不全面,不包括所有的移动致使结构,例如
He_PPHS1 throws_VVZ the_AT stone_NN1 into_II the_AT river_NN1
Tom_NP1 throwed_VVD the_AT stone_NN1 into_II the_AT river_NN1
they_PPHS2 were_VBDR forced_VVN into_II formulating_VVG an_AT1 option.
he_PPHS1 had_VHD been_VBN coered_VVN and_CC terrorized_VVN into_II absconding._NNU
我知道以上的例句之所以检索不出来是因为很多句子在动词和名词之间还存在另外的成分,如the,另外还有时态问题等。
所以我的问题是,那我是不是要考虑到这些如动词和名词之间可能出现的某些词的所有情况呢?

如果语料没有经过像ICE—GB那样的句法标注,单凭词性赋码是没有办法很准确地检索出你想要的这种句法结构的。更何况现在公开发行的语料库基本上都是基于传统语法进行标注的,像你说的这种"致使移动结构"是认知语言构式语法的术语。即使是像ICE-GB这样有句法标注的语料库,你也只能使用它自带的检索程序检索出你想要的类似结构的句子,你还得自己判断是不是你要得“致使移动结构”。假设(我只是说假如)你检索到这么一个句子:I saw three tables in the classroom.你该怎么办?它符合你的检索要求,但 不符合你的语义标准。代码检索只是形式上的,意义上的东西还得你自己进一步作出判断。
即使使用正则表达式或Perl脚本程序,你也只能是最大可能的缩小了你二次检索的范围(因为你所有的检索项都是以“类别”来对待的,而不是落实具体的某些词上),不可能就得到你完全想要的东西,后期手工分拣检索行还是相当有必要的。计算机软件只是识别你输进去的各种符号,至于符和符号标准的检索行是不是你想要的,这恐怕的分情况而定。
 
Back
顶部