急急急:词性赋码之后的txt文本,用AntConc怎么检索出所有的实词?

请问各位方家:我用《语料库应用教程》的光盘里的Treetagger给一个txt文件词性赋码,打算用AntConc分别检索出所有的名词、动词、形容词和副词,但是在AntConc里显示的词表既有正常的词,也有赋码的代码。用了正则表达式\S+_VV\w+想查找所有的名词,但是没有反应。 我又尝试了CLAWS4的在线赋码,结果导入AntConc检索也是没有反应。请问我的问题出在哪里呢?坐等回答,感激不尽!!!
 
回复: 急急急:词性赋码之后的txt文本,用AntConc怎么检索出所有的实词?

try "\S+_NN\w+"
 
请问各位方家:我用《语料库应用教程》的光盘里的Treetagger给一个txt文件词性赋码,打算用AntConc分别检索出所有的名词、动词、形容词和副词,但是在AntConc里显示的词表既有正常的词,也有赋码的代码。用了正则表达式\S+_VV\w+想查找所有的名词,但是没有反应。 我又尝试了CLAWS4的在线赋码,结果导入AntConc检索也是没有反应。请问我的问题出在哪里呢?坐等回答,感激不尽!!!
应该首先观察下附码后的文件,你会发现,不是所有的名词都是以_NN\w+的形式。至少_NN\w+已经排除了码为_NN的单数名词。从Treetagger附码集中可看出,名词应以\S+_N\W+检索。
 
回复: Re: 急急急:词性赋码之后的txt文本,用AntConc怎么检索出所有的实词?

应该首先观察下附码后的文件,你会发现,不是所有的名词都是以_NN\w+的形式。至少_NN\w+已经排除了码为_NN的单数名词。从Treetagger附码集中可看出,名词应以\S+_N\W+检索。

You're right about it, sorry for the misleading answer.
 
回复: Re: 急急急:词性赋码之后的txt文本,用AntConc怎么检索出所有的实词?

应该首先观察下附码后的文件,你会发现,不是所有的名词都是以_NN\w+的形式。至少_NN\w+已经排除了码为_NN的单数名词。从Treetagger附码集中可看出,名词应以\S+_N\W+检索。

多谢您的回答。但是我改了正则式还是没有反应啊,AntConc页面在附件,请高手指点迷津,感激不尽。
 

附件

  • AntConc检索.png
    AntConc检索.png
    16.3 KB · 浏览: 12
回复: 急急急:词性赋码之后的txt文本,用AntConc怎么检索出所有的实词?

追问:正常情况下,赋码后的文件可以利用正则式搜索出名词词表吧?
 
回复: 急急急:词性赋码之后的txt文本,用AntConc怎么检索出所有的实词?

you need to use the concordance tool, not the word list tool.
 
回复: 急急急:词性赋码之后的txt文本,用AntConc怎么检索出所有的实词?

你好,我跟你遇到的问题是一样的,问题现在解决了吗?麻烦你能告诉我一下解决方法吧,1)词性标注之后的文本检索不出来,2)3.2.1版能检索出,但是检索出的文本是带有词性标注的符码的。
 

附件

  • QQ截图20120716223320.jpg
    QQ截图20120716223320.jpg
    107.4 KB · 浏览: 11
回复: 急急急:词性赋码之后的txt文本,用AntConc怎么检索出所有的实词?

应该还是AntConc还用的不熟悉,设置什么的没有弄清楚,自己摸索吧,也是学习,大虾也懒得处理懒人的菜鸟问题啊。我问了一个语料库相关的老师,说如果搜索实词什么的是concordance 那个栏目,不是word list。

2)词性标注可以hide, 你设置一下。
 
回复: 急急急:词性赋码之后的txt文本,用AntConc怎么检索出所有的实词?

已经解决了,谢谢了

应该还是AntConc还用的不熟悉,设置什么的没有弄清楚,自己摸索吧,也是学习,大虾也懒得处理懒人的菜鸟问题啊。我问了一个语料库相关的老师,说如果搜索实词什么的是concordance 那个栏目,不是word list。

2)词性标注可以hide, 你设置一下。
 
Back
顶部