求助:WordSmith能对附码语料库进行检索吗

回复: 求助:WordSmith能对附码语料库进行检索吗

ws 目前还不支持正则表达式。可以用antcon 来试试看,它是支持的。
 
关于对从句的检索工具

请问:检索语料库中matrix sentence,clause; finite,non-finite sentence什么软件能实现?我用WS能试出临近的动词,但如果两个动词之间有其他结构,能否用字符串替代呢?
 
回复: 关于对从句的检索工具

请问:检索语料库中matrix sentence,clause; finite,non-finite sentence什么软件能实现?我用WS能试出临近的动词,但如果两个动词之间有其他结构,能否用字符串替代呢?

想在生语料或词性附码的语料里做到任何涉及到句法层面的检索都不是件容易的事情,即使使用一些pattern搭配也很难准确穷尽千变万化的语言形式。建议最好考虑在syntaxtically parsed的语料中进行。例如,在这样个matrix sentence: The dog that ate the raw fish died. 即使有了词性附码:The/DT dog/NN that/WDT ate/VBD the/DT raw/JJ fish/NN died/VBD ./. 也很难检索到这个结构。而看一下parse后的树形图,情况就不一样了:

(ROOT
(S
(NP
(NP (DT The) (NN dog))
(SBAR
(WHNP (WDT that))
(S
(VP (VBD ate)
(NP (DT the) (JJ raw) (NN fish))))))
(VP (VBD died))
(. .)))

这里树形图显示不好,自己到Stanford Parser online试验一下就知道了:
http://josie.stanford.edu:8080/parser/index.jsp
 
回复: 求助:WordSmith能对附码语料库进行检索吗

多谢laohong指点. 我看到clause patterns in modern English里面对句法的研究很有意思;硕士学位论文相关内容很少。等博士论文再做好了:p
 
Back
顶部