求“A的A,B的B”格式语料!重复结构的检索

请问在哪儿可以找到“A的A,B的B”格式的语料?如“大的大,小的小;打球的打球,跑步的跑步”。此格式在北大CCL语料库中应该怎样检索?新手上路,烦请各位帮忙!
 
回复: 求“A的A,B的B”格式语料!

同志哥,这样的格式是无穷的,CCL也收不齐;只能一个一个写。
 
回复: 求“A的A,B的B”格式语料!

如果是为了研究这类格式的特点,我倒觉得你可以先多读读前人的研究成果,观察他们的研究方法和语料来源,然后再来考虑如何搜集语料的问题。
 
回复: 求“A的A,B的B”格式语料!

如果你自己有文本的话,不妨用正则表达式 (.*)的\1 试试,看看能不能检索出这种复用格式。
 
Back
顶部