想在CLEC中ST3和ST4中提取六万词,我遇到了两个困难:第一是CLEC是有附码的,怎么能够确定我想提取的词是多少字呢?用detagger只是去掉题目前面的,下载李亮老师的开发的软件还没下载下来。还是有什么软件能提取指定数目的文本而且没有附码的?第二是应该分别在ST3和ST4中提取三万字吗?是想和国外的语料库作对比研究。希望得到老师的回答,不胜感激
您好,请问您是否有CLEC的数据库?能否发给我?因为写本科毕业论文急用,找了一天都找不到。
我的邮箱:895477376@qq.com. 万分感谢!!
你说的“提取”是指随机抽取吗?你说的“词”和“字”都是指英语单词?
不好意思,你买一本书吧,尊重一下版权
想在CLEC中ST3和ST4中提取六万词,我遇到了两个困难:第一是CLEC是有附码的,怎么能够确定我想提取的词是多少字呢?用detagger只是去掉题目前面的,下载李亮老师的开发的软件还没下载下来。还是有什么软件能提取指定数目的文本而且没有附码的?第二是应该分别在ST3和ST4中提取三万字吗?是想和国外的语料库作对比研究。希望得到老师的回答,不胜感激