bnc 能够检索一个词在句首的次数吗?

我想要检测as 一词在句首和段首的频数, 这个不知道能否实现,


我现在自己可以做的就是用wordsmith 检索as_cjs 然后 case sensitive resorting , 这样能够得到 大写AS 在1975 个as_cjs 中出现过的次数, 但要往下分析还需要bnc的数值,bnc 能区别大小写吗?
这个不知道能不能做到, 另外, 段首的频数我也不知道怎么获得, 请老师们不吝赐教
谢谢谢谢!:)
 
不知道你的目的是什么。也许是我没有理解你的问题吧。用在句首(段首也是句首)的as形式是As,把语料库去码检索下不就可以么?
 
回复: bnc 能够检索一个词在句首的次数吗?

谢谢您的回复,
您说的对, 我的目的是先区分词性, 然后再检查大小写, 因为 as 有三种词性, 每种词性时的搭配也很不相同所以, 如果不加码就没有区别度了, 另外您知道为什么我用claw trial service 给clec 加码完成后, 词条的频率会减少吗,

我用的方法是 将clec 切割成 约五万字每个的txt 文档, 20个, 然后再逐个加码, 这样做了两遍, 还是少了, 实在不明白是怎么回事
 
Re: 回复: bnc 能够检索一个词在句首的次数吗?

谢谢您的回复,
您说的对, 我的目的是先区分词性, 然后再检查大小写, 因为 as 有三种词性, 每种词性时的搭配也很不相同所以, 如果不加码就没有区别度了, 另外您知道为什么我用claw trial service 给clec 加码完成后, 词条的频率会减少吗,

我用的方法是 将clec 切割成 约五万字每个的txt 文档, 20个, 然后再逐个加码, 这样做了两遍, 还是少了, 实在不明白是怎么回事
你的问题可能是两种:1. 找出as作连词的情况,这个较易做到;2. 找出as作连词,而且用于句首(包括段首),这个也不难,因为检索As_cjs (不知道你使用什么附码系统,CLAWS7里面as作连词时码为CSA)就能够说明。段首as作连词使用表达式检索,在表达式前面加上^,表示字符串开头。
你使用的网络claw trial service 是否全部给你的文件附码了呢?我试了下,发现粘上去的那么多词(当然是少于10万)经过附码后,附码页面的最后一个词并不是原来最后的那个词。这可能是导致频率下降的一个原因吧。
 
Back
顶部