我想请教, 用什么方法可以比较容易地算出一篇 (或数篇) 附码文本中共有多少名词、动词等实词 (最好是用检索软件而不用手工计算)?
还有一个问题, 在把一个文本用 CLAWS 附码之后, 我发现原本连续的一句话在换行处会出现中断, 这好像会影响检索结果。例如下面这句话, 本来 makes a point of 是一个连续的短语, 但处理过之后 makes_VVZ a_AT0 和 point_NN1 of_PRF 因换行断开了, 结果就检索不到这个短语了。这是怎么回事呢? 谢谢并祝大家教师节快乐!
The_AT0 seller_NN1 ,_, on_PRP the_AT0 other_AJ0 hand_NN1 ,_, makes_VVZ a_AT0
point_NN1 of_PRF protesting_VVG that_CJT the_AT0 price_NN1 he_PNP is_VBZ
charging_VVG is_VBZ depriving_VVG him_PNP of_PRF all_DT0 profit_NN1 ,_,
and_CJC that_CJT he_PNP is_VBZ sacrificing_VVG this_DT0 because_PRP21 of_PRP22
his_DPS personal_AJ0 regard_NN1 for_PRP the_AT0 customer_NN1 ._.
还有一个问题, 在把一个文本用 CLAWS 附码之后, 我发现原本连续的一句话在换行处会出现中断, 这好像会影响检索结果。例如下面这句话, 本来 makes a point of 是一个连续的短语, 但处理过之后 makes_VVZ a_AT0 和 point_NN1 of_PRF 因换行断开了, 结果就检索不到这个短语了。这是怎么回事呢? 谢谢并祝大家教师节快乐!
The_AT0 seller_NN1 ,_, on_PRP the_AT0 other_AJ0 hand_NN1 ,_, makes_VVZ a_AT0
point_NN1 of_PRF protesting_VVG that_CJT the_AT0 price_NN1 he_PNP is_VBZ
charging_VVG is_VBZ depriving_VVG him_PNP of_PRF all_DT0 profit_NN1 ,_,
and_CJC that_CJT he_PNP is_VBZ sacrificing_VVG this_DT0 because_PRP21 of_PRP22
his_DPS personal_AJ0 regard_NN1 for_PRP the_AT0 customer_NN1 ._.