最近在用SWECLL2.0的WECLL的预料做检索,发现了很多文件的内容是一模一样的,不知道是我买的光盘的原因,还是这个语料库本身的错误?请问有人跟我一样么?举几个例子
WARG0475和WARG0865完全重复
WARG4139和WARG3749完全重复
WARG0008和WARG0398完全重复
。。。。。。。。。。。
好像还有很多。。。。
这样子检索结果数据怎么可靠啊
WARG0475和WARG0865完全重复
WARG4139和WARG3749完全重复
WARG0008和WARG0398完全重复
。。。。。。。。。。。
好像还有很多。。。。
这样子检索结果数据怎么可靠啊