各位大虾们,我这学期才接触语料库的知识,现在就要开始做报告了,很是郁闷,最近阅读了很多关于中文切词的文章,但是现在又对老师报告的要求有疑惑...
我现在的主要问题是: Corpus d'appentissage(学习) 和 Corpus de test 的区别.
我在WEKIBEDIA找到了关于CORPUS的一些解释,是法语的,英语好的应该也能看懂,我大概的翻译一下.
le corpus d'apprentissage, qui sert à retirer un modèle ou un classement à partir d'un nombre suffisant d'information ; (是服务于从满足一定数量的信息中取得一个模型或者一个分类)
le corpus de test, qui sert à vérifier la qualité de l'apprentissage à partir du corpus d'apprentissage. (是服务于从corpus d'apprentissage中验证学习的质量)
我不知道英文的说法,希望知道的能给个答案,实在是很重要~~~
另求 Un corpus multilingue(多语言语料),我看论坛都是双语的,可是我们的报告要求是一次处理四种语言的Chunks,不知道能否找到这样的资源.
万分感谢~~~
我现在的主要问题是: Corpus d'appentissage(学习) 和 Corpus de test 的区别.
我在WEKIBEDIA找到了关于CORPUS的一些解释,是法语的,英语好的应该也能看懂,我大概的翻译一下.
le corpus d'apprentissage, qui sert à retirer un modèle ou un classement à partir d'un nombre suffisant d'information ; (是服务于从满足一定数量的信息中取得一个模型或者一个分类)
le corpus de test, qui sert à vérifier la qualité de l'apprentissage à partir du corpus d'apprentissage. (是服务于从corpus d'apprentissage中验证学习的质量)
我不知道英文的说法,希望知道的能给个答案,实在是很重要~~~
另求 Un corpus multilingue(多语言语料),我看论坛都是双语的,可是我们的报告要求是一次处理四种语言的Chunks,不知道能否找到这样的资源.
万分感谢~~~