急求:没有经过词性赋码的Brown Corpus

回复: 急求:没有经过词性赋码的Brown Corpus

Google一下: filetype:txt Brown corpus
 
回复: 急求:没有经过词性赋码的Brown Corpus

既然知道nltk,应该会一些基本的文本处理手段,比如搜索替换,在网站搜索一下吧
 
Brown Corpus可以有,赋码也可以没有!

我已经在最近的另一个回帖中提供了“两个母语语料库(Brown,LOB)

http://www.corpus4u.org/forum/showthread.php?t=7906

直接提供,免费下载,没有版权的。

只有不到4MB哟,下载之后,用我提供的“Bright Corpus Detagger”点一下,就处理干净了所有的词性赋码标签了,每秒8MB的处理速度呢!

http://www.corpus4u.org/forum/showthread.php?t=7985

“李亮版语料标注标签的删除与提取工具 1.0【大容量高速独立exe版】”的中文版和英文版,都是:高速,强大,灵活,兼容。它俩能处理各种文字编码,并且有8MB每秒以上的处理速度,哪怕用1.2GB的TXT文件进行测试也只需要2.5分钟而已,而且能对超大文件(4GB以下)进行闪电般的KWIC和Concgram的独立提取为一个txt文件呢!本软件不仅支持“语料标签删除”,也同时进行“语料标签提取”呢,对于某些特殊需要 的朋友来说也是一个巨大福音!!!
 
回复: 急求:没有经过词性赋码的Brown Corpus

dingo.sbs.arizona.edu/~hammond/ling696f-sp03/browncorpus.txt
 
回复: 急求:没有经过词性赋码的Brown Corpus

我有Brown1 和2,没有词性赋码,但我也在苦恼1和2有什么区别。发给你吧
======================
您好,我是研二的学生,也急求Brown1 和2,没有词性赋码的,能麻烦您也发一份给我吗?万分感谢!!!!!:eek::eek::eek:
 
Back
顶部