北大汉语语料库 + 分词赋码工具 ICTCLAS

laohong

管理员
Staff member
#1
#3
回复: 北大汉语语料库

前辈,如果我想搜索一个格式,怎么搜索呢?比如我想搜“N+A+(地)+V+O”这一类,我没有自建什么语料库,也没有自己的搜索软件,但我目前做论文急需这方面的语料,请指教在哪里可以用格式搜得出,怎么搜?
我在国家语委语料库里设定了这样的格式:[FONT=宋体]/a+=1+[/FONT][FONT=宋体]地/u+=1+/v+=1+了/u+=1+一/m+=1+q+<>+/n[/FONT]
[FONT=宋体]搜出来的结果很少很少,请各位高手指条路![/FONT]
 
#4
回复: 北大汉语语料库

请问一下,北大语料库施出什么问题了吗?为什么现在都登不上去?
 
#5
求助:有没有对汉语语料自动词性赋码的软件

有没有专门的汉语语料词性赋码软件,准确率高,最好是免费的
 

xujiajin

管理员
Staff member
#12
回复: 北大汉语语料库

这个网站现在确实连不上,你问老洪,老洪也没办法。因为不是他干的。
 
#15
回复: 求助:有没有对汉语语料自动词性赋码的软件

有没有专门的汉语语料词性赋码软件,准确率高,最好是免费的
汉语词类到现在都还是个难题,虽然有了比较统一的划分标准,但是还是没有相应的词性标注软件出现。不知道有谁在研究这个,或者有试用的汉语词性赋码软件分享。如果有,可否发来共享一下?邮箱xiaoxiaoyueer@126.com谢谢
 

xujiajin

管理员
Staff member
#18
回复: 北大汉语语料库 + 分词赋码工具 ICTCLAS

没有。

几乎所有的分词工具都是基于现代汉语书面语的。

古汉语建议采取分字而不是分词。
 
#19
回复: 北大汉语语料库 + 分词赋码工具 ICTCLAS

好的,谢谢许老师,那么如果对古汉语处理,只能人工操作了吗?
 
顶部