求助:【500万微博语料】请问是因为数据太大,所以antconc打不开么?

【500万微博语料】北理工搜索挖掘实验室主任@ICTCLAS张华平博士 提供500万微博语料供大家使用,文件为sql文件,只能导入mysql数据库。但是下载之后是txt格式,可以用notepad++打开,但是操作不了。试着用antconc打开,但是一直不成功。请问各位老师知道原因么?或者有其他有关网络语言的语料库推荐么?最好是近几年新一点的。真地非常感谢。
 
请提供以下500万微博语料的下载链接,我们也帮着测试一下。
 
谢谢分享。我看了是500MB,那是肯定无法用AntConc打开的。如果是500万词或许还有可能。
 
没有。

WordSmith中有个Index(索引功能)可以实现上亿此次的检索、词表分析。2GB字节的语料,单机软件不大现实。
 
Back
顶部