L ljy0925 2024-11-27 #1 【500万微博语料】北理工搜索挖掘实验室主任@ICTCLAS张华平博士 提供500万微博语料供大家使用,文件为sql文件,只能导入mysql数据库。但是下载之后是txt格式,可以用notepad++打开,但是操作不了。试着用antconc打开,但是一直不成功。请问各位老师知道原因么?或者有其他有关网络语言的语料库推荐么?最好是近几年新一点的。真地非常感谢。
【500万微博语料】北理工搜索挖掘实验室主任@ICTCLAS张华平博士 提供500万微博语料供大家使用,文件为sql文件,只能导入mysql数据库。但是下载之后是txt格式,可以用notepad++打开,但是操作不了。试着用antconc打开,但是一直不成功。请问各位老师知道原因么?或者有其他有关网络语言的语料库推荐么?最好是近几年新一点的。真地非常感谢。
L ljy0925 2024-11-28 #5 作者 xujiajin: 谢谢分享。我看了是500MB,那是肯定无法用AntConc打开的。如果是500万词或许还有可能。 Click to expand... 好的,谢谢许教授。那请问有能打开2GB的类似AntConc的工具推荐么?
作者 xujiajin: 谢谢分享。我看了是500MB,那是肯定无法用AntConc打开的。如果是500万词或许还有可能。 Click to expand... 好的,谢谢许教授。那请问有能打开2GB的类似AntConc的工具推荐么?
xujiajin 管理员 Staff member 2024-11-28 #6 没有。 WordSmith中有个Index(索引功能)可以实现上亿此次的检索、词表分析。2GB字节的语料,单机软件不大现实。