L libing923 2013-12-06 #1 最近,要做一个垃圾短信检测系统的实现,想找一些短信数据集(包括垃圾短信和正常短信)训练用,但网上找了好久,只有英文分类好的。中文好像没有分类好的,不知道有没有做过这方面研究的,求分享下一些有关资料。不甚感激! 我的邮箱:603374851@qq.com
最近,要做一个垃圾短信检测系统的实现,想找一些短信数据集(包括垃圾短信和正常短信)训练用,但网上找了好久,只有英文分类好的。中文好像没有分类好的,不知道有没有做过这方面研究的,求分享下一些有关资料。不甚感激! 我的邮箱:603374851@qq.com
chrisyang 普通会员 2013-12-07 #2 回复: 求助!想求一个已分类的中文短信语料库 看看新加坡国立大学的手机短信语料库(NUS SMS Corpus)是否对你有用: http://wing.comp.nus.edu.sg:8080/SMSCorpus/overview.jsp
回复: 求助!想求一个已分类的中文短信语料库 看看新加坡国立大学的手机短信语料库(NUS SMS Corpus)是否对你有用: http://wing.comp.nus.edu.sg:8080/SMSCorpus/overview.jsp
chrisyang 普通会员 2013-12-07 #4 回复: 求助!想求一个已分类的中文短信语料库 应该说垃圾短信的收集对于一般研究者来说是很难的一件事,更不要说要收集的量要达到一定的规模。如果没有电信运营商提供相关数据支持,建立个垃圾短信数据库还真是有难度的。
回复: 求助!想求一个已分类的中文短信语料库 应该说垃圾短信的收集对于一般研究者来说是很难的一件事,更不要说要收集的量要达到一定的规模。如果没有电信运营商提供相关数据支持,建立个垃圾短信数据库还真是有难度的。