大家好!
我构建的一个40万字左右汉语口语语料库已在GitHub上免费开放,网址:https://github.com/blculyn。这个语料库包括一个20多万字的汉语母语口语语料库(the spoken L1 corpus)和一个20多万字的汉语非母语语料库(the spoken L2 corpus)。所有的资料均可免费下载。
两个语料库包括的是informal speech。其中,汉语非母语语料库的L2 speakers基本上都是在日常生活中需要使用汉语的人,而不是在校的汉语学习者。他们都是英语母语者,且不是汉语继承语者(non-Chinese...