各位:
目前由于缺乏可以免费共享的汉语口语语料库,不少人经常要问别人要材料,现在提议,
本站网友及其他同好是否可以共同参与,有能力者哪怕每人贡献一个录音/录像,假以时日,汇集起来就相当可观了。以下是一些初步想法及问题。
1)争取以数码录像为主,数码录音也不排斥。
2)音像材料尽可能要有完整的背景信息(具体内容可议)。
3)集体协议,规定一些话语类型,争取扩大语料的覆盖面,不要集中在少数几个方面(比如广播等)。
4)应规定最基本的转写规则。初始阶段以宽式为主,逐步细化。
5)全部有关资料比须数字化,以便存档,并且可以减少财政开支(目前没有一分钱)。
6)不能贡献录音录像者,应在转写上作贡献。
7)凡有贡献者都可使用所有语料。
8)法律问题:必须争得被录音录像人的书面同意,全部材料允许(有限程度的)公开、非商业使用。
以上提议仅供参考,请大家提意见,达成共识。
毫无疑问,道路是曲折的,但前途也是光明的。
陶红印 2007.6.6
目前由于缺乏可以免费共享的汉语口语语料库,不少人经常要问别人要材料,现在提议,
本站网友及其他同好是否可以共同参与,有能力者哪怕每人贡献一个录音/录像,假以时日,汇集起来就相当可观了。以下是一些初步想法及问题。
1)争取以数码录像为主,数码录音也不排斥。
2)音像材料尽可能要有完整的背景信息(具体内容可议)。
3)集体协议,规定一些话语类型,争取扩大语料的覆盖面,不要集中在少数几个方面(比如广播等)。
4)应规定最基本的转写规则。初始阶段以宽式为主,逐步细化。
5)全部有关资料比须数字化,以便存档,并且可以减少财政开支(目前没有一分钱)。
6)不能贡献录音录像者,应在转写上作贡献。
7)凡有贡献者都可使用所有语料。
8)法律问题:必须争得被录音录像人的书面同意,全部材料允许(有限程度的)公开、非商业使用。
以上提议仅供参考,请大家提意见,达成共识。
毫无疑问,道路是曲折的,但前途也是光明的。
陶红印 2007.6.6