关于建立共享汉语口语语料库的设想

#22
回复: 关于建立共享汉语口语语料库的设想

我是一名高 校 老 师 , 正 在 做 一 个 学 校 的 项 目 , 是 关 于 “ 陕 北 方 言 语 料 库 ”的 建 设 , 一 定 支 持 这 个 项 目 。 建 议 ; 一 是 尽 快 组 织 起 一 个 团 队 , 人 员 构 成 首 先 是 地 域 。 二 是 建 立 一 个 泛 组 织 机 构 , 统 一 协 调 这 个 工 程 。 三 是 实 施 方 案 , 既 然 是 一 个 项 目 , 就 应 当 按 一 个 项 目 的 要 求 来 做 , 请 有 这 方 面 经 验 的 人 来 做 这 个 工 作 。

我 的 联 系 方 式 QQ: 18806603, 加 我 请 说 明 语 料 库 建 设 。 咱 们 组 织 一 个 群 就 好 办 好 了 。
 

MR_datum

多语言语音语料库 点通
#23
回复: 关于建立共享汉语口语语料库的设想

我们这边,少数民族语言和普通话有,方言暂时还真没开始建设
 
#24
回复: 关于建立共享汉语口语语料库的设想

We can probably follow the CHILDES model.

各位:

目前由于缺乏可以免费共享的汉语口语语料库,不少人经常要问别人要材料,现在提议,
本站网友及其他同好是否可以共同参与,有能力者哪怕每人贡献一个录音/录像,假以时日,汇集起来就相当可观了。以下是一些初步想法及问题。

1)争取以数码录像为主,数码录音也不排斥。
2)音像材料尽可能要有完整的背景信息(具体内容可议)。
3)集体协议,规定一些话语类型,争取扩大语料的覆盖面,不要集中在少数几个方面(比如广播等)。
4)应规定最基本的转写规则。初始阶段以宽式为主,逐步细化。
5)全部有关资料比须数字化,以便存档,并且可以减少财政开支(目前没有一分钱)。
6)不能贡献录音录像者,应在转写上作贡献。
7)凡有贡献者都可使用所有语料。
8)法律问题:必须争得被录音录像人的书面同意,全部材料允许(有限程度的)公开、非商业使用。

以上提议仅供参考,请大家提意见,达成共识。
毫无疑问,道路是曲折的,但前途也是光明的。

陶红印 2007.6.6
 

joe

初级会员
#25
回复: 关于建立共享汉语口语语料库的设想

这个倡议是3年前提出来的,不知有没有实质性的进展?
 
顶部