新人提问:我的这些工作有无意义

因为一些需要,我正在做一项把VOA每天新闻mp3和对应文本整理的工作,并且最近似乎能在音频自动断句上做点东西出来。

我是个新人,对语料库基本没有了解。我就想问问大家,我这样的工作和语料库中语料收集环节有没有关系,类似的东西目前进展如何,意义何在?

最好能给我些关键词之类的信息,如果能为发表论文指明方向,则更是感激不尽~
 
回复: 新人提问:我的这些工作有无意义

如果能做好了, 在几个方面上都会有有很大的贡献的。常见的口语语料库发布时由于种种原因无法做到音频和文本同步的,如果你的工作能把音频和文本的对应,本身就是一个贡献。如果还能在音频自动断句上搞点东西出来,做到time-aligned检索,那是再好不过了。
 
回复: 新人提问:我的这些工作有无意义

因为我对语料库基本上一点都不了解。还有很多问题:

1、所谓音文同步,是做到句的层面还是词的层面?
2、还有音频质量有没有要求,比如我现在用的VOA都是网上下的,然后整理的。只有纯人声,基本没有背景音?
3、我现在的想法至少能实现半自动断句,稍稍要一点人工干预。
4、另外,我查了查,类似的工作有很多论文涉及,那么实际使用的语料库这方面是个什么水平?
5、有没有什么关于语料库建设的概述文章或者帖子可以参考?

又问了很多问题,麻烦您受累解答了。
 
回复: 新人提问:我的这些工作有无意义

.....1、所谓音文同步,是做到句的层面还是词的层面?
主要看你的目的和能力,如果要做到检索每个词及其发音,那当然就最好做到词的层面。

.....2、还有音频质量有没有要求,比如我现在用的VOA都是网上下的,然后整理的。只有纯人声,基本没有背景音?
就你的研究目的来说,除了人声,你还想听到什么声音?

.....3、我现在的想法至少能实现半自动断句,稍稍要一点人工干预。
能做到这样也不错。

.....4、另外,我查了查,类似的工作有很多论文涉及,那么实际使用的语料库这方面是个什么水平?

那就应该在这些文献里找答案。


.....5、有没有什么关于语料库建设的概述文章或者帖子可以参考?
这个网站里就有很多。
 
回复: 新人提问:我的这些工作有无意义

It would be very useful in building spoken and/or multimedia corpora to be able to time-stamp transcripts and align them with digital audio files and/or video clips automatically, even at the level utterance units - of course even better at the level of turns, phrases, or words, if that be automated - the latter would be difficult if your program depends on the length of pauses alone, if it does not different between different sound waves.
 
Back
顶部