当然对技术的追求是无止境的,可是要多么好才算满足accoustic analysis的要求呢?以前md没出来的时候大家也还是得做研究啊。
不过我严重同意,在条件允许的情况下,data越精确越好,越广泛越好--这个充分说明了建立相关语料库的重要和迫切。比如说到汉语口语语料,先不说数量和可信赖度,居然都找不到一个可以access的库,光靠个人收集转写,质量当然参差不齐,可研究的范围和和精确度都会受很多影响。
我也是最近被这些语料问题弄得头大,多发两句牢骚。十万分的希望能早日看到一个优秀的,能够被广泛应用的汉语口语语料库。也许这个就是为什么corpus4u会这么有人气,大家都期待着呢。