How to write a thesis based on spoken data?

A common failure of existing books on corpora is that they focus only on why but not how, or only related to a particular corpus (e.g. the BNC or ICE-GB). I believe our new corpus book will change this situation by discussing why and giving demonstrations that lead readers step by step through each of the six case studies using difference corpora and tools.
 
回复:基于口语语料库的毕业论文如何进行?

以下是引用 asan822005-7-2 14:47:00 的发言:
I'm doing a research on contrastive study of english and chinese relative clauses for my MA degree.I wanted to use some intuition-based data,but my tutor suggested the corpus-based data was better( "more authoritative , more reliable"). The problem is that I never used corpus before and don't know how to use it. I bought a book related to corpus linguistics but find of little help.Perhaps I'm not that techonology-minded.Would anyone give me a hand?

汉语方面你可以用LCMC(兰开斯特汉语语料库),英语方面你可以用FLOB
FLOB and Frown are one million word balanced corpora for modern written British and American English (the 1991 updates of LOB and Brown).

They are now freely available (only on the corpus4u site) for searching using our WebConc

http://www.ling.lancs.ac.uk/corplang/cgi-bin/FreiburgConC.pl

If you have a copy of Xaira, you can also access FLOB by opening the coprus with your xaira Client using the following as the corpus name

http://www.ling.lancs.ac.uk/corplang/flob/flob.xcorpus

Lancaster Corpus of Mandarin Chinese
http://bowland-files.lancs.ac.uk/corplang/cgi-bin/conc.pl
 
其他的汉语语料库在这里再贴一下吧:
Academia Sinica Balanced Corpus of Modern Chinese
http://www.sinica.edu.tw/SinicaCorpus/

Peking University Modern Chinese Corpus
http://ccl.pku.edu.cn/ccl_corpus/xiandaihanyu/

Xiamen University corpora (registration required but free)
http://xmuoec.com/gb/hanyu/hanyu/data/corpus/index.htm

Beijing Language and Culture University corpus
http://202.112.195.8:8089/ccir_login?input=*

Lancaster Corpus of Mandarin Chinese
http://bowland-files.lancs.ac.uk/corplang/cgi-bin/conc.pl

Leeds Chinese corpus
http://corpus.leeds.ac.uk/query-zh.html

PFR People's Daily corpus (01/1998)
http://bowland-files.lancs.ac.uk/corplang/pdcorpus/pdcorpus.htm

PH corpus (Xinhua newswire data 1990-1991)
http://bowland-files.lancs.ac.uk/corplang/phcorpus/phcorpus.htm

People's Daily 2000 corpus
http://bowland-files.lancs.ac.uk/corplang/pdc2000/default.htm

Peking University Ancient Chinese Corpus
http://ccl.pku.edu.cn/ccl_corpus/jsearch/index.jsp?dir=gudai

Sinica corpus of early Chinese
http://www.sinica.edu.tw/Early_Mandarin/

Sheffield Corpus of Chinese for Diachronic Linguistic Study
http://www.shef.ac.uk/scc/
 
回复:基于口语语料库的毕业论文如何进行?

以下是引用 zhmabel2005-6-16 12:04:06 的发言:
各位大侠,特别是这个论坛上发布很多帖子的精英们,本人现在就要着手进行硕士的毕业论文了,可是由于这几年来都不太勤于学业,以至现在不知道如何进行,连开题都难以定夺。本人导师是研究语料库的,很希望其弟子能够在口语方面有所研究,可是我现在都还不知道口语有哪些方面可以着手创造出一篇论文出来,所以请教各位,帮在下一把了!!!

您还没说您打算研究中文还是英文呢。
 
火车不是推的,论文不是造的。这种思想要不得。基于语料库的研究尤其要求耐心、责任心和钻研精神。静下心来好好想想有什么可以做的,再跟导师讨论讨论。有问题当然也欢迎拿到这里来切磋切磋。大家共同学习、提高。
 
多谢各位好心人的帮助和建议,上次求助疏忽了一些问题,我是英语专业的学生,所以要进行英语语料库的研究,导师给了我一些高校四六级口语考试的VIDEO,希望能将其TRANSCRIPT作为自己研究的语料,可是大家应该了解TRANSCRIPT的工作是很艰巨的,我想想要把那些听都听不是很明白的口语转写下来就头疼,我想放弃这个方法,不知道还有没有其他的办法呢!
 
回复:基于口语语料库的毕业论文如何进行?

是不是导师想让你帮助转写语料?如果不是而自己又对那些语料不感兴趣,
可以利用网上已有的英语语料,把时间更多地用到研究问题上面。
 
回复:基于口语语料库的毕业论文如何进行?

以下是引用 zhmabel2005-7-4 11:57:30 的发言:
多谢各位好心人的帮助和建议,上次求助疏忽了一些问题,我是英语专业的学生,所以要进行英语语料库的研究,导师给了我一些高校四六级口语考试的VIDEO,希望能将其TRANSCRIPT作为自己研究的语料,可是大家应该了解TRANSCRIPT的工作是很艰巨的,我想想要把那些听都听不是很明白的口语转写下来就头疼,我想放弃这个方法,不知道还有没有其他的办法呢!

如果是自己整理语料,转写这些工作是跳不过去的,这是你后续工作的基础。
否则,就只有,像动态语法说的那样,用现成的语料了。
 
我觉得转写这些素材另行建库意义不大。南大文秋芳教授课题组已开发了一个英语专业口语库即将出版。

可以考虑用Santa Barabara Corpus of Spoken American English Corpus。该库已出版的Parts1-5共46个文件可在TalkBank免费下载。或者使用ICE各子库中的口语材料,也是免费的,但要与UCL项目组联系取得解压下载文档的密码。
 
昨晚偶给导师打电话表达了自己不想转写口语的念头,说转写太难了,可是被导师驳回了,说转写又有多难啊,还不是有人做的很好吗,唉,偶就无话可说了!!!可是即便我不畏艰难,花了很多时间去转写,也不知道写口语哪方面的东西啊,请大家帮忙想几个可以研究的TOPIC吧,偶想在这几天就把题目给定下来,不然开题报告就完不成了!因为要转写的是大学生四六级的口语考试, 内容无非是自我介绍和两三个同学一组的交流对话,不知道能从中挖掘些什么东西出来?今晚就和导师见面了,现在脑子里一点概念都没有呢,不过偶想争取能说服导师不要转写,那就最好了,呵呵!
 
回复:基于口语语料库的毕业论文如何进行?

以下是引用 xiaoz2005-7-5 7:04:28 的发言:
我觉得转写这些素材另行建库意义不大。南大文秋芳教授课题组已开发了一个英语专业口语库即将出版。

可以考虑用Santa Barabara Corpus of Spoken American English Corpus。该库已出版的Parts1-5共46个文件可在TalkBank免费下载。或者使用ICE各子库中的口语材料,也是免费的,但要与UCL项目组联系取得解压下载文档的密码。
感觉你你说的都好专业啊,怎么有点看不懂呢?这些库我都没听过呢,我目前都还没有现成的口语语料库,不知道怎么弄的到啊?
 
Download the Santa Barabara Corpus of Spoken American English here (select SBCSAE):

http://talkbank.org/data/Conversation/

Download the completed components of ICE (International Corpus of English) at the ICE home hosted at University College London:

http://www.ucl.ac.uk/english-usage/ice/

You will be licensed so that you can get passwords to unzip the downloaded corpora. See the corpus website for details.
 
回复:基于口语语料库的毕业论文如何进行?

以下是引用 xujiajin2005-7-5 14:39:49 的发言:
http://talkbank.org/data/
打开之后里面的压缩文件下载下来,只有一部分可以看到,而且不是转写的语料本身,好象是转写者自己关于一些口语问题的观点和看法。哪里有转写的语料可以看啊,不知道转写是怎么转写的,有没有什么标准和模式呢?
 
好象要下载什么软件才可以看到里面的东西吧?CLAN是个什么工具啊,经常见到,是要下载这个吧?
 
下载了CLAN,好复杂啊,都不知道怎么安装上去,唉,语料库真把我害苦了啊 !
 
You can download and use CLAN to view those files if you will. But you can also load them into a concordancer.
 
回复:基于口语语料库的毕业论文如何进行?

以下是引用 zhmabel2005-7-6 11:23:51 的发言:
下载了CLAN,好复杂啊,都不知道怎么安装上去,唉,语料库真把我害苦了啊 !

Sigh...
 
终于可以看到下载的东东了,可是转写的材料怎么那么复杂啊,很多符号和标志,看都看不懂,不知道都代表什么意义呢?
 
Back
顶部