AntConc语料库分析紧急求助

各位老师,我的毕业论文是分析一部电视剧中的性别语言差异,在做开题报告的时候,设想是通过语料库统计词频,来分析男性和女性词汇使用整体差异以及在不同场景下的差异。(因为觉得用语料库分析会比较客观准确)

之所以考虑从词频方面入手,是因为我不是语言学专业学生,专业的分析可能做不来,感觉这个应该会简单一点。

问题来了,在经过两个多月的电视剧字幕转写,分类之后,做出的词频统计,男性和女性词频排名前20都是人称代词,语气词,语气助词这种,几十名开外才会有实词。然后得出这个结果之后就突然不知道该怎么分析了,因为一开始的设想可能没打算分析这种词性,现在就完全不知道如何下手了。

求各位老师和大神指导一下往下走的思路
因为不是语言学专业的学生,之前没接触过这些东西,然后看了很多论文但是可借鉴的也不多,所以一时间真的不知道如何下手了。

花了2个月的时间做这个,但是突然有一种白费功夫的感觉,实在有些着急了,求求路过的大神指点迷津
 
你好!你的研究课题很有意思。首先,词表中的高频词为人称代词等是对的,因为这就是语言事实。第二,你是否读过Paul Baker 的文章呢?他对gender的研究是比较深入的,而且是corpus based studies。如果你接触比较少的话,推荐你看一下他的一本书: Paul Baker (2014) Using corpora to analyse gender, 可以重点看第二章的Corpus approaches to sex difference。里面提到了一些英语性别差异的研究,比如男性说那种swear words 'fuck' 及一些discourse markers 'yeah' 多于女性。这些研究应该会对你的分析有帮助。Paul Baker 在这章也分析了sex difference,但是他认为共性比差异性更明显。所以,如果你也发现类似的现象,其实也很好。第三,不知道你的数据规模有多大,单纯根据词频的多少来解释性别有无差异是不太合理的,其他的统计方法也需要考虑。而且再解释你的统计结果时最好说明这只能说明这一部电视剧的情况,不能说明男性和女性词汇使用的整体差异,因为一部电视剧的数据不会很大,不能代表男性和女性整体。最后,一部电视剧的转写数据其实严格上地说并不是一个‘语料库’,但是你的研究的跟语料库定量研究一样也是采用统计的方法。所以我觉得你不需要用语料分析这样的表述,定量研究或统计方法就特别好,比较科学。

这是我的一点点思考,希望对你的研究有帮助!
 
你好!你的研究课题很有意思。首先,词表中的高频词为人称代词等是对的,因为这就是语言事实。第二,你是否读过Paul Baker 的文章呢?他对gender的研究是比较深入的,而且是corpus based studies。如果你接触比较少的话,推荐你看一下他的一本书: Paul Baker (2014) Using corpora to analyse gender, 可以重点看第二章的Corpus approaches to sex difference。里面提到了一些英语性别差异的研究,比如男性说那种swear words 'fuck' 及一些discourse markers 'yeah' 多于女性。这些研究应该会对你的分析有帮助。Paul Baker 在这章也分析了sex difference,但是他认为共性比差异性更明显。所以,如果你也发现类似的现象,其实也很好。第三,不知道你的数据规模有多大,单纯根据词频的多少来解释性别有无差异是不太合理的,其他的统计方法也需要考虑。而且再解释你的统计结果时最好说明这只能说明这一部电视剧的情况,不能说明男性和女性词汇使用的整体差异,因为一部电视剧的数据不会很大,不能代表男性和女性整体。最后,一部电视剧的转写数据其实严格上地说并不是一个‘语料库’,但是你的研究的跟语料库定量研究一样也是采用统计的方法。所以我觉得你不需要用语料分析这样的表述,定量研究或统计方法就特别好,比较科学。

这是我的一点点思考,希望对你的研究有帮助!
十分感谢您的建议以及提供的参考书,我后面把您说的书目去研究一下。同时这几天也做了一些思考,根据您的意见不知可否再咨询您一个问题?

您说的其他的统计方法是指技术手段方面还是角度方面(词语、语音等多方面比较)?我从词语角度入手是考虑到如果从句型、词语、语音等多个方面综合,可能会出现每个角度都写的比较浅薄,没有深度。技术手段方面,目前见到的比较多的以及目前所使用的使用语料库软件进行统计。目前的做法是:
一.通过词频表对比男性和女性在不同词性、主题词、关键词使用上的差别
二.进行语境划分,分析男性女性在不同语境下的词语使用差异
【设想:根据这两天的数据观察及研读的论文,如果只看词频大小、多少,感觉只有数字差异难以撰写论文,还应该进一步深入该词背后的词语搭配、语义韵等方面是否存在差异】
不知如果这样的话是否仍旧存在您提到的“单纯根据词频的多少来解释性别有无差异是不太合理 ”这一问题呢?
 
十分感谢您的建议以及提供的参考书,我后面把您说的书目去研究一下。同时这几天也做了一些思考,根据您的意见不知可否再咨询您一个问题?

您说的其他的统计方法是指技术手段方面还是角度方面(词语、语音等多方面比较)?我从词语角度入手是考虑到如果从句型、词语、语音等多个方面综合,可能会出现每个角度都写的比较浅薄,没有深度。技术手段方面,目前见到的比较多的以及目前所使用的使用语料库软件进行统计。目前的做法是:
一.通过词频表对比男性和女性在不同词性、主题词、关键词使用上的差别
二.进行语境划分,分析男性女性在不同语境下的词语使用差异
【设想:根据这两天的数据观察及研读的论文,如果只看词频大小、多少,感觉只有数字差异难以撰写论文,还应该进一步深入该词背后的词语搭配、语义韵等方面是否存在差异】
不知如果这样的话是否仍旧存在您提到的“单纯根据词频的多少来解释性别有无差异是不太合理 ”这一问题呢?
你好!我没有做过gender方面的研究,但是国外的确在这方面研究挺多的。我想你看了Paul Baker的研究应该会有思路。另外,我想再推荐我们国内学者的两篇著作:Occupational gender segregation and gendered language in a language without gender: trends, variations, implications for social development in China (2021)这篇发表在了Nature 上【Occupational gender segregation and gendered language in a language without gender: trends, variations, implications for social development in China | Humanities and Social Sciences Communications (nature.com) 】;基于语料库的我国职业性别无意识偏见共时历时研究 (2021). 里面有一些统计方法的使用,比如方差,平均差,概率等。这是我想要说的其他的统计方法。因为频次是最基本的,单纯靠词频来解释研究非常单薄。我提到的这些文章都是以语料库为基础做的研究。

你可以多看一下别人的研究,然后跟导师主动积极的沟通。导师的意见是很重要的。加油!
 
你好!我没有做过gender方面的研究,但是国外的确在这方面研究挺多的。我想你看了Paul Baker的研究应该会有思路。另外,我想再推荐我们国内学者的两篇著作:Occupational gender segregation and gendered language in a language without gender: trends, variations, implications for social development in China (2021)这篇发表在了Nature 上【Occupational gender segregation and gendered language in a language without gender: trends, variations, implications for social development in China | Humanities and Social Sciences Communications (nature.com) 】;基于语料库的我国职业性别无意识偏见共时历时研究 (2021). 里面有一些统计方法的使用,比如方差,平均差,概率等。这是我想要说的其他的统计方法。因为频次是最基本的,单纯靠词频来解释研究非常单薄。我提到的这些文章都是以语料库为基础做的研究。

你可以多看一下别人的研究,然后跟导师主动积极的沟通。导师的意见是很重要的。加油!
好的,十分感谢您的回复!我研读一下
 
Back
顶部