我最近在做关于科技英语的词汇方面的内容。科技英语词汇可以分为技术词、次技术词、半技术词和非技术词。为了提取其中的半技术词(semi-technical words),最近看到一篇文章是这样做的:
先把科技英语语料库做词表,然后再用BNC的词表做reference,做出科技英语语料库中的keyword,然后选择其中key值为正的关键词,进行人工的分类,再用统计软件检测分类的一致性。总感觉这样的方法有点不妥,又讲不出所以然,麻烦大家帮忙看看。这样的问题是要做keyword呢,还是直接对wordlist进行分类呢?这里做keyword的根据是什么呢?看那篇文章很多遍都没有找到作者交代的根据。把文章也发给大家,大家一起讨论讨论。
先把科技英语语料库做词表,然后再用BNC的词表做reference,做出科技英语语料库中的keyword,然后选择其中key值为正的关键词,进行人工的分类,再用统计软件检测分类的一致性。总感觉这样的方法有点不妥,又讲不出所以然,麻烦大家帮忙看看。这样的问题是要做keyword呢,还是直接对wordlist进行分类呢?这里做keyword的根据是什么呢?看那篇文章很多遍都没有找到作者交代的根据。把文章也发给大家,大家一起讨论讨论。