maggieq58
语料人生
首先我是一个后来者,新人,所以我说的有些不对的,大家还多指正。
接触语料库有一段时间了,最近有些困惑和迷茫。频数,搭配,语域,类联接,各种统计公式(T-SCORE,Z-SCORE, MI,etc.)各种统计软件的使用,学习者语料库,在线检索,NS corpus,...一直在不停的算,统计,检索,RE提取,语料库不断的追求large-scale。但这一切。。。让我自己迷茫了。我在做什么?我想做什么?这一切的统计是否。。。
现在流行做多模态语料库,技术更新的确很快。如我看的双语字幕电影一样。。我想到乔姆斯基曾经对语料库做出的批评,我没觉得他是完全对的。但我的感觉很复杂。
我们到底想用语料库证明什么,说明些什么。我们到底还能如何使用语料库?怎样使语料库的研究方向向纵深发展,研究方法上是否需要突破。其实百度和google本身就是一个大型的实时更新的大型语料库,互联网就是一个大型语料库。
是我理论功底不够,我想。我需要继续学习。
接触语料库有一段时间了,最近有些困惑和迷茫。频数,搭配,语域,类联接,各种统计公式(T-SCORE,Z-SCORE, MI,etc.)各种统计软件的使用,学习者语料库,在线检索,NS corpus,...一直在不停的算,统计,检索,RE提取,语料库不断的追求large-scale。但这一切。。。让我自己迷茫了。我在做什么?我想做什么?这一切的统计是否。。。
现在流行做多模态语料库,技术更新的确很快。如我看的双语字幕电影一样。。我想到乔姆斯基曾经对语料库做出的批评,我没觉得他是完全对的。但我的感觉很复杂。
我们到底想用语料库证明什么,说明些什么。我们到底还能如何使用语料库?怎样使语料库的研究方向向纵深发展,研究方法上是否需要突破。其实百度和google本身就是一个大型的实时更新的大型语料库,互联网就是一个大型语料库。
是我理论功底不够,我想。我需要继续学习。