开帖记录语料库学习进展

菜鸟一人,刚触语料库,自学三天《语料库应用教程》,获益匪浅,亦感觉快乐充实;决定开贴记录学习进展,相信贵在坚持,希望和各位前辈及C友共勉。

2010年11月10日--12日
终于有时间静下心学习,这三天进展缓慢,应该是prior knowledge缺乏的缘故,硬着头皮读下去,发现书中提供很多实用,实在的知识及技巧,三天学了30多页,大致了解了语料库的一些基本知识,比如形符类符等以前没有听过的术语,就连功能设置区的说法也是第一次听说;学会了制表符用法;下载了EditPad Pro,了解使用了基本的正则表达法;12号下载了风林编写的3.0文本整理器,发现真是好东东,并且是免费使用,真应感其慷慨,发现里面有GB,Big5互换及好多有意思的功能,转换一首

《酬樂天揚州初逢席上見贈》
劉禹錫
巴山楚水淒涼地,二十三年棄置身。
懷舊空吟聞笛賦,到鄉翻似爛柯人。
沉舟側畔千帆過,病樹前頭萬木春。
今日聽君歌一曲,暫憑杯酒長精神。

《酬乐天扬州初逢席上见赠》
刘禹锡
巴山楚水凄凉地,二十三年弃置身。
怀旧空吟闻笛赋,到乡翻似烂柯人。
沉舟侧畔千帆过,病树前头万木春。
今日听君歌一曲,暂凭杯酒长精神。

今天刚刚开始学习,一日之计在于晨,加油中.....
 
回复: 开帖记录语料库学习进展

谢谢楼上前辈的关爱与鼓励!定当自勉,再接再厉 IoI

11月13-14日

这两天看书不多,杂事却多,下午晚上看到批量文本编辑,用EditPad Pro操作了一下,发现挺好玩,书中提到替换空格等符号要使用PowerGrep 软件,在expression-regulation 网站上就直接提供了下载,不过没有尝试,知道这个信息,以后如要使用再载:继续学习使用Regex,各种符号规则,greediness/laziness,加上?就lazy乐,真是有才!原来这种表达法是和编程有关,稍微看了其它语言Perl,Java。HTML对我都很新鲜,呵呵;看了一点点文本赋码介绍~~

感谢Dr. Xu 在C网上以前提供的Regex info,还有Baidu上的热心人~~
 
回复: 开帖记录语料库学习进展

我也在看语料库应用教程,很有同感哪,不过急着做论文,很想尽快搞懂自己需要的那部分语料库知识,觉得进展很慢哪,一起加油哦
 
回复: 开帖记录语料库学习进展

和楼上的一起加油!语料库学习进展目前还是挺慢,不过感觉很多知识倒是即学即用,挺实在的;老实讲也不知道这些东西目前到底有什么用,anyway,不积跬步,无以至千里,总有入C门的一天的^0^
11月15日
刚刚开始看元信息标注,meta-metadata 了解其构成;其中提到TreeTragger,还没有来得及下载实验;了解Macro 宏的使用方法,使用了这么多年MS Word,居然到今天才发现里面功能很强大;发现了金山WPS,与MS Word各有利弊,;无意间发现豆丁网,如果只是浏览会是挺不错的网站,内容丰富~~
 
回复: 开帖记录语料库学习进展

求助 各位高人
转写口语语料方法 或推荐相关书籍
拜谢各位高人 先
 
回复: 开帖记录语料库学习进展

最近在读Du Bois et al 1994 An outline of discourse transcription in Talking data, transcription and coding in discourse research J. Edwards & M. Lampert (eds) 45-87 Hillsdale NJ. Laurence Edbaum.
也许对你有点用、
 
回复: 开帖记录语料库学习进展

11/1/19

哪位大侠能告之在自动词性赋码工具中三类1 rule-based e.g Brill. 2 stochastic e.g.Claws 3. neural 之间的规则有什么区别?只言片语即可。没找到什么相关文献:confused:
 
回复: 开帖记录语料库学习进展

很高兴又看到你的学习记录了。

说实话,这个不需要弄清楚。
只要只能用赋码工具就可以了。
基于规则和基于概率的赋码一两句话不容易说得特别明白。
 
回复: 开帖记录语料库学习进展

谢谢Dr Xu的答复及鼓励:)
better late than never。希望能读好相关内容,早日入C门;)
 
Back
顶部