如何为VOA双语新闻做对齐

各位C友,
我是一个单枪匹马学习语料库的人,周围没有一个老师的指导。哎!但有人说:勇者无敌!呵呵。

我搜集了2008和2009两年的VOA双语新闻,样例见附件,接下来怎么实现对齐啊?用什么软件?望各位C友提供宝贵的建议,本人感激不尽。

另外,我在 语料库语言学与英语教学http://sfs.scnu.edu.cn/corpus4u/default.aspx 网站注册过n次,都没有回复。请问这里有 华南师范大学外国语言文化学院语料库语言学研究室 的C友吗?给我个用户名和密码吧,或者帮忙通过我的注册请求。谢谢!

本人QQ"39706914 email: icomefromsp@yahoo.com.cn
 

附件

  • synews20080502a.txt
    3.3 KB · 浏览: 39
回复: 如何为VOA双语新闻做对齐

http://www.corpus4u.org/showthread.php?t=2228

对齐还真有需求啊,看来俺以后真的该办一个土法对齐的训练班.不过你那点东西太毛毛雨啦:D[/QUOTE]

简单、易用、方便,快捷就够了,word 、 excel用的好,殊途同归!没有什么土的,哈哈
 
回复: 如何为VOA双语新闻做对齐

Thank you very much, xusun575 and maggieq58. With your advice, I am going to try excel and tadoser.
 
回复: 如何为VOA双语新闻做对齐

I tried to align the material and I succeeded. My processing materials and the notes are attached.
 

附件

  • ecchseg.txt
    2 KB · 浏览: 41
  • ecenseg.txt
    2.2 KB · 浏览: 35
  • 对齐帮助.txt
    912 bytes · 浏览: 41
回复: 如何为VOA双语新闻做对齐

I tried to align the material and I succeeded. My processing materials and the notes are attached.

决心还真大啊!小批量对齐,很好. 这两条新闻对齐需要多少时间? 谢谢!
 
回复: 如何为VOA双语新闻做对齐

<seg> </seg> 其实可以不加吧,这个东西我已经试验过,其实比如paraconc对于硬回车本身就可以别为。
也就是说我试验过加了<seg>和没有加这个标记,直接就是硬回车的。效果一样。。。当然标记了<seg>看起来更清晰一些,大家不同意见欢迎交流
 
Back
顶部