英汉对照半成品:Jane Eyre和Scarlet leller 供分享

xusun575

高级会员
英汉名著对齐半成品:电扇中间产品,供分享、拍砖、灌水

说明:
1.半成品。§为段落标记(回车键为准);#为句标记(根据是带单、双引号或不带引号的“。,!,?”;英文是".,!,?")。
句标记思路俺是从laohong 那里“牵”来的,这里俺表示感谢:p
2.资料来自网络,未检验,恕无法保证其准确性。
3.除噪、句提取、为导入excel spreadsheet而制表分栏等操作,用的是word中的“宏”(即俺的“小台扇”:D),基于可一键完成。本人不会编程,郁闷呵:mad:
4. 下一步可作人工对齐,是力气活:一对一或一对多或一对跨句(涉及前句后一半或后句前一半),等等。
5.C友若有手工对齐心得或好主意,盼共享。
6.mandel君,你有“句对”抓取神器,虽不知上传材料是否符合你的要求,但仍希望mandel君能试一试此类文本“句层面”自动对齐的满意率:)
 

附件

  • janeEyre(E+C).rar
    1.1 MB · 浏览: 167
  • 红 字(中英对照待对齐).rar
    404.9 KB · 浏览: 54
  • pride[e+c].rar
    739.4 KB · 浏览: 52
  • pride(原材料).rar
    186 KB · 浏览: 56
  • red(原材料).rar
    326 KB · 浏览: 45
  • jane(原材料).rar
    812.3 KB · 浏览: 52
Last edited:
回复: 英汉对照半成品:Jane Eyre和Scarlet leller 供分享

对齐后的“red(原材料).rar”语料~~
 

附件

  • 对齐后的——red(原材料).rar
    388 KB · 浏览: 111
  • 对齐后的——jane(原材料).rar
    926.7 KB · 浏览: 102
"柠檬水英汉双语自动对齐软件"

谢谢zhangywibbb亮出真家伙.让俺开眼了:p,北大就是北大,厉害!
如此高的准确率,若非多文本比较,已经够好的啦.

"柠檬水英汉双语自动对齐软件"告诉我们:
1、知识确实是生产力;
2、小台扇能吹,那只是一点点的重要!:D


ps:知识与电风扇 (thanks to Laohong F3, http://www.corpus4u.org/showthread.php?t=4905)

联合华利引进了一条香皂包装生产线,结果发现这条生产线有个缺陷:常常会有盒子里没装入香皂。总不能把空盒子卖给顾客啊,他们只得请了一个学自动化的博士后设计一个方案来分拣空的香皂盒。博士后拉起了一个十几人的科研攻关小组,综合采用了机械、微电子、自动化、X射线探测等技术,花了几十万,成功解决了问题。每当生产线上有空香皂盒通过,两旁的探测器会检测到,并且驱动一只机械手把空皂盒推走。
 
中国南方有个乡镇企业也买了同样的生产线,老板发现这个问题后大为发火,找了个小工来说:“你他妈给老子把这个搞定,不然你给老子爬走。”小工很快想出了办法:他花了90块钱在生产线旁边放了一台大功率电风扇猛吹,于是空皂盒都被吹走了。

这个故事告诉我们:
1、知识并不一定都是生产力;
2、能吹是多么的重要!
 
回复: 英汉名著对齐半成品:电扇中间产品,供分享、拍砖、灌水

Share and you get. Get and you are expected to share, all dear there!:p
 

附件

  • 80days(E-C).rar
    476.5 KB · 浏览: 56
  • 80days(原材料).rar
    325.4 KB · 浏览: 44
Back
顶部