强化法制建设,对齐法律文本供分享

xusun575

高级会员
实际行动支持Laohong法律库.这是学生弄的,还行.将不定期上传.其他C友也可做TM深加工等.:D
 

附件

  • 中华人民共和国矿产资源法.doc
    157 KB · 浏览: 83
  • 中华人民共和国会计法.doc
    99 KB · 浏览: 34
  • 中华人民共和国药品管理法.doc
    490 KB · 浏览: 49
回复: 强化法制建设,对齐法律文本供分享

实际行动支持Laohong法律库.这是学生弄的,还行.将不定期上传.其他C友也可做TM深加工等.:D

谢谢!不过有几点说明需要贴在这里:

1、本没有打算做法律语料库,因为本人确实怕跟法律打交道,离法律最近的一次就是曾经有个睡在上铺的兄弟搞到了北大的法律博士学位。这次是因为看到大家对齐了语料,就想为何不搞个corpus4u网友们共建的语料库呢?没想到Oscar3当日就寄来了一百多篇个人收集的语料,xusun575的学生也出手不凡,搞得laohong就骑虎了(难不难下还不知道呢);

2、既然对齐了,咱就来搜。目前Oscar3已经发来了整理好的40篇对齐的语料,现在也已经可以在线检索了。希望有语料的朋友提供更多的素材。

3、携手共建,为避免重复劳动,建议大家再提供语料时注意以下几点:第一,注意查看一下是否是重复的语料(可在Manual用户手册里查到已经有的语料);第二,建议按照这里附件里的样式准备语料,打包压缩再上传或发邮件;第三,不能光为了建而建,考虑一下怎么用。

4、纯粹为玩票性质,大家自愿参加,鼓励显摆,不必抱怨……
 

附件

  • SampleData.xls
    175 KB · 浏览: 51
Last edited:
回复: 强化法制建设,对齐法律文本供分享

行动似闪电
效率盖叫天
好好好
 
回复: 强化法制建设,对齐法律文本供分享

来个大的:p
 

附件

  • 中华人民共和国刑法.doc
    1.5 MB · 浏览: 35
回复: 强化法制建设,对齐法律文本供分享

谢谢!不过有几点说明需要贴在这里:

1、本没有打算做法律语料库,因为本人确实怕跟法律打交道,离法律最近的一次就是曾经有个睡在上铺的兄弟搞到了北大的法律博士学位。这次是因为看到大家对齐了语料,就想为何不搞个corpus4u网友们共建的语料库呢?没想到Oscar3当日就寄来了一百多篇个人收集的语料,xusun575的学生也出手不凡,搞得laohong就骑虎了(难不难下还不知道呢);

2、既然对齐了,咱就来搜。目前Oscar3已经发来了整理好的40篇对齐的语料,现在也已经可以在线检索了。希望有语料的朋友提供更多的素材。

3、携手共建,为避免重复劳动,建议大家再提供语料时注意以下几点:第一,注意查看一下是否是重复的语料(可在Manual用户手册里查到已经有的语料);第二,建议按照这里附件里的样式准备语料,打包压缩再上传或发邮件;第三,不能光为了建而建,考虑一下怎么用。

4、纯粹为玩票性质,大家自愿参加,鼓励显摆,不必抱怨……



顶顶顶

great!!!
 
Last edited by a moderator:
回复: 强化法制建设,对齐法律文本供分享

现有110篇已经初步对应,其中47篇(共英文185,602词,汉语219,263字)已经可以检索,Oscar3正在整理其余的53篇(列表中统计数字为零的)。欢迎新语料。

语料列表和统计
在线检索测试版

Great! You've proved urself efficiently skilled not only at corpus processing but also at organizing a project.:D
 
Last edited by a moderator:
回复: 强化法制建设,对齐法律文本供分享

Wordaholic:p
 

附件

  • 中华人民共和国国徽法.doc
    94 KB · 浏览: 25
回复: 强化法制建设,对齐法律文本供分享

谢谢!中华人民共和国国徽法也已经更新到数据库。

现有111篇已经初步对应,其中48篇(共英文187,056词,汉语220,866字)已经可以检索,Oscar3正在整理其余的53篇(列表中统计数字为零的)。欢迎新语料。

语料列表和统计
在线检索测试版
 
Last edited:
回复: 强化法制建设,对齐法律文本供分享

"票据"在本法中一般译为"negotiable instrument". 能有其他选择吗?
 

附件

  • 中华人民共和国票据法.doc
    460.5 KB · 浏览: 18
回复: 强化法制建设,对齐法律文本供分享

现有113对汉英法律语篇已经初步对应,合计英文412,210词,汉语510,668字,已经全部可以平行检索。感谢Oscar3和Xusun575提供并整理语料。[/B]

语料列表和统计
在线检索测试版
 
Last edited:
回复: 强化法制建设,对齐法律文本供分享

现有113对汉英法律语篇已经初步对应,合计英文412,210词,汉语510,668字,已经全部可以平行检索。感谢Oscar3和Xusun575提供并整理语料。[/b]

语料列表和统计
在线检索测试版

感谢laohong, oscar3, xusun575... 付出的艰辛劳动,神速啊!:)
A Short User Manual”中说“比如,我们可以迅速提取出所有一翻多的句子......;同样,我们也可以迅速统计出多个句子被合并翻译成一个句子的情况等等。这一点,用户是无法从其它平行语料库中得到的。”
请问laohong,怎样才能迅速提取出所有一对多或多对一的句子呢?还有,能否把这个在线检索语料库的制作心得和技术要领和各位C友分享下么?你还是给我们开个讲座吧!先谢咯!
 
Last edited by a moderator:
Back
顶部