求:英汉双语平行文本自动对齐系统

stream

普通会员
请问许老师,您在”双语语料库建设中元信息的添加和段落与句子的两级对齐“一文中的”英汉双语平行文本自动对齐系统“,在哪里能下载到?谢谢!
 
回复: 求:英汉双语平行文本自动对齐系统

许老师,同求!购买也行啊!看了您的文章,觉得好用啊!:)
 
ABBYY Aligner有破解版的,雪人翻译软件也可以用来做平行语料库,因为ChatGPT的出现,雪人翻译软件可以免费使用所有功能了,用户申请就可以。
 
好的,谢谢老师!最近也尝试用一些大模型来做,不过做的效果不理想。我学习学习!
许的那种方式有时候大语言模型会出一些问题,输出结果不一定达到预期目标。如果使用大语言模型,还不如让它直接给你输出英汉对照的句子。你只要要出一个数目来,它就可以给你写出那么多句子,你还可以对它规定句子长度或者句子难度标准,输出的句子比你自己搜集的英汉句子合格多了。大语言模型本身就是超级大的语料库,所以让它直接给你按照你的要求写句子非常靠谱。它比你从出版的那些词典里用正则表达式提取里面的句子靠谱,词典里的那些例句普遍句子长度比较短。你让大语言模型给你写英汉对照的句子你还可以给它规定是什么专业的句子,反正你可以给它提出很多条件要求。
 
许的那种方式有时候大语言模型会出一些问题,输出结果不一定达到预期目标。如果使用大语言模型,还不如让它直接给你输出英汉对照的句子。你只要要出一个数目来,它就可以给你写出那么多句子,你还可以对它规定句子长度或者句子难度标准,输出的句子比你自己搜集的英汉句子合格多了。大语言模型本身就是超级大的语料库,所以让它直接给你按照你的要求写句子非常靠谱。它比你从出版的那些词典里用正则表达式提取里面的句子靠谱,词典里的那些例句普遍句子长度比较短。你让大语言模型给你写英汉对照的句子你还可以给它规定是什么专业的句子,反正你可以给它提出很多条件要求。
原来还可以有这种思路,我尝试一下,感谢分享!
 
原来还可以有这种思路,我尝试一下,感谢分享!
不用翻墙可以用的一些大语言模型,通义https://tongyi.aliyun.com/ 在生成英文方面个人感觉与国外的明显能看出不少差异 豆包https://www.doubao.com/ 感觉比通义好像出入不大,比通义强一点点而已,kimi https://kimi.moonshot.cn/ 清华ChatGlam感觉生成的英文难度偏大,比ChatGPT国外等大语言模型生成的较难 。边界AICHAT 这家汇集了很多家的大语言模型 https://www.yyai8.com/ 有点类似国外的Poe.com的。国外最强的好像还是ChatGPT, Gemini 次之。不过如果还想在制作平行语料库的时候提升英语,可以使用豆包,豆包的手机版有朗读功能
 
原来还可以有这种思路,我尝试一下,感谢分享!
大语言模型并非语料库,大语言模型生成的产品和人类语言存在差异,如果用于一般的学习问题不大,但是,用于研究至少存在一个非自然语言的问题,还有一点,研究无法说清楚语料来源,语料的产出者诸多社会属性。
 
Last edited:
大语言模型并非语料库,大语言模型生成的产品和人类语言存在差异,如果用于一般的学习问题不大,但是,用于研究至少存在一个非自然语言的问题,还有一点,研究无法说清楚语料来源,语料的产出者诸多社会属性。
对,这是关键
 
Back
顶部