紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

#1
各位老师前辈好!
我刚学习自建双语平行语料库,是用SDL Winalign进行的句级对齐,看到有篇文章说之后可以使用Deja vu 对winalign对齐后的文本转换成EXCEL。我把它顺利地导入进去了,可就是不会如何导出成EXCEL. 好像要懂SQL语言。哪位老师指点一下,不胜感激!
 
Last edited:

oscar3

高级会员
#2
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

各位老师前辈好!
我刚学习自建双语平行语料库,是用SDL Winlign进行的句级对齐,看到有篇文章说之后可以使用Deja vu 对winlign对齐后的文本转换成EXCEL。我把它顺利地导入进去了,可就是不会如何导出成EXCEL. 好像要懂SQL语言。哪位老师指点一下,不胜感激!
没有用过DJV,但是,既然已经导入了,倒出来应该没有问题。不知道倒出的命令是不是紧挨着导入命令。钻研一下应该问题不大吧。
 
#3
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

可我总是导不出,哪位用过DJV的帮帮忙!或者说是我现在用Winalign 对齐后得到的txt文档有许多杂志,如何把它转成可用的纯excel ,以便做下一步标注和检索?
 

xusun575

高级会员
#4
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

可我总是导不出,哪位用过DJV的帮帮忙!或者说是我现在用Winalign 对齐后得到的txt文档有许多杂志,如何把它转成可用的纯excel ,以便做下一步标注和检索?
既然有了txt文本,导入excel就很方便了。你的问题可能的中英混排了。请教一下会用excel的人吧,或发一点上来让大家帮你解决一下。
 
#5
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

你说的对,就是中英混排,所以不会整。有没有方法能把他们分割开来?
 

xusun575

高级会员
#6
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

你说的对,就是中英混排,所以不会整。有没有方法能把他们分割开来?
分开中英没有问题.发一点上来诊断一下.
 

xusun575

高级会员
#9
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

好了.我们有专门的工具处理此类文本,可以是批量处理.现在用word 给你处理一下,
 

附件

xusun575

高级会员
#10
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

你说的对,就是中英混排,所以不会整。有没有方法能把他们分割开来?
其实你这个文本并没有混排,只要把其中段落标志和非语言符号去掉即可.
 
#11
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

真的很好啊!老师能教我如何做吗?
 

xusun575

高级会员
#12
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

真的很好啊!老师能教我如何做吗?

分析查看一下原文本的特点,确定操作思路. 本例还算有规律,使用word处理的做法是:
1.段落标志和非语言符号去掉.
2.找出其中的中英文混排的(同段落)句,并断开,
3再将文本转换成两列表格.结束.
量大或批量处理,可以先制作工具,一键操作,简单又方便.

最后强调一点: word 大家都非常熟悉,且功能强大,综合能力不输任何一款文本处理工具.建议好好挖掘一下.
 
#13
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

分析查看一下原文本的特点,确定操作思路. 本例还算有规律,使用word处理的做法是:
1.段落标志和非语言符号去掉.
2.找出其中的中英文混排的(同段落)句,并断开,
3再将文本转换成两列表格.结束.
量大或批量处理,可以先制作工具,一键操作,简单又方便.

最后强调一点: word 大家都非常熟悉,且功能强大,综合能力不输任何一款文本处理工具.建议好好挖掘一下.
谢谢您!我根据您的提示好好发掘了,终于找到一个办法,用excel的高级筛选功能轻松搞定了!最后还是再次感谢您的宝贵指点!
 

xusun575

高级会员
#14
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

谢谢您!我根据您的提示好好发掘了,终于找到一个办法,用excel的高级筛选功能轻松搞定了!最后还是再次感谢您的宝贵指点!
很有才啊!:D
请把你“轻松搞定”的方法在这里与C友们分享一下吧!
 
#15
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

很有才啊!:D
请把你“轻松搞定”的方法在这里与C友们分享一下吧!
非常乐意与大家分享!首先,根据您的建议,去掉txt文档中的非语言符号,就只剩下一句中文一句英文的纯文本了。之后将此纯文本复制到excel中工作簿,这样所有的英文句子都是偶数行,中文是奇数行,用高级筛选一下子便把中英文完全分割出来了。
 
#16
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

楼主能不能共享一下软件,我用着个对齐之后,它说因为是试用版,不能导出,不甚感激!!!841411793@qq.com
 
#17
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

不好意思,我也是试用版,不过好像在互联网上下载后会有一个30天的有效试用期,过了之后就不能用了。你再下个试试!
 
#18
回复: 紧急求助:如何利用翻译记忆系统自建双语平行语料库(以塔多思和Deja vu 为媒介)

谢了,不过试用版对于我要的功能限制了~
 
顶部