各位老师前辈好!
我刚学习自建双语平行语料库,是用SDL Winlign进行的句级对齐,看到有篇文章说之后可以使用Deja vu 对winlign对齐后的文本转换成EXCEL。我把它顺利地导入进去了,可就是不会如何导出成EXCEL. 好像要懂SQL语言。哪位老师指点一下,不胜感激!
既然有了txt文本,导入excel就很方便了。你的问题可能的中英混排了。请教一下会用excel的人吧,或发一点上来让大家帮你解决一下。可我总是导不出,哪位用过DJV的帮帮忙!或者说是我现在用Winalign 对齐后得到的txt文档有许多杂志,如何把它转成可用的纯excel ,以便做下一步标注和检索?
你说的对,就是中英混排,所以不会整。有没有方法能把他们分割开来?
好的,先谢谢您了。分开中英没有问题.发一点上来诊断一下.
好的,先谢谢您了。
你说的对,就是中英混排,所以不会整。有没有方法能把他们分割开来?
真的很好啊!老师能教我如何做吗?
谢谢您!我根据您的提示好好发掘了,终于找到一个办法,用excel的高级筛选功能轻松搞定了!最后还是再次感谢您的宝贵指点!分析查看一下原文本的特点,确定操作思路. 本例还算有规律,使用word处理的做法是:
1.段落标志和非语言符号去掉.
2.找出其中的中英文混排的(同段落)句,并断开,
3再将文本转换成两列表格.结束.
量大或批量处理,可以先制作工具,一键操作,简单又方便.
最后强调一点: word 大家都非常熟悉,且功能强大,综合能力不输任何一款文本处理工具.建议好好挖掘一下.
谢谢您!我根据您的提示好好发掘了,终于找到一个办法,用excel的高级筛选功能轻松搞定了!最后还是再次感谢您的宝贵指点!
非常乐意与大家分享!首先,根据您的建议,去掉txt文档中的非语言符号,就只剩下一句中文一句英文的纯文本了。之后将此纯文本复制到excel中工作簿,这样所有的英文句子都是偶数行,中文是奇数行,用高级筛选一下子便把中英文完全分割出来了。很有才啊!
请把你“轻松搞定”的方法在这里与C友们分享一下吧!