在对语料进行处理时,我把语料的标题、段落和句子都进行了赋码,见附件2.法规名称:贪污治罪条例和2.Anti-Corruption Statute.
我把赋码的语料加载在paraconc后再进行检索,得出的结果有些却没有对齐,见附件parallel concordance-shall,检索出来的有一句英文对应的却</p004><p005>。
不知道问题出在哪,想有可能是在软件的设置上出了问题,软件的基础设置见附件load corpusfiles和text format,Align format我选的是start/stop tags, 右边的options见附件Settings,这里面该怎么设置我不是太懂,只在start tag上填了s,而stop tag上填了/s,这个attribute我不知道是什么个意思,我想这个设置应该是出问题了,望高手指点一下,这个部分到底应该怎么设置。
检索的阶段我是用advanced search进行检索的,里面的设置见附件advanced search和search options,哪里的设置出问题了导致最后的检索不对齐,忘高手指点一下,不甚感激。
还有一个问题,检索出来的结果见附件parallel concordance-shall, 这里面的中文的赋码都隐藏了,就那个错误的不对应的</p004><p005>在里面,而英文中的所有标题、段落、句子的赋码都显现出来了,是不是有什么设置可以把这些赋码都隐藏的?谢谢了哦!
我把赋码的语料加载在paraconc后再进行检索,得出的结果有些却没有对齐,见附件parallel concordance-shall,检索出来的有一句英文对应的却</p004><p005>。
不知道问题出在哪,想有可能是在软件的设置上出了问题,软件的基础设置见附件load corpusfiles和text format,Align format我选的是start/stop tags, 右边的options见附件Settings,这里面该怎么设置我不是太懂,只在start tag上填了s,而stop tag上填了/s,这个attribute我不知道是什么个意思,我想这个设置应该是出问题了,望高手指点一下,这个部分到底应该怎么设置。
检索的阶段我是用advanced search进行检索的,里面的设置见附件advanced search和search options,哪里的设置出问题了导致最后的检索不对齐,忘高手指点一下,不甚感激。
还有一个问题,检索出来的结果见附件parallel concordance-shall, 这里面的中文的赋码都隐藏了,就那个错误的不对应的</p004><p005>在里面,而英文中的所有标题、段落、句子的赋码都显现出来了,是不是有什么设置可以把这些赋码都隐藏的?谢谢了哦!
附件
-
2.贪污治罪条例 (民国 98 年 04 月 22 日修正).txt6.5 KB · 浏览: 9
-
2.Anti-Corruption Statute ( 2003.02.06 Amended ).txt13.1 KB · 浏览: 25
-
parallel concordance-shall.jpg74.9 KB · 浏览: 4
-
load corpus files.png6.7 KB · 浏览: 52
-
text format.png5 KB · 浏览: 52
-
settings.png2.1 KB · 浏览: 53
-
advanced search.png6.8 KB · 浏览: 51
-
search options.png8 KB · 浏览: 1