初级入门的问题, 让大家见笑了. 想用xaira索引LCMC, 但不知在设定中出了什么问题,总是没办法在xaira client中打开file. 我操作的情况如下, 麻烦各位专家帮忙看看问题出在哪里. 谢谢各位先了!
1. 打开xaira tools的file中的index wizard
2. 给LCMC命名为corpus
3. 确认默认的corpus root
4.选择LCMC的路径, LCMC自动复制到corpus
5.选择 corpus text format为XML
6.选择corpus file structure为默认的model 1
7.从file list中去掉manual之类的非文档主体部分, 最后只剩text\LCMC_...xml (A to R)
8. 操作界面显示, Indeltools is ready to parse your texts. Press Go to parse them. 然后选Go.
9. 整个过程完成后, 显示 All texts are well-formed. Press Next to start building the corpus header.
10. corpus language 设定为中文.
然后接下来的11到13项text labelling的设定是我不太确定的地方.
11. 需要specify the element and attribute used to identify a text. 左边一栏我选了P, 于是右边栏默认为autonumber.
12. 需要specify the element and attribute used to identify a unit. 左边一栏我选的s, 右边选的n.
13.需要specify the elements used to divide text into tokens. 我选的w.
14. keys默认为attribute POS
15.跳过Bibliography dialogue
至此, 所有的设定完成, 然后关掉xaira tools, 打开xaira client, 选择file下的open, 但无法打开corpus. 显示为Server cannot open corpus. Parser error in at 0,0: An exception occured! Type: RuntimeException, Message: warning:The primary document entity could not be opened.
烦请用过xaira的专家帮忙看看是什么问题, 非常非常谢谢大家了!
1. 打开xaira tools的file中的index wizard
2. 给LCMC命名为corpus
3. 确认默认的corpus root
4.选择LCMC的路径, LCMC自动复制到corpus
5.选择 corpus text format为XML
6.选择corpus file structure为默认的model 1
7.从file list中去掉manual之类的非文档主体部分, 最后只剩text\LCMC_...xml (A to R)
8. 操作界面显示, Indeltools is ready to parse your texts. Press Go to parse them. 然后选Go.
9. 整个过程完成后, 显示 All texts are well-formed. Press Next to start building the corpus header.
10. corpus language 设定为中文.
然后接下来的11到13项text labelling的设定是我不太确定的地方.
11. 需要specify the element and attribute used to identify a text. 左边一栏我选了P, 于是右边栏默认为autonumber.
12. 需要specify the element and attribute used to identify a unit. 左边一栏我选的s, 右边选的n.
13.需要specify the elements used to divide text into tokens. 我选的w.
14. keys默认为attribute POS
15.跳过Bibliography dialogue
至此, 所有的设定完成, 然后关掉xaira tools, 打开xaira client, 选择file下的open, 但无法打开corpus. 显示为Server cannot open corpus. Parser error in at 0,0: An exception occured! Type: RuntimeException, Message: warning:The primary document entity could not be opened.
烦请用过xaira的专家帮忙看看是什么问题, 非常非常谢谢大家了!