关于Xaira使用中遇到的问题~~~~~~

本人用Xaira检索做好索引的Lancaster Corpus of Mandarin Chinese语料库,发现有以下问题:
1.软件运行不稳定(我用的是1.19),有时能用有时又报错。KWIC检索时汉字都是一个一个的方框,不过可以复制到记事本上,但操作麻烦了很多。是与Win7兼容性不好,还是需要运行配套的Xaira版本?还是其它什么原因?
2.换用Wordsmith检索,按以下步骤操作:Concord——customize——languages——Chinese(simplified),(Text Format)选"SGML or XML",并且在Tags中设置为去掉“<>”中的内容。结果是:可以进行中文检索,但“<>”中的标注并未去掉,cotext内容太少(span设为默认值200),且source text全为乱码。
本人做硕士论文,这些技术性问题虽不大却很费时间,诚心向各位老师同学请教。感激不尽!!
 
回复: 关于Xaira使用中遇到的问题~~~~~~

本人用Xaira检索做好索引的Lancaster Corpus of Mandarin Chinese语料库,发现有以下问题:
1.软件运行不稳定(我用的是1.19),有时能用有时又报错。KWIC检索时汉字都是一个一个的方框,不过可以复制到记事本上,但操作麻烦了很多。是与Win7兼容性不好,还是需要运行配套的Xaira版本?还是其它什么原因?.....

LCMC是用Xaira1.23索引的,最好用同样版本检索;
汉字是方框,是因为你没有在Xaira里设置好字体,自己研究一下。我这里告诉你了,没有自己找到解决办法记忆深刻;如果还是不行,就再本坛搜一下,我以前讲过;
Xaira和WIN7兼容没有任何问题。
 
回复: 关于Xaira使用中遇到的问题~~~~~~

....换用Wordsmith检索,按以下步骤操作:Concord——customize——languages——Chinese(simplified),(Text Format)选"SGML or XML",并且在Tags中设置为去掉“<>”中的内容。结果是:可以进行中文检索,但“<>”中的标注并未去掉,cotext内容太少(span设为默认值200),且source text全为乱码。

LCMC是UTF-8编码,WordSmith要的是Unicode编码,你得转换后才能避免乱码;
Tag中默认是“Ignore < * >”, 你去掉它,那当然检索结果中的< >部分还会在,因为去掉了就“”Ignore了。
 
回复: 关于Xaira使用中遇到的问题~~~~~~

LCMC是UTF-8编码,WordSmith要的是Unicode编码,你得转换后才能避免乱码;
Tag中默认是“Ignore < * >”, 你去掉它,那当然检索结果中的< >部分还会在,因为去掉了就“”Ignore了。

感谢laohong及时指点!还希望今后继续请教老师!感谢!
 
Back
顶部