关于CUC_Paraconc

#1
请问许博士,CUC_Paracon与Paraconc的功能大体相仿吗?是否可以基本替代Paraconc的功能和操作?还是说只能替代其中的一部分功能与操作?谢谢啦!
 
#4
回复: 关于CUC_Paraconc

CUC_Paraconc 不用对汉语进行分词处理就能进行检索,而且支持多种对齐方式,确实很方便。
 
#5
回复: 关于CUC_Paraconc

我是语料库刚刚入门的新手。感觉Paraconc功能非常强大,而CUC_Paraconc现在只具备检索功能。但Paraconc不太支持东方语言,东方语言之间的检索会出现内码冲突,而CUC_Paraconc则支持各种语言之间的检索,不出现乱码,不用分词就能检索日语和汉语。感谢程博士的辛勤劳动,也非常期待程博士能更新CUC_Paraconc。
 
#6
回复: 关于CUC_Paraconc

我是语料库刚刚入门的新手。感觉Paraconc功能非常强大,而CUC_Paraconc现在只具备检索功能。但Paraconc不太支持东方语言,东方语言之间的检索会出现内码冲突,而CUC_Paraconc则支持各种语言之间的检索,不出现乱码,不用分词就能检索日语和汉语。感谢程博士的辛勤劳动,也非常期待程博士能更新CUC_Paraconc。
谢谢大家的支持,好久没上论坛了,这段时间忙得不得了。其实我已经更新了一部分,软件原来只能在检索的同时排除一个词,新修改的版本可以排除一组词。之所以没有发布出去,是因为之前有个朋友说,目前有一些研究者的对齐语料喜欢放在EXCEL里面。我想把检索EXCEL、ACCESS、与Sql数据库的功能挂接进去,但是我又不知道这些语料的形式,且因为事情较多,所以就耽搁下来了。最近我相对没有那么忙了,如果大家需要什么功能,可以直接和我联系,或者在论坛中提出。我希望一步步来,把大家要的功能都补充进去。另外如果有用excel做对齐的网友,希望能发一点语料给我作测试用。
 
#7
回复: 关于CUC_Paraconc

谢谢大家的支持,好久没上论坛了,这段时间忙得不得了。其实我已经更新了一部分,软件原来只能在检索的同时排除一个词,新修改的版本可以排除一组词。之所以没有发布出去,是因为之前有个朋友说,目前有一些研究者的对齐语料喜欢放在EXCEL里面。我想把检索EXCEL、ACCESS、与Sql数据库的功能挂接进去,但是我又不知道这些语料的形式,且因为事情较多,所以就耽搁下来了。最近我相对没有那么忙了,如果大家需要什么功能,可以直接和我联系,或者在论坛中提出。我希望一步步来,把大家要的功能都补充进去。另外如果有用excel做对齐的网友,希望能发一点语料给我作测试用。
呵呵,强!期待……
 
#8
回复: 关于CUC_Paraconc

谢谢大家的支持,好久没上论坛了,这段时间忙得不得了。其实我已经更新了一部分,软件原来只能在检索的同时排除一个词,新修改的版本可以排除一组词。之所以没有发布出去,是因为之前有个朋友说,目前有一些研究者的对齐语料喜欢放在EXCEL里面。我想把检索EXCEL、ACCESS、与Sql数据库的功能挂接进去,但是我又不知道这些语料的形式,且因为事情较多,所以就耽搁下来了。最近我相对没有那么忙了,如果大家需要什么功能,可以直接和我联系,或者在论坛中提出。我希望一步步来,把大家要的功能都补充进去。另外如果有用excel做对齐的网友,希望能发一点语料给我作测试用。
发现,一对多语料检索,貌似只能用正则表达式,而不支持关键词检索。还是我自己的语料问题?
 
#9
回复: 关于CUC_Paraconc

谢谢大家的支持,好久没上论坛了,这段时间忙得不得了。其实我已经更新了一部分,软件原来只能在检索的同时排除一个词,新修改的版本可以排除一组词。之所以没有发布出去,是因为之前有个朋友说,目前有一些研究者的对齐语料喜欢放在EXCEL里面。我想把检索EXCEL、ACCESS、与Sql数据库的功能挂接进去,但是我又不知道这些语料的形式,且因为事情较多,所以就耽搁下来了。最近我相对没有那么忙了,如果大家需要什么功能,可以直接和我联系,或者在论坛中提出。我希望一步步来,把大家要的功能都补充进去。另外如果有用excel做对齐的网友,希望能发一点语料给我作测试用。
[FONT=宋体]程博士您好!感谢您的回复,也感谢您为许许多多语料库研究者和爱好者付出的辛勤劳动。我对语料库的了解还处于入门阶段。所以仅从显示方面提几点建议。[/FONT]​
[FONT=宋体]一、点击检索结果查看原文。[/FONT]​
[FONT=宋体]这里的原文是指原始文档的内容。有的对译语料切得非常细,是一句一句对齐的,这就需要结合上下文的语境来判断翻译的情况。如果点击一下检索结果就能链接到原始文档相应的位置,这对判断翻译的结果意义重大。[/FONT]​
[FONT=宋体]二、检索出的关键词变为红色或蓝色[/FONT]​
[FONT=宋体]在CUC_Paraconc的检索结果中,关键[/FONT][FONT=宋体]词是用[/FONT][FONT=宋体]【】来表示的,有的时候检索结果太多了,感觉不是很明显,不知是否能够通过变色的方式来显示。红色或蓝色的关键词一目了然。[/FONT]​
[FONT=宋体]三、检索结果在表格中显示[/FONT]
[FONT=宋体]有的时候检索结果几百上千条,而且分属于不同的作品,看着有些晕。如果能显示在表格中,查看起来会非常清晰。比如说类似于图1、2这种。图1、2是横向表格显示一部作品的原文对应多个译文,也可以纵向显示一个原文对应多个译文。另外,每部作品之间最好能空开,[/FONT][FONT=宋体]序号(No)单独计算[/FONT][FONT=宋体](类似于图1、2),[/FONT]检索结果显示在表格中可以参考论坛里贾老师开发的BFSU SentCounter(图3、4)[FONT=宋体]。[/FONT]
 

附件

Last edited:
#10
回复: 关于CUC_Paraconc

如果可以的话,还希望能够加入类似HyConc检索标注的搭配这种功能。一直在学习使用您的语料库检索工具,上面提出的几条想法,在程序上实现起来可能会非常困难,冒昧之处还请原谅。再次感谢您为众多语料库研究者付出的辛勤劳动。
 
Last edited:
#11
回复: 关于CUC_Paraconc

http://ishare.iask.sina.com.cn/f/25022383.html
已经对平行语料检索软件进行了部分修改,请许家金老师,或者其他老师下载后,传到自己的共享文件中让大家下载,如果在使用中发现问题,请大家及时反馈。
主要增加了如下功能:
1允许双击输入停用词的文本框,调入停用词表,原来在检索时只能排除一个词,修改后,可以排除一组词。(停用词以回车换行为标记)
2新增加了一个关键词着色窗口,供大家选择,检索后,关键词用红色显示。
3一对多检索,增加了一个小功能,可以双击原著文本框调入文本的前缀。
如果有一对多,多个文本,每次检索的时候,都要把前缀复制到软件中,比较麻烦,可以把前缀保存到一个文本中,首行为原著前缀,其它行为译著前缀,软件可以自动调入前缀。(前缀以回车换行为标记)
另外回答一下siqing3868的问题,一对多可以检索关键词,也可以输入正则式进行检索,如果大家觉得不方便,以后可以另外再增加单独针对关键词的一对多检索。如果检索不出,注意:是否选择对齐的译本数;是否正确选择文本的编码方式;是否输入一对多原著与译著的前缀;文本命名是否正确。
其它功能暂时没有增加进去的,我会抽出时间不断修改的,一步步加进去。
感谢xvlei1126的宝贵意见,感谢大家的支持!!!
 
Last edited:
#12
回复: 关于CUC_Paraconc

感谢程博士更新了CUC_Paraconc,试用了一下。感觉非常棒!冒昧地提一个小的建议。[FONT=宋体]表格的序号(No),是否能够使一条原文和它对应译文显示同一序号。图1能否变成图2的形式。这样看起来更加明确。虽然也有“检索结果增加序号”这一选项,但还是前面表格的序号更加清晰。[/FONT]
 

附件

#14
回复: 关于CUC_Paraconc

软件已经修改,并且关键词着色窗口的一对一检索处增加了根据行号查看原文的功能。如果在使用中发现问题,请大家及时反馈。下载地址:华军网:
http://www.onlinedown.net/soft/118387.htm

程老师,修改后的软件更加好用了,能不能将一对多的显示也修改一下。

另:附件是EXCEL文件的格式的样本,能不能在您方便时加上对.xls格式的平行语料的读取。

谢谢!
 

附件

#15
回复: 关于CUC_Paraconc

[FONT=宋体]非常感谢程博士更新软件。用了一段时间,感觉非常简洁明了,而且速度很快。只是能否像楼上的朋友提到的,在一对多的检索中,使一条原文和它对应的多条译文显示同一序号,就像一对一的那种形式。[/FONT]
[FONT=宋体]另外,新增加的根据行号查看源文档的功能,在我的机器上只能打开源文档,还无法跳到(链接到)源文档相应的位置(检索关键词的位置)。如果源文档单个语料篇幅非常大,仅打开文档,还是起不到作用。可能要实现这种转跳或链接功能,在程序上非常复杂困难,希望在您有时间的情况下,以后慢慢添加。再次感谢您的辛勤劳动![/FONT]
 
#20
回复: 关于CUC_Paraconc

问题找到了,是语料没有对齐。一对一有初步的自动判断语料是否对齐的功能,一对多却没有把这个功能做进去,以后会考虑把这个小功能加进去。
 
顶部