请教用ParaConc检索日语出现乱码的问题。

最近在学习建中日双语平行语料库。听说ParaConc可以检索多语种,功能也非常强大。就尝试先用Demo版,等熟悉之后,再购买正式版。但发现一个很严重的问题,在我的机器上ParaConc无法检索日语,一输入日语马上就变成乱码。用中文检索倒是非常正常。另外查看日文原文时,也是满篇的乱码。日文的文本编码无论是(Shift_JIS)还是(UTF-8),都无法正常显示。在我的机器上有许多日文软件,都能正常显示使用。我不知问题出在哪里,还望各位熟悉ParaConc的朋友帮忙解答。谢谢了!

附件一:检索(中文检索)的界面,中文和日文都能正常显示。
附件二:点击查看日文原文时,显示不正常,是满篇的乱码。
附件三:无法用日文检索,输入日文后,马上就变成乱码了。图三,我输入的是“はな”这两个假名,结果就变成图上那样的乱码了。

big
 

附件

  • 截图00.jpg
    截图00.jpg
    88.4 KB · 浏览: 7
  • 截图01.jpg
    截图01.jpg
    129.7 KB · 浏览: 7
  • 截图03.jpg
    截图03.jpg
    17.8 KB · 浏览: 77
Last edited:
回复: 请教用ParaConc检索日语出现乱码的问题。

今天我又在另外几台电脑上尝试一下,还是不行,输入日文检索词就变成乱码,查看日文原文还是满篇的乱码。
我所尝试的电脑都是中文的XP系统,其他语种的系统没有尝试过,也许英文或日文的XP系统能正常检索。但不可能为了使用这个软件而换成别的语种的系统。
另外,不知购买了ParaConc正式版是不是就能正常显示了。不过问题似乎不是出在这里,还是对ParaConc的设置出了问题,如果不能解决,可能买了正式版也无法检索。
提供两小段语料,希望对ParaConc熟悉的朋友或感兴趣的朋友帮忙实验一下,在下万分感激,在这里先行谢过!

1.txt文件是几句中文的句子。2.txt是对应的日语的句子,文本编码是Shift_JIS。3.txt和2.txt一样,只是编码改成了UTF-8。
实在不知道该如何用ParaConc检索日语。
 

附件

  • 1.txt
    409 bytes · 浏览: 8
  • 2.txt
    567 bytes · 浏览: 4
  • 3.txt
    773 bytes · 浏览: 6
Last edited:
回复: 请教用ParaConc检索日语出现乱码的问题。

终于找到用ParaConc检索日语的方法了。
控制面板——区域和语言选项——高级——日语。
就是把xp系统的语言变成日语。这样输入日语就不会变成乱码了。但同时也带来了新的问题,无法检索中文了。一输入中文就变成乱码了。看来ParaConc确实不是很支持东方语言。东方语言之间的对译检索总会出现内码冲突。
我使用的是Demo版,不知正式的版本是否也存在这样的问题。Demo版是04年的版本,一直没有更新。正式的版本应该更新了许多次,这个问题不知是否已经修正。
非常希望有ParaConc正式版本的朋友能帮我实验一下。我现在非常需要这个软件,它的高级检索和统计功能确实非常强大,但是很担心买了正式版之后还是出现乱码,无法使用。
 
回复: 请教用ParaConc检索日语出现乱码的问题。

用你提供的附件1和转换成ANSI格式的附件3在ParaConc中进行检索,一切显示正常。
我的电脑是win7 中文旗舰版。附件01是以“人”为检索词的检索结果,02是日语“に”的检索结果,03是paraConc的设置情况。实验证明,正版的ParaConc和演示版的都可以检索中文和日语,并且无乱码。
 

附件

  • 01 人.jpg
    01 人.jpg
    33 KB · 浏览: 5
  • 02 に.jpg
    02 に.jpg
    21.9 KB · 浏览: 6
  • 03 设置.jpg
    03 设置.jpg
    28.3 KB · 浏览: 4
非常非常感谢4楼的朋友帮忙测试。经本人验证,4楼的朋友提供的方法可行。主要步骤是把日文的文本编码Shift_JIS或UTF-8转换成中文系统默认的ANSI编码,设置字体时也设置成中文的字体。这样检索时就不会出现两种语言的编码冲突。:)
 
回复: 请教用ParaConc检索日语出现乱码的问题。

这种方法还是有问题,用ParaConc检索日文文本,如果文本的量比较大,还是会出现少量乱码,这也会影响检索结果。这个软件本身应该是支持UTF-8编码的,但UTF-8编码的日文文本却无法检索,真是个怪现象。
 
Back
顶部