【求助】treetagger词性赋码后得出的文件的问题

请问一下各位大神,为什么我用treetagger软件进行词性赋码后得出的.pos文件是0字节啊??在线求助急等!!谢谢!!! 是不是WIN7的问题??
 

李亮1975重庆

语料库快乐军政委
可能是文字编码,也可能是操作系统

是不是win7上运行而导致的问题,(1)可以找个朋友的电脑是winXP的,运行测试下;(2)如果没有这样的朋友,可以找街头上网吧的电脑来测试,现在的网吧都是用第二代身份证来上网登记,进门之后去柜台,刷第二代身份证,同时缴纳10元钱,一般每小时3元,到离开的时候就退还给你剩余的钱;(3)如果找不到或不方便去网吧就找自己Q友,看谁是WinXP,让TA帮你测试,TA不懂操作或无法根据你的操作方法而操作就用“QQ远程协助”方式而让你操作TA的电脑;(4)如果你是身处校园的师生,可以去图书馆的公用电脑,图书馆一般有“电子阅览室”,是免费上网的电脑房,往往也可以自带优盘而使用;(5)如果你是教师的话,可以去教师集体办公备课的房间,往往是多台电脑,虽然不是专用电脑;(6)校园周边的打印店,往往也是WinXP的,跟老板稍加商量下,甚至假装打印一份文件而顺便运行一下,或者假装是要把treetagger的结果进行打印,这样就名正言顺了!

如果不是来自操作系统的故障原因,那就很可能是你要处理的txt文件的文字编码的问题了。你可以用“记事本”打开你要处理的TXT文件之后,另存为,另存为的时候在“另存为的对话框”上选择“(文字)编码”为“ANSI”或“UTF-8”或"Unicode"这3者之一,如果其中一种编码依然有故障就改为另一个编码,直到3种编码都测试过为止。

第三种可能性就是你操作方式或操作环节或操作步骤不对或参数设置有误,所以你可以通过新建一个TXT文件,随便输入几个短句子来测试,你是否能轻松处理这个测试文件。

Treetagger也有在线版,地址是(每次处理的文本不能超过2MB,也就是2 megabytes,2兆
http://web4u.setsunan.ac.jp/Website/TreeOnline.htm
如果要处理的TXT文件大于2兆,就手工切分成多份进行在线标注再手工合并


 
回复: 可能是文字编码,也可能是操作系统

是不是win7上运行而导致的问题,(1)可以找个朋友的电脑是winXP的,运行测试下;(2)如果没有这样的朋友,可以找街头上网吧的电脑来测试,现在的网吧都是用第二代身份证来上网登记,进门之后去柜台,刷第二代身份证,同时缴纳10元钱,一般每小时3元,到离开的时候就退还给你剩余的钱;(3)如果找不到或不方便去网吧就找自己Q友,看谁是WinXP,让TA帮你测试,TA不懂操作或无法根据你的操作方法而操作就用“QQ远程协助”方式而让你操作TA的电脑;(4)如果你是身处校园的师生,可以去图书馆的公用电脑,图书馆一般有“电子阅览室”,是免费上网的电脑房,往往也可以自带优盘而使用;(5)如果你是教师的话,可以去教师集体办公备课的房间,往往是多台电脑,虽然不是专用电脑;(6)校园周边的打印店,往往也是WinXP的,跟老板稍加商量下,甚至假装打印一份文件而顺便运行一下,或者假装是要把treetagger的结果进行打印,这样就名正言顺了!

如果不是来自操作系统的故障原因,那就很可能是你要处理的txt文件的文字编码的问题了。你可以用“记事本”打开你要处理的TXT文件之后,另存为,另存为的时候在“另存为的对话框”上选择“(文字)编码”为“ANSI”或“UTF-8”或"Unicode"这3者之一,如果其中一种编码依然有故障就改为另一个编码,直到3种编码都测试过为止。

第三种可能性就是你操作方式或操作环节或操作步骤不对或参数设置有误,所以你可以通过新建一个TXT文件,随便输入几个短句子来测试,你是否能轻松处理这个测试文件。

Treetagger也有在线版,地址是(每次处理的文本不能超过2MB,也就是2 megabytes,2兆
http://web4u.setsunan.ac.jp/Website/TreeOnline.htm
如果要处理的TXT文件大于2兆,就手工切分成多份进行在线标注再手工合并


我试了一下,应该是WIN7的系统问题。非常感谢您的帮助与建议!!!!!
 
顶部