WordSmith Splitter[FONT=宋体]的[/FONT]bug[FONT=宋体],[/FONT] [FONT=宋体]这里是解决办法:[/FONT]
1[FONT=宋体]、用[/FONT]EditPlus[FONT=宋体]打开[/FONT]ST3[FONT=宋体]文本,敲菜单中[/FONT]Search[FONT=宋体],[/FONT] Replace[FONT=宋体],[/FONT] [FONT=宋体]然后在[/FONT]Find What[FONT=宋体]里填入[/FONT]\n\n[FONT=宋体],在[/FONT]Replace With[FONT=宋体]里填入[/FONT]\n[FONT=宋体],勾选[/FONT]Regular Expression[FONT=宋体],敲[/FONT]Replace All[FONT=宋体]得到没有空行的新文件;[/FONT]
2[FONT=宋体]、然后敲菜单中[/FONT]Search[FONT=宋体],[/FONT] Replace[FONT=宋体],[/FONT] [FONT=宋体]然后在[/FONT]Find What[FONT=宋体]里填入[/FONT]<ST 3>[FONT=宋体],在[/FONT]Replace With[FONT=宋体]里填入[/FONT]</text>\n<ST 3>[FONT=宋体],勾选[/FONT]Regular Expression[FONT=宋体],敲[/FONT]Replace All[FONT=宋体]得到新文件;[/FONT]
3[FONT=宋体]、删掉新文件的第一行,存下;[/FONT]
4[FONT=宋体]、打开[/FONT]WordSmith Splitter[FONT=宋体],[/FONT] [FONT=宋体]在[/FONT]End of text separator[FONT=宋体]里删掉[/FONT]!#[FONT=宋体],填入[/FONT]</text>[FONT=宋体];并把[/FONT]Bracket first line[FONT=宋体]后的勾去掉,[/FONT]OK[FONT=宋体]即可进行分割。[/FONT]
1[FONT=宋体]、用[/FONT]EditPlus[FONT=宋体]打开[/FONT]ST3[FONT=宋体]文本,敲菜单中[/FONT]Search[FONT=宋体],[/FONT] Replace[FONT=宋体],[/FONT] [FONT=宋体]然后在[/FONT]Find What[FONT=宋体]里填入[/FONT]\n\n[FONT=宋体],在[/FONT]Replace With[FONT=宋体]里填入[/FONT]\n[FONT=宋体],勾选[/FONT]Regular Expression[FONT=宋体],敲[/FONT]Replace All[FONT=宋体]得到没有空行的新文件;[/FONT]
2[FONT=宋体]、然后敲菜单中[/FONT]Search[FONT=宋体],[/FONT] Replace[FONT=宋体],[/FONT] [FONT=宋体]然后在[/FONT]Find What[FONT=宋体]里填入[/FONT]<ST 3>[FONT=宋体],在[/FONT]Replace With[FONT=宋体]里填入[/FONT]</text>\n<ST 3>[FONT=宋体],勾选[/FONT]Regular Expression[FONT=宋体],敲[/FONT]Replace All[FONT=宋体]得到新文件;[/FONT]
3[FONT=宋体]、删掉新文件的第一行,存下;[/FONT]
4[FONT=宋体]、打开[/FONT]WordSmith Splitter[FONT=宋体],[/FONT] [FONT=宋体]在[/FONT]End of text separator[FONT=宋体]里删掉[/FONT]!#[FONT=宋体],填入[/FONT]</text>[FONT=宋体];并把[/FONT]Bracket first line[FONT=宋体]后的勾去掉,[/FONT]OK[FONT=宋体]即可进行分割。[/FONT]
[FONT=宋体]——————————————————————————————————————[/FONT]
[FONT=宋体]这是你在另一个帖子里对大文本进行分割提出来的解决方法。这个方法我试过了,可换了个子语料库就不出问题了。我用的是ST5,分割出来显示内容不全,而且我觉得问题也很大。我想知道是什么原因,希望您能不吝赐教![/FONT]