语料库赋码中的破折号

我用CLAW对一段英文进行标注,原文中有破折号,我发现赋码后破折号被自动的忽略了。
they'd like to see Michelle bring to the White House——mainly showing the world that a black woman can support her man and raise a strong black family.
they_PPHS2 'd_VM like_VVI to_TO see_VVI Michelle_NP1 bring_VVI to_II the_AT White_NP1 Housemainly_NP1 showing_VVG the_AT world_NN1 that_CST a_AT1 black_JJ woman_NN1 can_VM support_VVI her_APPGE man_NN1 and_CC raise_VVI a_AT1 strong_JJ black_JJ family_NN1 ._. 不知道是不是我的破折号输入有问题可能是读到的资料和书还是有限,我不太明白标点符号在语料库中的作用。希望能够得到指点,谢谢。
 
回复: 语料库赋码中的破折号

我试了一下在线Demo版的Claws,破折号的确被忽略了。
可以使用“ - ”替换文本中破折号(注意-的前后都要留空格,不然就成了连字符),这样标注出来的的结果是“-_-”。最后再把“-_-”替换成“——_——”。
 
Back
顶部