有自动markup文本的工具吗?

请教:在自己建立语料库时碰到一个难题,需要对文本的每个sentence进行markup,有自动markup的工具吗?

Many thanks!
 
回复: 有自动markup文本的工具吗?

我自己要建语料库,文本需要被markup成这样的:<s>once upon a time…</s>这样才能用Xaira分析出有效的数据。谢谢!
 
回复: 有自动markup文本的工具吗?

I think Multilingual Corpus Tools (MLCT) can add sentence markup to your text (Select Annotation - Show sentence number in the menu). You can actually also use the tool to split your text into paragraphs / sentences. POS tagging is also available in the tool.
 
回复: 有自动markup文本的工具吗?

不知Prof Xiao能否再上传一次MLCT呢?坛子里曼大和兰卡的链接似乎都无法再用了,毕竟已经过去4年多了
 
回复: 有自动markup文本的工具吗?

不知Prof Xiao能否再上传一次MLCT呢?坛子里曼大和兰卡的链接似乎都无法再用了,毕竟已经过去4年多了

I didn't find the function Xiaoz mentioned, but here attached is Scott Piao's original MLCT. Good luck!

You can also get a copy at Laohong's Corpus Stuff with corpus4u.
 

附件

  • Multi-Lingual Corpus Toolkit.zip
    386.9 KB · 浏览: 65
Back
顶部