如何将词性赋码后的文本中的单词去掉只保留赋码?

armstrong

高级会员
请如何将文本1转化成文本2和文本3?谢谢!
文本1:
Learning_VVG a_AT1 foreign_JJ is_VBZ one_MC1 of_IO the_AT most_RGT difficult_JJ yet_RR rewarding_JJ experiences_NN2 of_IO my_APPGE life_NN1 ._.

文本2:
VVG AT1 JJ VBZ MC1 IO AT RGT JJ RR JJ RR JJ NN2 IO APPGE NN1.

文本3:
VVG AT1 JJ VBZ MC1 of AT RGT JJ RR JJ NN2 of APPGE NN1.
 
请如何将文本1转化成文本2和文本3?谢谢!
文本1:
Learning_VVG a_AT1 foreign_JJ is_VBZ one_MC1 of_IO the_AT most_RGT difficult_JJ yet_RR rewarding_JJ experiences_NN2 of_IO my_APPGE life_NN1 ._.

文本2:
VVG AT1 JJ VBZ MC1 IO AT RGT JJ RR JJ RR JJ NN2 IO APPGE NN1.

文本3:
VVG AT1 JJ VBZ MC1 of AT RGT JJ RR JJ NN2 of APPGE NN1.
不知道你要用来做什么用。另外,文本2和文本3有何区别?
 
回复: 如何将词性赋码后的文本中的单词去掉只保留赋码?

只要是有特点的东西,就有办法提取。比如每个码后都有个_ ,注意到了这个,提取和删除东西就不难。
 
Re: 回复: 如何将词性赋码后的文本中的单词去掉只保留赋码?

只要是有特点的东西,就有办法提取。比如每个码后都有个_ ,注意到了这个,提取和删除东西就不难。

谢谢,我可以办到了.
 
回复: 如何将词性赋码后的文本中的单词去掉只保留赋码?

为何不考虑用正则表达式,查找替换呢?
 
Back
顶部