全功能版英文文本批量形态还原工具

Corpus4u.org的网友们好,近日易尔译科技http://www.12fanyi.cn/为方便大家针对多文本进行英文文档的批量形态还原,特花了点小时间写了个全功能版英文文本批量形态还原工具,供喜欢搞语料库的同仁们免费使用.没有什么功能限制,欢迎下载或收藏以备不时之需。

程序说明:
本小程序用以对指定目录下的英文文本文档执行批量还原处理,能够识别单词与单词之间的标点或连字符等,保持原文格式。
程序使用.net编写,需要安装.net 2.0框架后才能使用。
易尔译科技 http://www.12fanyi.cn 出品,欢迎访问。

您的回复,是我们继续贡献的动力。。。。

应楼下人要求,新增加了保留原词,用()标注还原后的词,同时兼容多编码格式文本。
附件中新加了个EnStemmer.rar,解压覆盖批量还原即可。。。。
 

附件

  • 批量还原.rar
    117.8 KB · 浏览: 187
  • EnStemmer.rar
    6.5 KB · 浏览: 119
Last edited:
回复: 全功能版英文文本批量形态还原工具

已收下,非常感谢!
能麻烦再写个文本比较的小工具吗?小工具的功能:
1.删除同一个文本中的所有重复行/单词(可为连续行或不连续行),重复行/单词全部删除、一行/单词都不留。如:文本中出现两次或两次以上“able”,则把文本中所有的able都删除,一个不留。如删除时能选择是“留下一个”抑或是“一个不留”就更好了!

2.比较一个参考文本与一个或多个源文本,在源文本中查找参考文本中列出的所有行/单词并全部删除,一行/单词都不留。当然,如删除时能选择是“留下一个”抑或是“一个不留”就更好了!
删除留下的空行/空白最好能被后面的行/单词自动填充。
先谢啦!
 
回复: 全功能版英文文本批量形态还原工具

Corpus4u.org的网友们好,近日易尔译科技http://www.12fanyi.cn/为方便大家针对多文本进行英文文档的批量形态还原,特花了点小时间写了个全功能版英文文本批量形态还原工具,供喜欢搞语料库的同仁们免费使用.没有什么功能限制,欢迎下载或收藏以备不时之需。

程序说明:
本小程序用以对指定目录下的英文文本文档执行批量还原处理,能够识别单词与单词之间的标点或连字符等,保持原文格式。
程序使用.net编写,需要安装.net 2.0框架后才能使用。
易尔译科技 http://www.12fanyi.cn 出品,欢迎访问。

您的回复,是我们继续贡献的动力。。。。

谢谢!已收下,能不能修改成保持原文,只在词的旁边用括号的形式将还原的形式给出。

如:this is a book.
还原为:this is (be) a book.
 
回复: 全功能版英文文本批量形态还原工具

下载了,试用了。功能很强大,谢谢!这样做就对了。祝贵公司开发出越来越多的好产品!
 
回复: 全功能版英文文本批量形态还原工具

……
应楼下人要求,新增加了保留原词,用()标注还原后的词。
附件中新加了个EnStemmer.rar,解压覆盖批量还原即可。。。。
li_bopr效率真高,感谢!
 
回复: 全功能版英文文本批量形态还原工具

从前下载过的,如果碰到乱码问题,麻烦再下载附件里的EnStemmer.rar解压覆盖。
 
回复: 全功能版英文文本批量形态还原工具

楼主这次进步很大,以这种理念经营,效益一定会出来的.真诚比什么都重要.祝成功!
 
回复: 全功能版英文文本批量形态还原工具

C友们,咱做人也要厚道啊:p! 让咱们以"顶"的行动来支持lz及其公司吧!:Dp
 
Back
顶部