搜寻结果

  1. 李亮1975重庆

    基于NLTK的屈折批量还原器.zip

    比较级和最高级可以还原的,要高正确率地实现必须编程 NLTK的词形还原器的默认还原办法是“按照规则还原”,按照规则就是根据单词的表面的拼写形式,这种方法的优点是速度超快,但正确率不是极高,肯定要出现一些错误,但是,另一种办法是基于数据库,但这种方法的编程更复杂,优点是正确率很高。 比较级和最高级的词形还原需要自己在NLTK中编程,我当前暂时没空做这方面的免费软件,可能下半年开始做这些。
  2. 李亮1975重庆

    文本标注的问题,李亮博士求你来解答!

    用我网盘的标注器版本 http://pan.baidu.com/share/home?uk=724520607&view=share#category/type=0 比Treetagger无限制本地增强版,更强更自由,能处理无限容量的语料文本,我早已发布过这些工具的帖子在本站的,也就是下面两个网盘中的软件 http://pan.baidu.com/s/1hqvaBBY http://pan.baidu.com/s/1pJJiV0J 你两张图片表明你需要的是下面这款我的软件 http://pan.baidu.com/s/1qWM4DyO
  3. 李亮1975重庆

    求助:关于使用CLEC

    回复 DMS是什么?DMS是个缩写的单词吗? CLEC的制造时间很久了,内置的小检索软件是visual basic 6.0开发的,是1997年前后的事情,所以你电脑是Win7或Win8就没法安装或没法运行了。 LOCNESS应该是你需要的 http://www.uclouvain.be/en-cecl-locness.html
  4. 李亮1975重庆

    请问POStagger CLAWS有什么区别

    类名称与实例名 POS tagger是一种软件类别的名称,这类软件都能进行POS的标注,所以统称为“POS tagger”;在这种类别中,有treetagger、CLAWS之类的具体软件名称,而CLAWS7表示CLAWS这种软件的第7版。下面网址就是treetagger的在线版的网址,可以体验下 http://web4u.setsunan.ac.jp/Website/TreeOnline.htm
  5. 李亮1975重庆

    关于多语篇语料切分成单独TXT

    回复: 基于单文件的多文本提取器.exe 没法赐教,我想不出你的操作故障在哪里,其实,也能想到很多可能性,但,都逐一解释和逐一提出解决方案要费很多时间和文字。
  6. 李亮1975重庆

    怎样用软件提取同时包含两个关键词a和b的文本呀?

    回复: DOS的find与findstr有很大威力,可以检索若干GB的文本文件且无比高速 当你双击findstr的时候,它没有收到任何执行参数,所以就立即退出了,我提供了我的简明生动的教程给你的,你没有兴趣看链接,或没仔细看而没看到那链接么
  7. 李亮1975重庆

    词长、句长、句量、词汇难度、可读性之类都能在这日本人网站在线计算

    回复: 词长、句长、句量、词汇难度、可读性之类都能在这日本人网站在线计算 界面上有5个选项,第5项你定睛看看,问题就在这里,你粗心粗心粗心……
  8. 李亮1975重庆

    《多语语料库和多语语料库分析》评介

    回复: 《多语语料库和多语语料库分析》评介 哇,恭喜发表!!!
  9. 李亮1975重庆

    关于多语篇语料切分成单独TXT

    基于单文件的多文本提取器.exe的提取适用范围 例如我们有下面的文本内容…… I am good. myhead Dogs are fierce. mytail I am angry. myhead Cats are tender. mytail Something happend. 上面的内容,如果是把“myhead”作为开始字符串,并且把“mytail”作为结束字符串,那么,就会产生出1.txt和2.txt两个新文件是提取的文章内容。 1.txt的内容是“Dogs are fierce.” 2.txt的内容是“Cats are tender.”...
  10. 李亮1975重庆

    关于多语篇语料切分成单独TXT

    基于单文件的多文本提取器.exe 我针对你的任务需求,做了个小程序,编程语言是AutoIt,已经上传到本帖的附件。 软件无需安装,解压缩到一个专门的独立的文件夹,然后再双击运行就可以了。但,千万不要直接双击你下载的压缩包,然后再直接双击里面的小程序,因为这样就导致解压缩到C盘的临时文件夹去了,就没法看到提取出来的一系列文本文件了。...
  11. 李亮1975重庆

    关于多语篇语料切分成单独TXT

    看了你提供的德语或法语样本 貌似你需要提取的部分都是以“UPDATE: ”为结束标志,而且貌似是以“L?NGE: 1525 W?rter”为开始标志,但,“L?NGE: 1525 W?rter”这是什么意思,每篇文章在这里都不一样吧?甚至有些文章的开头没有“L?NGE: 1525 W?rter”吧?
  12. 李亮1975重庆

    怎样用软件提取同时包含两个关键词a和b的文本呀?

    DOS的find与findstr有很大威力,可以检索若干GB的文本文件且无比高速 如果想要检索出C盘下的1.txt的里面的含有“big”且含有“apple”的自然段,就可以用Windows自带的find.exe和findstr.exe,就是下面的DOS指令 find.exe "big" c:\1.txt | find.exe "apple" > d:\output.txt 或者 findstr.exe "big" c:\1.txt | findstr.exe "apple" > d:\output.txt 如果希望检索D盘的“google”这个文件夹的所有的txt文件,就输入...
  13. 李亮1975重庆

    关于多语篇语料切分成单独TXT

    VBA 你的那份文件内的每篇文章的首尾有特征字符串吗?最好传一份到帖子附件,或传半份或四分之一份到附件,便于我分析,尤其是你自己难以归纳或识别的情况下。我早在本站有VBA的精彩示范 http://www.corpus4u.org/forum/showthread.php?t=8065
  14. 李亮1975重庆

    关于多语篇语料切分成单独TXT

    百度的在线TXT切割器也能对本地文件进行操作 http://www.baidu.com/s?wd=txt%E5%88%86%E5%89%B2%E5%99%A8
  15. 李亮1975重庆

    关于多语篇语料切分成单独TXT

    不针对文章起点终点而切割的文本切割器3款 http://www.downxia.com/downinfo/20964.html http://www.orsoon.com/soft/10417.html http://www.bkill.com/download/12854.html
  16. 李亮1975重庆

    关于多语篇语料切分成单独TXT

    WordSmith也有类似功能 如果你是想从一个文本文件中“剥离出”内含的每篇新闻就需要根据这些新闻的起点与终点的文本特征来制定编程办法或选择现有工具或录制修改自定义的Office Word宏,而WordSmith也有类似功能 http://www.lexically.net/downloads/version6/HTML/index.html?splitter_index.htm 但,如果每篇新闻的前后没“区别性文本字符串特征”就几乎没全自动的办法了,就只能半自动了。
  17. 李亮1975重庆

    ANTCONC达人 请进 紧急问题

    提供数据,就可分析,很可能是切词的做法在两边不一样 你拷贝那54+14吧,其他人也许都能分析了帮你。
  18. 李亮1975重庆

    珍贵的英语搭配的在线词典

    http://prowritingaid.com/Free-Online-Collocations-Dictionary.aspx 珍贵的英语搭配的在线词典,遣词造句之良伴,免费
  19. 李亮1975重庆

    R语言3.1.2版、英汉视频教程与图文教程

    主程序EXE的图标已经改为R的内置图标 欢迎下载与体验! 但愿大家都每月发表CSSCI和SSCI核心论文!
  20. 李亮1975重庆

    R语言3.1.2版、英汉视频教程与图文教程

    R语言3.1.2版、英汉视频教程与图文教程 R语言3.1.2免安装版(官方网站2014年10月31日发布) http://pan.baidu.com/share/home?uk=724520607&view=share#category/type=0 英语讲解的R语言系列视频教程 http://v.youku.com/v_show/id_XMTk3MjQzOTQw.html 中文讲解的R语言系列视频教程 http://v.youku.com/v_show/id_XNjk0NzUzOTU2.html...
Back
顶部