李亮1975重庆的最近内容

  1. 李亮1975重庆

    自定义赋码的语料库标注工具?

    我做过相关的几份图文演示教程的…… http://www.doc88.com/p-618723143914.html http://www.doc88.com/p-701929069023.html http://jingyan.baidu.com/article/25648fc185f8a89190fd004b.html
  2. 李亮1975重庆

    【重磅资源】英语名言格言语料库5个

    【重磅资源】英语名言格言语料库5个,后台都是几万甚至几十万条脍炙人口的句子甚至段落,可当做教学资源来找经典例句,可当做科研资源来研究最经典句子的用词规律!在页面都搜索框,输入某个词(例如smart或foolish)就能搜索整个数据库 http://www.quotationspage.com http://www.faganfinder.com/quotes http://www.thinkexist.com http://www.online-literature.com/quotes/quotation_search.php https://creativequotations.com
  3. 李亮1975重庆

    你应该放弃使用paraconc,它是个古老的软件,开发者早已退休,软件也早已不适应新的操作系统了。你应该用antpconc,它不断更新,功能强大,兼容性很强,速度也很快,主页上还有PDF的使用指...

    你应该放弃使用paraconc,它是个古老的软件,开发者早已退休,软件也早已不适应新的操作系统了。你应该用antpconc,它不断更新,功能强大,兼容性很强,速度也很快,主页上还有PDF的使用指南 http://www.laurenceanthony.net/software/antpconc/
  4. 李亮1975重庆

    如何生成文本"最常用标注表"即"list of the most frequently used tags"?

    方法1:用正则表达式提取出所有标签到另一份文本文件而用antconc生成这份文件的词表就是你要的标签数量排行榜了! 方法2:用正则式剔除带标签的所有单词本体,保存当前文件,即可用antconc生成词表而其实形成了你要的那种词表! 正则式就像狙击步枪的瞄准镜,是用来批量猎杀的,批量猎杀其实是指"批量染色凸显、批量删除、批量提取、批量统计、批量替换"。在灵活运用情况下,批量删除与批量提取是殊途同归的相同功能,上面的方法1与方法2就是"南辕北辙、殊途同归"! 用正则式瞄准单词本身,一般是:[a-zA-Z0-9]+...
  5. 李亮1975重庆

    求助:英语被动语态的正则表达式的写法

    [1] 正则式只是一种模糊匹配表达式,被动语态的匹配必然涉及到词类标签与句法标签,而且句法标签与词类标签全世界有好几套且差异较大; [2] 在线版语料库往往为了响应速度,并不支持最齐全的正则式符号范围,往往采用了某些特殊的表达模糊的符号,需要具体问题具体分析; [3] 英语被动语态的形式化表达极为复杂,因为被动语态有多种引导词、被动语态有可能没有引导词、被动语态有by有with这两个标志词但缺少这两个标志词也依然可能是被动语态; [4] 无论中英文的被动语态,正则式到底试图提取句子还是局部短语,这个抉择也严重影响正则式的复杂度; [5] 正则式并不复杂,完全可以自学; [6]...
  6. 李亮1975重庆

    海量语料检索方案:findstr + AntConc(适合几百兆甚至4GB)

    finstr教程我发布到豆丁网了,网址是 http://www.docin.com/p-466643056.html antconc被我做了多份教程,最基础一份是 http://www.docin.com/p-469407203.html antconc的更高级两份教程在这 http://jingyan.baidu.com/user/npublic?un=aidsaids2000
  7. 李亮1975重庆

    求助:如何能下载到wordsmith

    CohMetrix的联系人是Danielle Clewley,邮箱是dncclewley@gmail.com,这是谷歌邮箱,估计你从国内任何邮箱都极有可能无法发送邮件抵达且不会提醒你无法送抵邮件。而Danielle Clewley的工作单位是:Department of Psychology,Institute for Intelligent Systems。 我的微信号liliang_1975,欢迎加我,因为百度里面现在连VPN都被我国清理干净了,不过可以使用最著名的那几款傻瓜式穿墙工具。
  8. 李亮1975重庆

    求助:如何能下载到wordsmith

    http://141.225.42.86/CohMetrixHome/ 在这里不用翻墙,这里可与作者联系,毕竟是个收费平台,应该是渴望为付费用户提供"绕墙"在内的各种服务!
  9. 李亮1975重庆

    求助:如何能下载到wordsmith

    5.0版的中文指南 http://lexically.net/wordsmith/step_by_step_chinese/index.html 5.0版到7.0版的多语种指南 http://lexically.net/wordsmith/support/get_started_guides.html
  10. 李亮1975重庆

    求助:如何能下载到wordsmith

    wordsmith第4版已免费 http://www.sohu.com/a/125794115_488760 官网的下载页面 http://www.lexically.net/wordsmith/downloads/ 安装方法:到官网下载4.0,安装中途填入“Name: FREE”且填入“Other Details: WS4 licence”且填入“Registration: XA00.3844.3153.3460.3789”;如果不在安装中途进行3个项目的填写,就没有获得“全功能免费版”!
  11. 李亮1975重庆

    在线版语料利器10款

    汉语分词与词类自动标注 http://www.xunsearch.com/scws/demo/v48.php 或者 http://cws.9sep.org 英语分词与词类标注 https://copa-trad.ufsc.br/#tree-tagger-cloud 或者 http://nlpdotnet.com/Services/Tagger.aspx 英语屈折剔除 http://text-processing.com/demo/stem 或者 http://textanalysisonline.com/nltk-wordnet-lemmatizer...
  12. 李亮1975重庆

    求助,怎么利用AntConc检索BNC里的虚拟语气的倒装句?正则表达式什么啊?

    AntConc处理语料时,是把语料全部加载到内存,因此占用内存量惊人,虽然这么做的优点是处理速度极快,而据以往经验,AntConc只能处理100MB左右的语料就要卡死,而BNC2005版有500MB,BNC2008版有9GB,断然无法用32位版AntConc处理,或许64位版运行在8GB物理内存以上的电脑就能处理BNC。建议你用在线版BNC!
  13. 李亮1975重庆

    求助,怎么利用AntConc检索BNC里的虚拟语气的倒装句?正则表达式什么啊?

    按正常思维,用正则式表达虚拟倒装,极为复杂,因为要表达出"助动词+主语+缺助动词的谓语",要么按词类标签来抽象表达,要么用具体助词与词类标签的组合来稍微具体地表达,无论如何,最难是用正则式表达"主语",主语的直接简单形式与多层复杂形式太多了。 摆脱死板思维,其实有个妙法:句首是助动词,句尾是句号,就是倒装虚拟语气了!
  14. 李亮1975重庆

    早已潜伏Windows的十大语料神器

    attrib.exe 取消病毒恶意设置为隐藏属性的成千上万个(语料)文件的隐藏状态,或者隐藏语料大量文件避免遭到恶意盗窃 convert.exe 让硬盘的分区可以存储4GB以上的超大单个语料文件 copy.exe 让成千上万个语料文件瞬间合并 del.exe 基于文件命名特征而瞬间删除某个文件夹之内成千上万个语料文件 dir.exe 基于文件命名特征而瞬间列出某个文件夹之内成千上万个语料文件的名称清单 fc.exe 大海捞针式自动锁定Unicode乱码或者自动锁定自动拼写矫正了哪些零散字母 findstr.exe 支持入门级正则式的GB级语料文件的闪电检索 sort.exe...
  15. 李亮1975重庆

    关于readability analyzer统计的句数的问题

    光看图,估计顶级高手也只能乱猜一大堆的可能性,应该上传原文和提供软件的下载链接,其他朋友测试。
顶部