搜寻结果

  1. 请教:自建语料库,用Wordsmith检索时,单引号都变成了怪异的符号

    回复: 请教:自建语料库,用Wordsmith检索时,单引号都变成了怪异的符号 好像是保存的编码格式不对造成的,试试UTF-8格式保存
  2. Sentence Segmenter

    回复: Sentence Segmenter http://someya-net.com/00-class09/sentenceDiv.html 这是一个在线切分句子的。
  3. 请问:有没有可以统计音节数的软件?多谢了!

    回复: 请问:有没有可以统计音节数的软件?多谢了! http://www.sttmedia.com/ 上面的 wordcreator 带有这个功能。不知道这个年代研究音节有啥现实意义。不同词典对于音节划分都不一样。电脑和软件非常盛行的年代有必要研究音节吗?难道你在研究语音合成或者语音识别技术?
  4. 【提问】大家做语料库用的都是什么样的扫描仪?

    回复: 【提问】大家做语料库用的都是什么样的扫描仪? 没有多少必要使用扫描仪,除非要有特定内容的资料。千元以下的扫描仪只适合扫描少量资料,要快速大批量扫资料最好选高速扫描仪。高速扫描仪价位在几千元到几万元这个范围。 如果只是扫几本口语书这种数量,可以选用汉王速录笔,扫到excel里,扫双语对照的采用这种方式速度过得去。前提是你会用excel函数自动分离中英文。 对于文字识别软件最好的就是ABBYY Finereader 11。其次是汉王的。
  5. 求助:文本识别工具

    回复: 求助:文本识别工具 如果要制作上万句或者更大的规模,最好采用几千元的高速扫描仪,扫描模式是拆书扫,速度非常快,扫描完一个小型书店的书也用不了多少天,OCR软件世界上最好的还是ABBYY Finereader
  6. 有无一下可以查出50个词发音的英语字典?同时输出!

    回复: 有无一下可以查出50个词发音的英语字典?同时输出! 有,网上有个全文词典(软件),同时查几百个或几千个单词都没问题。缺点是含义不一定符合上下文要求。
  7. 2013年语料库翻译学暑期讲习班启事

    回复: 2013年语料库翻译学暑期讲习班启事 这种培训如果能够面向现实的英语教学或者应用于现实的英语教学中就更有意义了。否则也就是几个研究生用于写论文用。论文写的再多,不用于现实,没有一点意义。
  8. 求助,文本清洁遇到的问题。

    回复: 求助,文本清洁遇到的问题。 PDF文件不建议直接转word,因为直接转word处理起来很麻烦,PDF转word软件为了保持原文排版采用了大量的文本框。目前主流的PDF转word软件基本都是这样的。建议采用PDF转txt的方式处理,这样就没有图片了,不过对于复杂的公式当然也就没法处理了。语料库处理的大多数文件是txt格式的,那些语料库软件好像没见过直接能处理doc格式的。语料库好像主要针对纯文字类的文件,遇到公式图片的这种资料还是能不用就不用吧,毕竟网上可用的文字资料多的是。像你上面说的那种资料处理起来会用很长时间的。当然这种资料你想作为别的用途就另当别论了。
  9. 请问哪位牛人知道英语写作自动评价系统软件?

    回复: 请问哪位牛人知道英语写作自动评价系统软件? 如果软件作者想让人试用或者购买早就发表相关信息了,既然没有这种信息,那就基本上说明这个软件是为部分人写论文用的,不是用于普及英语教育用的。既然没法试用也不能购买,那就找别的软件。如果你想批改作文而不是要求软件自动给评出分数,可以从网上找找StyleWriter这个软件,网上有可用的版本,注册激活的时候需要按照说明,如果不缺钱就买正版吧。
  10. 平行语料库逐句对齐是否真有必要

    大家都知道,现成的双语语料库没法做到完全的逐句对齐,除非人工改译。既然做不到逐句对齐,干嘛非要浪费人力物力让它逐句对齐。能对齐的就让它对齐,不能对齐的就采用一对多或者多对一的原则进行对齐不就解决了。这在翻译中也就是分译和合译。 目前有大量的双语网站,上面有逐段对齐的文章和新闻。为何不有效的利用这现成的资源快速建立双语平行语料库呢? 其实这个帖子主要是给语料库软件开发人员看的。 上面说了双语对照的网站,这些网站中很多有逐段对齐的文章,编程人员完全可以开发这样一个软件,而这个软件带有这种功能:1。批量下载 2. 提取双语逐段对齐语料 3.纠正网页转txt乱码 4. 精细对齐...
  11. 学习正则表达式的好软件Expresso

    正则表达式学习起来真像天书,一长串的符号看起来比高等数学还难懂。其实这主要是因为没有找到好的学习资料。正则表达式是实践性很强的,大多数情况需要验证才容易让人明白。所以一款好的软件能够加快学习进度。这里介绍一款学习正则表达式的软件Expresso,这个软件是免费的,但要注册。习惯英文的还是使用英文版,不习惯英文的可以使用汉化版。 这里给一个下载地址http://kuai.xunlei.com/d/2OXkDsEF-wATUQQAc9f \b\. \w* \w* \bthat\b|\b\. \w* \w* \bwhat\b|\b\. \w* \w* \bhow\b...
  12. 在编写教材时,如何用range确定阅读材料的词汇难度

    回复: 在编写教材时,如何用range确定阅读材料的词汇难度 可以用词频和单词长度确定词汇难度,如果非要弄出个难度系数来,那可有事情干了。
  13. 征集语料库软件需求

    回复: 征集语料库软件需求 其实语料库软件已经不少了,这些软件多数非常雷同,多数人在使用语料库软件遇到的最大难点可能是正则表达式,如何快速写出正则表达式这对于语料库的检索也研究有着非常重要的意义。如果这个语料库软件能在这方面有很大突破,那是非常有意义的。语料库方面用于写正则表达式的软件是有一个PatternBuilder,但这个软件对于非专业研究人员是有些局限性的。 语料库的使用软件其实有两派,一派是研究人员,用于写论文等;另一派是应用人员,用于语言学习和教学。对于第二派人员可能不太可能去使用标注的语料库。这部分人应该注重直观易用。...
  14. 征集语料库软件需求

    回复: 征集语料库软件需求 个人感觉主要应该解决处理文本文件的速度,对于大的文本文件的处理速度,还有就是朝着实际应用方式发展,不要把语料库软件变成几个语料库专业人员和研究生研究以及写论文的工具,而是变成英语教学和学习中的一个易用的工具软件。
  15. 求做自动的“英语音标”和“汉语拼音”标注的软件

    回复: 求做自动的“英语音标”和“汉语拼音”标注的软件 一般使用还是到Excelhome上面下载音标助手吧。
  16. 一个详细的Praat的视频教程(可惜是韩语的)

    无意中发现了一个详细的Praat视频教程,不过是韩语的,不知道那位懂韩语的愿意把这些视频文件翻译成中文的。http://www.ling.ohio-state.edu/~kyoon/praat/ 不解的是为什么国内就找不出一个像样的Praat视频教程。
  17. BFSU List Merger词频表合并工具

    回复: BFSU List Merger词频表合并工具 怎么下载多次都下载不下来? 而且是不同时间下载
  18. 北外语料库沙龙:王克非教授谈“双语语料库的研制与应用研究”

    回复: 北外语料库沙龙:王克非教授谈“双语语料库的研制与应用研究” 什么时候这些讲座的录像能够在网上出现就好了,这样互联网就不只是像个局域网。什么时候国内大学的好的教学录像或资料能够像国外大学那样在网上开放,教育也就进步了。 更让人不解的是国外很多大学的教育课件在网上公开发表,而在中国开放教育资源协会这种网站却对这些课件做了很多限制,开始的时候这个网站对于那些课件都可以看的,后来就几乎没法看了。有点走题了。 我不知道这个网站在上面发个这样的帖子做什么用,如果是为了广大互联网用户,那就开放出来,把录像发出来。如果是仅仅针对北外的部分学生,那直接内部发一个通知就行了。
  19. TreeTagger: An Automatic POS tagger Windows interface

    回复: TreeTagger: An Automatic POS tagger Windows interface 论坛上这个treetagger与《语料库应用教程》一书附带的光盘里的Treetagger有何区别?
  20. 新书:《语料库应用教程》2010年8月

    回复: 新书:《语料库应用教程》2010年8月 淘宝上早就有了。
Back
顶部