Latest activity

  • S
    感觉许教授回复!后续实验一下试试。
  • S
    siqilinwillbephd 发布新主题
    求助标题所示文章,万分感谢!
  • xujiajin
    这是个现实存在的真问题。 以下思路供参考。 语料库可存为两个版本。其中一个版本是完整版;另一个为删除非翻译内容的版本。检索分析可在第二个版本中进行,如有需要,再反查第一个版本,获取完整上下文。通常基于句对齐平行语料库的词句分析,不大用得上那么多上下文信息。...
  • S
    Sumemr 发布新主题
    想咨询一下各位老师,现在的技术和工具能够完成建设双向的口译语料库吗,交传方向的。近期整理出来了一个商务类型的交传口译音频,想做成纯文字版的语料库,但是试了许多软件都无法到达检索那一步。因为是交传所以文档中势必有许多对话但非翻译的内容,如果删除又会影响整体情况。想了解一下除了...
  • D
    好的好的!感谢许老师!:D
  • xujiajin
    这里有字数说明:https://bcc.blcu.edu.cn/help BCC没有按词次来计算库容。词有争议,字相对更没有争议。 汉语一个词,可以粗略以1.6个汉字来折算。
  • xujiajin
    他们官方宣布不再维护。他们提供了一个单机版的Coh-Metrix,但并不好用。 替代方案是Kristopher Kyle的系列工具:https://www.linguisticanalysistools.org/tools.html
  • R
    Ray_Bai 发布新主题
    https://tool.cohmetrix.com/这个网站打开貌似是空白的
  • D
    谢谢许教授!荀老师的这篇文章我之前看过了,里面也没有关于总词容的相关信息
  • xujiajin
    https://bcc.blcu.edu.cn/downloads/papers/%E5%A4%A7%E6%95%B0%E6%8D%AE%E8%83%8C%E6%99%AF%E4%B8%8BBCC%E8%AF%AD%E6%96%99%E5%BA%93%E7%9A%84%E7...
  • D
    dcman 发布新主题
    老师希望我们基于BCC语料库计算语块MI值,只知道总字数约 95 亿字,不知道语料库的总词容,请问有没有前辈知道bcc的总词容是多少?
  • 不用翻墙可以用的一些大语言模型,通义https://tongyi.aliyun.com/ 在生成英文方面个人感觉与国外的明显能看出不少差异 豆包https://www.doubao.com/ 感觉比通义好像出入不大,比通义强一点点而已,kimi...
  • Y
    大家好,我最近在使用MAT1.3.3时,选择“tag and analyze”,然后上传文本之后,软件会弹出这样的提示。我按照这个路径去找,也并没有找到这个内容。请问大家这是哪里出了问题?(不知道为什么,我不能上传图片,就把文字复制在下面了) “Illegal...
  • Y
    原来还可以有这种思路,我尝试一下,感谢分享!
  • Y
    好的谢谢!
Back
顶部