Key的最近内容

  1. K

    求助ANC,Brown,BNC语料库txt文件

    感谢许教授的耐心解答!
  2. K

    求助ANC,Brown,BNC语料库txt文件

    求助各位吧友,最近在做新闻语料的研究,需要ANC,Brown,BNC这类的语料库文件,但不过好多分享的资源都已经失效了。
  3. K

    工具求助

    各位大佬们,近期看到了一个工具BFSU Spoken Utterances Extractor,觉得很有使用价值就下载了使用。目前遇到的问题是提取的内容是引号之间的,这样就会导致有些加引号但并非对话内容的也被提取了出来。目前想到的解决思路可能有:1.将提取结果复制到excel,按字符数量排序,进行人工筛查。通常,字符数较少不会是Utterances。2.左右索引定位寻找对话动词或者人物标识,但这个应该比较难以穷尽。3.借助语义模型的筛查。不知道各位大佬有没有什么好的想法,可以分享一下
  4. K

    有没有计算STTR较好的测算软件

    感谢许教授的帮助!前几天这个网站老是打不开,今天总算是上来了。
  5. K

    有没有计算STTR较好的测算软件

    非常感谢热心的许教授!使用了一下,觉得非常简洁好用。但希望可以增加一下ttr的数据,因为可能大部分研究都会将ttr和sttr都考虑在内。然后说明文档里最好说明一下具体算法,这样也会让研究者明白与其他软件得出不同数据的原因。最后就是可以增加一个平均句段长的计算,这也会方便很多研究人员做深入的研究。
  6. K

    想问问篇章层面的语言参数有哪些

    感谢许教授的解答!最近在做研究时还碰到一些困惑,就是汉语平均句长计算的是汉字个数呢还是词数?将原文本放进wordsmith里面呢还是分词后的?而至于句段长,目前应该没有现成工具,只能使用正则表达式。但是否需要把标点包含在内?
  7. K

    想问问篇章层面的语言参数有哪些

    许教授,近期我使用了这个工具,发现可能不太适合我在做的研究。因为我是对汉译本的研究,所以这个软件可能不支持汉语的参数提取。所以我现在想的一个解决办法是,用正则表达式去提取代词、连词,这样研究reference, conjunction, and substitution
  8. K

    想问问篇章层面的语言参数有哪些

    非常感谢许教授!
  9. K

    想问问篇章层面的语言参数有哪些

    各位大佬,求助一下!我在用语料库做译本风格的研究。想问问篇章层面的语言参数有哪些?连词、介词数量能算吗? 目前看了一下汉语可读性分析工具ARC,据说是分析词汇、句法、语义三个维度的九个语言指标,但感觉这好像不能够说明篇章层面上面的问题。还请各位大佬指点~
  10. K

    detagging tools在win11上无法运行

    许教授,想问问xml这种带有元信息和标注的文件该如何进行检索研究?例如计算形次比时是否应当清除所有元信息和赋码标注?但具体清除方法是用正则表达式还是另有工具?
  11. K

    有没有计算STTR较好的测算软件

    求助各位大佬,想问问wordsmith 9.0里面形次比计算的问题?首先软件里面得出的ttr是百分数形式,但大部分论文给的数据都没有出现百分号。求大佬们解答~
  12. K

    北外语料库团队利用ChatGPT开发的语料库软件及开发过程视频展示

    感谢许教授及团队的付出!另外,想问问有对中文文本进行readability分析的工具吗?
  13. K

    Coh-Metrix是不是已经停用了

    https://tool.cohmetrix.com/这个网站打开貌似是空白的
Back
顶部