搜寻结果

  1. xujiajin

    北外语料库团队利用ChatGPT开发的语料库软件及开发过程视频展示

    北外语料库团队利用ChatGPT开发的语料库软件及开发过程视频展示 https://corpus.bfsu.edu.cn/TOOLS.htm 使用大模型开发软件的操作视频Tutorial video on developing software using large language models - BFSU Bilingual Alignment Keeper beta: adds line-end markers to keep sentence alignment after POS tagging. - BFSU Detagger: an...
  2. xujiajin

    求助:请问有没有与红色文化相关的中英双语语料库?

    知网搜到如下条目: 田程,崔晗.中国红色文化特色汉英语料库建设和应用研究——以辽宁省为例[J].文化学刊,2024,(5):198-201.
  3. xujiajin

    求助:请问有没有与红色文化相关的中英双语语料库?

    类似主题的平行语料库有很多,但都未对外开放。
  4. xujiajin

    【构式搭配分析】关于提取POS对应词组的问题

    不会写正则表达式或CQP语法表达式,可以去问GPT老师。
  5. xujiajin

    【构式搭配分析】关于提取POS对应词组的问题

    应该用正则表达式检索。 若在特定平台上进行检索,应遵循该平台所支持的检索表达式规则进行编写。 例如在CQPweb平台(例如:http://114.251.154.212/cqp/)检索,可参考CQP检索语法,可参见:https://corpus.bfsu.edu.cn/CQP_syntax.pdf
  6. xujiajin

    第四届语料库建设与应用研讨会录用摘要名单

    2024年8月10日第四届语料库建设与应用研讨会信息 开幕时间:09:00 闭幕时间:17:20 主旨报告 1 发言人:顾曰国教授(中国社会科学院语言研究所) 开始时间:09:50-10:20 主旨报告 2 发言人:卫乃兴教授(北京航空航天大学) 开始时间:10:20-10:50 主旨报告 3 发言人:梁茂成教授(北京航空航天大学) 14:00-14:30 主旨报告 4 发言人:张永伟研究员、张伯江研究员(中国社会科学院研究所) 14:30-15:00...
  7. xujiajin

    第四届语料库建设与应用研讨会录用摘要名单

    录用摘要名单 语料库驱动的词项研究学术演变 刘运锋 基于人工智能的多模态语料自动转写标注平台建设 李若凡a;陈良宇b 基于临近最优主动学习模型的多语言发音字典构造方法研究 曹德智 口译笔记特征标注计算机辅助系统CANA的开发 周金华a;董燕萍b “人工智能+语料库=自动化词典编纂”吗?---来自一项基于预训练模型的义项相似度研究工作的启发 柏晓鹏 语言智能时代呼唤语言学理论创新 张松松a;李斌b 关于中介语语料库偏误标注原则的若干思考 周文华 英汉心理形宾构式表义方式的对比研究 刘岩 中国时尚语言语料库建设及百年流变研究 刘溪木;陈路阳;张欣瑶...
  8. xujiajin

    求Shlesinger的Simultaneous Interpretation as a Factor in Effecting Shifts in the Position of Texts on the Oral-Literate Continuum一文

    https://www.researchgate.net/profile/Anthony-Pym-3/publication/329371864_Simultaneous_interpretation_as_a_factor_in_effecting_shifts_in_the_position_of_texts_in_the_oral-literate_continuum/links/5c054d4a458515ae544306f9/Simultaneous-interpretation-as-a-factor-in-effecting-shifts-in-the-position-o...
  9. xujiajin

    关于双向口译语料库

    这是个现实存在的真问题。 以下思路供参考。 语料库可存为两个版本。其中一个版本是完整版;另一个为删除非翻译内容的版本。检索分析可在第二个版本中进行,如有需要,再反查第一个版本,获取完整上下文。通常基于句对齐平行语料库的词句分析,不大用得上那么多上下文信息。 再有,若不删除非翻译内容,也可在文中逐个手工标出非翻译字段,以便检索分析时区别对待。 用ELAN做多模态平行库,工作量大,效价比不高,不建议尝试。其他网友若有这方面经验,好的做法,欢迎分享。
  10. xujiajin

    求助:BCC语料库总词容

    这里有字数说明:https://bcc.blcu.edu.cn/help BCC没有按词次来计算库容。词有争议,字相对更没有争议。 汉语一个词,可以粗略以1.6个汉字来折算。
  11. xujiajin

    Coh-Metrix是不是已经停用了

    他们官方宣布不再维护。他们提供了一个单机版的Coh-Metrix,但并不好用。 替代方案是Kristopher Kyle的系列工具:https://www.linguisticanalysistools.org/tools.html
  12. xujiajin

    求助:BCC语料库总词容

    https://bcc.blcu.edu.cn/downloads/papers/%E5%A4%A7%E6%95%B0%E6%8D%AE%E8%83%8C%E6%99%AF%E4%B8%8BBCC%E8%AF%AD%E6%96%99%E5%BA%93%E7%9A%84%E7%A0%94%E5%88%B6_%E8%8D%80%E6%81%A9%E4%B8%9C.pdf 荀恩东, 饶高琦, 肖晓悦, 臧娇娇. 大数据背景下BCC语料库的研制[J],语料库语言学,2016(1).
  13. xujiajin

    有没有一些近几年的二语学习者写作语料库,国内外都可以

    大规模中学生英语作文库,未见有可公开获取的。
  14. xujiajin

    2024语料库建设与应用研讨会征文(7月31日截止)免会务费

    “2024语料库建设与应用研讨会”由中国社会科学院语言研究所语料库暨计算语言学研究中心、北京外国语大学中国外语与教育研究中心、国家社会科学基金重大项目“辞书编纂用大型多功能语料库建设与研究”(23&ZD314)联合主办,外语教学与研究出版社协办。大会定于2024年8月10日在北京大兴北京外国语大学国际会议中心举行。本届会议主题为“语料库语言学前沿:数据驱动的语言研究、创新应用与未来展望”。本次会议的主旨发言人为:中国社会科学院顾曰国教授、北京航空航天大学卫乃兴教授、北京航空航天大学梁茂成教授、中国社会科学院张永伟研究员。 本次会议不收取会务费。...
  15. xujiajin

    有没有一些近几年的二语学习者写作语料库,国内外都可以

    -TECCL中国学生万篇英语作文语料库:http://corpus.bfsu.edu.cn/info/1070/1449.htm TECCL可全文下载 许家金. “中国学生万篇英语作文语料库”介绍. 语料库语言学, 2016, (2): 108-112. -iWriteBaby中国英语学习者语料库常见错误分析平台: -许家金,2019, iWriteBaby中国学习者英语语料库的创建,《语料库语言学》(1):105-109。 iWriteBaby可在线浏览偏误类型及在线检索。 https://iwritecorpus.unipus.cn/iwrite-baby-client/#/...
  16. xujiajin

    London–Lund Corpus 2 A corpus of spoken British English

    London–Lund Corpus 2 A corpus of spoken British English Welcome to the official website of LLC–2 The London–Lund Corpus 2 (LLC–2) is a half-a-million-word corpus of spoken language with recordings from 2014–2019 with adult educated speakers of British English. On the one hand, the corpus is a...
  17. xujiajin

    BFSU Collocator提取city一词的搭配情况,为什么只显示a、b、c开头的搭配呢?

    搭配词默认是按字母顺序排序,因此a、b、c开头的单词排在前头,翻页后应该可以看到其他搭配词。
  18. xujiajin

    关于北外的BFSU_Qualitative_Coder_1.2手工标注工具,我在使用autocode功能时,不知道哪里出现问题了,导致全文被标注,以下是我的codelist,大家可以帮我看一下是不是有问题啊?十分感谢!!

    请在正则表达式中的每个单词前后加上\b试试。 例如:regExpr=\bdo\b|\bdoes\b|\bdid\b \b这里表示单词边界,应该是boundary的首字母。
  19. xujiajin

    求:英汉双语平行文本自动对齐系统

    当然也可以尝试用大语言模型来实现:https://promptbank.unipus.cn/portal/detail?id=188 用于测试的两个文本可从下面链接获取: https://corpus.bfsu.edu.cn/A01A.EN.txt https://corpus.bfsu.edu.cn/A01A.ZH.txt
Back
顶部