Corpus4u精华贴汇集

本文由 laohong2009-09-08 发表於 "自由天地" 讨论区

  1. laohong

    laohong 管理员 Staff Member

    应xusun575等网友给管理员的建议,特此开辟此帖,希望大家根据自己的喜好和判断,把以往的好贴挖出来跟贴列在这里,方便新来者学习,也方便老C友温故知新。具体做法如下:

    1、找出自己认为精华的贴子;
    2、把贴子的主题复制下来;
    3、把贴子的链接复制下来;
    4、把相关的类别写下来;
    5、加上几句简单的介绍说明为什么认为这个贴子算作精华;
    6、其它相关信息等。

    请大家直接在这里跟贴,每个跟贴贴一个,方便管理员后期整理。多谢!
     
  2. laohong

    laohong 管理员 Staff Member

    回复: Corpus4u精华贴汇集

    自己顶一下,坐个沙发,贴个例子,方便大家跟贴。

    用AntConc处理中文concordance, wordlist, N-gram

    http://www.corpus4u.org/showthread.php?t=1714

    类别:语料库检索

    说明:该贴累计达150多楼,图文并茂详细讨论了用AntConc检索中文、藏文语料的相关问题,也提及了与使用WordSmith的不同以及注意事项。建议初次接触者从头到尾仔细阅读,研习提高。另外,该贴corpus4u大腕云集,人气甚旺,推荐为精华贴。
     
  3. Haiyang Ai

    Haiyang Ai Administrator Staff Member

    回复: Corpus4u精华贴汇集

    A Corpus Worker`s Toolkit:语料库工具箱

    http://www.corpus4u.org/showthread.php?t=798

    类别:语料库检索

    说明:处理中英文语料的一套利器,包含文本处理,检索统计,互动加码以及口语转写的功能。是动态语法老师送给广大无产学者的一件大礼,建议初学者好好学习研究。
     
  4. xusun575

    xusun575 高级会员

    回复: Corpus4u精华贴汇集

    汉语文本处理常见问题及解答 中文 Chinese text processing FAQ

    http://www.corpus4u.org/showthread.php?t=699
    类别:汉语文本处理

    说明:汉语文本处理常见问题及解答之大全,涉及分词、自动分词软件、中文Annotation Tool、编码转换、汉字文本转拼音、多文本合并、大文件分割、数据统计处理等等问题,无论先学与后学,浏览必有所获。
     
  5. xusun575

    xusun575 高级会员

    回复: Corpus4u精华贴汇集

    想给英语专业本科生开门语料库辅助英语学习的课
    http://www.corpus4u.org/showthread.php?t=3850
    类别:语料库语言学教学
    说明:一位资深教师把现代语言学理论与技术与本科教学结合的尝试,对初涉教坛的新兵会有启发。尤其是oscar3对回帖的总结,是网上交流etiquette范例,值得我们C友效仿。
     
  6. xusun575

    xusun575 高级会员

  7. laohong

    laohong 管理员 Staff Member

    回复: Corpus4u精华贴汇集

    为了方便后期整理,我得把上面引用的贴子删掉,希望xusun575理解,作为回报,这个贴子估计就是你一直要的那个对话贴:

    AntWordProfiler = Paul Nation's Range program

    http://www.corpus4u.org/showthread.php?t=3818

    类别:编程与工具开发

    说明:该贴主要讨论了Antony Laurence开发的Ant Word Profiler 和 Paul Nation 开发的 Range 这两个程序的功能差别和使用方法。Antony本人还参与了讨论,值得大家阅读。
     
  8. laohong

    laohong 管理员 Staff Member

    回复: Corpus4u精华贴汇集

    另一个Antony本人参与讨论的贴子:

    Anyone Met this Problem with Antconc?

    http://www.corpus4u.org/showthread.php?t=3964

    类别:语料库检索

    说明:该贴探讨了使用AntConc在处理中文语料时所遇到一个有趣现象:汉语词频竖着显示。由此延伸到字体和系统使用的不同会导致语料检索的一些相关问题。
     
  9. xusun575

    xusun575 高级会员