gshulun的最近内容

  1. G

    用antconc研究中文对话语料中的话轮

    我个人理解,应该不能用antconc研究中文对话语料中的话轮。 可以直接在Excel或者ACCESS或在WORD(需要变成表格)中,增加一列来进行标注,然后统计标注的结果。 (没做过话轮研究,外行话,仅供参考)
  2. G

    求教各位老师,antconc可不可以统计标准类形符。

    应该可以。另外也可以用别的方法:把语料变成一词一行后(就是把空格替换为段落标记或称回车符),然后导入到ACCESS中,然后通过其中的筛选功能,可以筛选出其中的第1000个“/",第2000个(只要找到第1个1000后,选定其中的000就可以筛选出来)。(顺便问一下,你说的标准,是标注之误吧)
  3. G

    大量中文语言资源库

    回复: 大量中文语言资源库 但是除了样例之外,都是要花钱的。
  4. G

    如何用antconc检索中文语料词频?

    回复: 如何用antconc检索中文语料词频? 可以用ICTCLAS,网上搜索一下,应该能找到。 还有中国语言文字网上首页右下角有工具链接(http://www.china-language.gov.cn/cms/turnpage/turnpagebysortidxi.jsp?column_id=56&sortid=0)
  5. G

    请教如何统计一篇文章的类符数?How to count all word types in a text?

    回复: 请教如何统计一篇文章的类符数?How to count all word types in a text? 我已经试了一下,真是个好东西,虽然暂时还用不着,先收藏起来,谢了。
  6. G

    如何规范这样的数字

    回复: 如何规范这样的数字 就我所知,一般使用最后一种写法。
  7. G

    请教如何统计一篇文章的类符数?How to count all word types in a text?

    回复: 菜鸟提问:请教如何统计一篇文章的类符数? 没错,接下来,就该自己再做一次lemmatization(词目归并),如果有需要的话。
  8. G

    请教!!!如何检索出“长被字句”?

    回复: 请教!!!如何检索出“长被字句”? 貌似计算机只能解决类似2楼的问题,而不能解决3楼的问题。
  9. G

    请教如何统计一篇文章的类符数?How to count all word types in a text?

    回复: 菜鸟提问:请教如何统计一篇文章的类符数? 对于英语而言,很简单,在UltraEdit软件中先把空格替换成回车符,然后从“文件”中选择“(删除重复项)排序”就可以得到所有不同的类符数了(有多少行就是多少个类符,行数可在“视图”中选择显示出来)。
  10. G

    关于中文语料库句长及词汇频率问题

    回复: 关于中文语料库句长及词汇频率问题 只要启动ACCESS,在新建表时选择从外部导入数据(2003与2007版本有一些不同)就可以根据提示一步步导入成功,指定分隔符号最好用Tab键即制表符,对于中文文本也可以使用普通空格。...
  11. G

    关于中文语料库句长及词汇频率问题

    回复: 关于中文语料库句长及词汇频率问题 简单说来是这样的:先把已经切词的语料转变成一词一行(这一点如果短的话,可以在WORD中做替换,比如把词的的间隔,一般是空格替换成回国符,长的话,可以在UltraEdit中进行,速度会快很多),然后把一词一行的文本文件导入到ACCESS的新表中,再使用其中现成的重复查询就可以获得每个词的重复出现次数即词的绝对频数。 如果大家有兴趣,我得空再整理一下,写得详细一点。
  12. G

    关于中文语料库句长及词汇频率问题

    回复: 关于中文语料库句长及词汇频率问题 如果已经分词,如果规模不是很大,我可以教你用不太复杂的方法自己免费计算(只要利用普通的office组件就行了。)
  13. G

    常用语料库链接页面Corporalink:小许的语料天涯20110501更新

    回复:常用语料库链接页面Corporalink:小许的语料天涯0407更新 那就请帮忙加上我的个人网页链接吧:http://www.sie.sjtu.edu.cn/page/cnpage/xyjs_teacher_gshulun.htm 先谢过了。
顶部