搜寻结果

  1. chrisyang

    《语料编程空手道:VBS零基础的文科入门》

    回复: 《语料编程空手道:VBS零基础的文科入门》 谢谢分享!真心希望李博开坛讲法,搞一个相关的系列讲座啊!
  2. chrisyang

    求patcount的下载地址

    回复: 求patcount的下载地址 你搜或者不搜,它就在那里,默默地注视着你! http://www.corpus4u.org/forum/showthread.php?t=4034&highlight=patcount&page=2
  3. chrisyang

    关于wordsmith中's ' t

    回复: 关于wordsmith中's ' t 但是应该注意到,在AntConc 3.3.1和WST4.0中做词表时,这两个软件处理n't的方式却有很大区别。以hasn't为例,如果不对hasn't进行词性赋码,那么hasn't在AntConc 3.3.1的词表中被显示为hasn 和 t两个不同的词,在WST4.0中的词表中则只显示为hasn't一个词;如果对hasn't进行词性赋码,比如使用TreeTagger2.0,则hasn't会被分为两个词:has_VHZ n't_RB 。此时再使用AntConc 3.3.1做出词表,hasn't...
  4. chrisyang

    关于wordsmith中's ' t

    回复: 关于wordsmith中's ' t 在AntConc 3.3.1中,即使原文本没有进行词性赋码,做词表时也会把诸如he's/they're/we'll/didn't等中的缩写形式视为单独一个词语而统计出来,只不过词表中显示出来的只是'号后面的部分,即分别显示为s、re、ll、t。这一点倒是和WST的词表功能上所显示的是很像的。
  5. chrisyang

    关于wordsmith中's ' t

    回复: 关于wordsmith中's ' t 在WST中做词表时,如果没有对原文本进行词性标注,那么诸如he's/they're/we'll/didn't等表达中的缩写形式's/'re/'ll/n't等不会被视为单独词语而另外列出来计算频次。
  6. chrisyang

    关于wordsmith中's ' t

    回复: 关于wordsmith中's ' t 看这种情况十之八九是因为原文本中输入的标点符号是全角的,半角状态下不会有‘这样的符号。
  7. chrisyang

    怎样对齐双语字幕翻译呢?以便批量输入ACCESS或EXCEL

    回复: 怎样对齐双语字幕翻译呢?以便批量输入ACCESS或EXCEL #15 predate<the 我写的查找正则表达式是: [a-z]<[a-z] 成功找到了。 可是替换一栏中写什么呢? Emeditor中-->搜索-->替换:查找(F): (\S+)<(\S+) 替换为:$1 $2 (即:$1空格$2),勾选“使用正则表达式”-->替换全部。
  8. chrisyang

    怎样对齐双语字幕翻译呢?以便批量输入ACCESS或EXCEL

    回复: 怎样对齐双语字幕翻译呢?以便批量输入ACCESS或EXCEL #9 {\1c&HDBDB00&\pos(198,75)\fs11\fn方正准圆简体\fscy130\frz-4\fry13\bord0\shad0} 我要把上面的{ }中的内容。 文本编辑器Emeditor中-->搜索-->替换:查找(F):(\{)(\\\S+){1,}(\}) 替换为(P):$1$3 勾选“使用正则表达式”-->替换全部(A),则会去掉{}里的内容,但会保留{}。
  9. chrisyang

    怎样对齐双语字幕翻译呢?以便批量输入ACCESS或EXCEL

    回复: 怎样对齐双语字幕翻译呢?以便批量输入ACCESS或EXCEL #10 要把段落回车替换掉要怎么做呢?我只知道在WORD中是用查找 ^p 来弄的。 文本编辑器Emeditor中-->搜索-->替换:查找(F):\n 替换为(P):什么也不填,勾选“使用正则表达式”---->替换全部(A),OK!
  10. chrisyang

    怎样对齐双语字幕翻译呢?以便批量输入ACCESS或EXCEL

    回复: 怎样对齐双语字幕翻译呢?以便批量输入ACCESS或EXCEL #9 {\1c&HDBDB00&\pos(198,75)\fs11\fn方正准圆简体\fscy130\frz-4\fry13\bord0\shad0} 我要把上面的{ }中的内容,包括{ }都删除掉,正则表达式怎么写呢? 我这样写,[{ }], 失败! 文本编辑器Emeditor中-->搜索-->替换:查找(F):\{(\\\S+){1,}\} 替换为(P):什么也不填 勾选“使用正则表达式”-->替换全部(A),Bingo!
  11. chrisyang

    关于CUC_Paraconc

    回复: 关于CUC_Paraconc 十分感谢程博士的辛苦劳动和无私的共享!
  12. chrisyang

    使用ws4检索时的怪现象,大家碰到过吗?

    回复: 使用ws4检索时的怪现象,大家碰到过吗? #11 如何用WS4或其它索引工具做出单词带POS码(word_tag)的wordlist? 在AntConc 3.3.1w中调入文本后再做如下设置后运行Wordlist功能即可:Global Settings-->Token Definition-->User-defined Token Class一栏方框里的那一行字母最后边加上“_”这个符号,然后再check方框上方的“Use Edited Definition”-->Apply。结果如下图。
  13. chrisyang

    使用ws4检索时的怪现象,大家碰到过吗?

    回复: 使用ws4检索时的怪现象,大家碰到过吗? #7:怎么样排除像freedom,democracy,and 这种被标点分割的三词词簇? 我记得在WST3中,像“freedom,democracy,and ”应该不会被分析为词簇的,因为WST3中词簇的分析会在诸如“,.!?:”等标点符号处停止的。在wst4中好像不是这样的,如#5所提供wst4做出的三词词簇中“freedom democracy and”有8个,但实际上在原文中是8个“freedoem...
  14. chrisyang

    使用ws4检索时的怪现象,大家碰到过吗?

    回复: 使用ws4检索时的怪现象,大家碰到过吗? #7:怎么样排除像freedom,democracy,and 这种被标点分割的三词词簇? 我记得在WST3中,像“freedom,democracy,and ”应该不会被分析为词簇的,因为WST3中词簇的分析会在诸如“,.!?:”等标点符号处停止的。在wst4中好像不是这样的,如#5所提供wst4做出的三词词簇中“freedom democracy and”有8个,但实际上在原文中是“freedoem, democracy,and”。
  15. chrisyang

    使用ws4检索时的怪现象,大家碰到过吗?

    回复: 使用ws4检索时的怪现象,大家碰到过吗? 和1楼所提供的三词词簇列表相比,5楼的三词词簇列表有两个明显的特点:第一,表中的任何一个词簇都包含了LZ所提供的12个检索词中的某一个;第二,表中词簇的频率和实际语料中的频率是对应的。
  16. chrisyang

    请问大家如何用SPSS统计问卷中多选题的某一选项个数

    回复: 请问大家如何用SPSS统计问卷中多选题的某一选项个数 如果后期不进行大量的统计计算的话,不建议使用SPSS做多项题选择统计,因为从选项编码到手工输入的工作量的确是太大了。
  17. chrisyang

    使用ws4检索时的怪现象,大家碰到过吗?

    回复: 使用ws4检索时的怪现象,大家碰到过吗? Cluster设置:Words in Cluster:3-3,Minimum Freq. 5, Horizons: 2L-2R”后的结果: N Cluster Freq. Length 1 WHOLE AND FREE 13 4 2 OF FREEDOM AND 9 4 3 FREEDOM DEMOCRACY AND 8 4 4 FREEDOM AND DEMOCRACY 6 4 5 OF FREEDOM IN 6 4 6 FREEDOM FOR THE 6 4 7 FREE MARKET ECONOMY 6 4 8...
  18. chrisyang

    使用ws4检索时的怪现象,大家碰到过吗?

    回复: 使用ws4检索时的怪现象,大家碰到过吗? 我按照LZ提供的数据从头做了一下,要得出“三词词簇24个,其中排在第一的三词词簇是FREEDOM DEMOCRACY AND,频率13”这个结论,Cluster功能中使用的必须是默认设置,即“Words in Cluster:3-3,Minimum Freq. 5, Horizons: 5L-5R”。可这儿有个问题:既然已经有确定的检索词,又确定了三词词簇,为什么要将计算时的语境跨距设定为5L-5R呢?我觉得将语境跨距设定为2L-2R,即以检索词为中心左右各两个词的范围才是正确的。
  19. chrisyang

    使用ws4检索时的怪现象,大家碰到过吗?

    回复: 使用ws4检索时的怪现象,大家碰到过吗? 个人认为,“三词词簇的频率与实际在语料库中检索到的频率不一”这个问题中最值得注意的倒不是“whole and free”(和“whole, and free”)频率的问题,而是词簇 “FREEDOM DEMOCRACY AND”频率为13的问题。因为“freedom, democracy, and”在原文中只出现了8次,而做出的三词词簇中其频率为13,这中间的差异实在是太大了。
  20. chrisyang

    使用ws4检索时的怪现象,大家碰到过吗?

    回复: 使用ws4检索时的怪现象,大家碰到过吗? 1. “重新在corpus3中检索FREEDOM DEMOCRACY AND却发现找不到记录。” 原文中显示的是“freedom, democracy, and”,中间有两个逗号,而你检索时把逗号给漏掉了,所以无法对应。 2. “三词词簇的频率与实际在语料库中检索到的频率不一。” 原因同第一个问题。原文中有12个“whole and free”,有1个“whole, and free”,你只检索了“whole and free”。
Back
顶部