antconc和wordsmith计算的频次不一样???

lyytt

小宝出山
我发现一个怪想象,一篇只有5000多字的小说,
我用antconc,查找出第一人称代词“I”出现频次为101次,
我用wordsmith,查找出第一人称代词"I"出现频次为79次,,
都是看wordlist中的频次,,,:mad::mad::mad:
晕死了!!!!
you也是如此,频次统计不同,当时想是不是因为“case”的原因,可是换了"I"也是得到不同的结果啊?

倒低怎么回事啊?
老洪快点帮忙解决啊?
 
回复: antconc和wordsmith计算的频次不一样???

既然这位指定laohong来回答,不回答有点对不住观众。很简单,把你的文本贴上来让大伙儿也见识一哈。
 
回复: antconc和wordsmith计算的频次不一样???

Different default setings for defining "word" - does a word allow the sepcial character ' as in I'm or you're?
 
回复: antconc和wordsmith计算的频次不一样???

谢谢老洪,谢谢xiaoz

http://www.americanliterature.com/Wolff/SS/HuntersintheSnow.html
文本在这里,
antconc提取词频表时,区分了大小写的;
wordsmith没有区分大小写,
wordsmith的词表: antconc的词表
word Freq.
1 THE 355 the 306
2 AND 179 and 176
3 FRANK 119 Frank 121
4. TO 115 Tub 117
5. HE 112 to 115
6. TUB 111 I 101
7 SAID 98 said 101
8 HIS 98 his 92
9 A 94 a 86
10 YOU 93 Kenny 82

我知道大小写(是否case-sensitive)会导致结果的不同,但是为什么连名字出现的频次都不一样啊?名字首字母都是大写啊?
不解啊
 
回复: antconc和wordsmith计算的频次不一样???

我不管如同XIAOZ博士所说的“
Different default setings for defining "word"
会不会影响到我的研究结果呢?

我乃菜鸟,问的菜问题!汗言一个
 
回复: antconc和wordsmith计算的频次不一样???

两个应该没有什么区别,只是设置要搞好。由于WordSmith默认把apostropher算作词中一部分,即把I'm当一个词计算,而AntConc当两个计算(个人认为更合理!),因此对比时应该把settings先搞好。图一是我的结果,你对比一哈,左边是WordSmith的结果,右边是AntConc的,词频没什么区别吧?
图二WordSmith里的鼠标所指的那个apostropher应该去掉,存下settings再进行计算。
最后一图,AntConc里也应该把Treat all data as lower case选上。
 

附件

  • 2009-7-23 10-58-50.jpg
    2009-7-23 10-58-50.jpg
    65.2 KB · 浏览: 17
  • 2009-7-23 11-00-37.jpg
    2009-7-23 11-00-37.jpg
    97.6 KB · 浏览: 21
  • 2009-7-23 11-01-17.jpg
    2009-7-23 11-01-17.jpg
    54.5 KB · 浏览: 13
回复: antconc和wordsmith计算的频次不一样???

实在是万分感谢!!!!!!!!!!!
太谢谢了!
太谢谢了!
 
Back
顶部