我想请教两个WordSmith的问题,谢谢!

问题一:请问如何导入microsoft的excel文件,我导入后都是乱码;
问题二:对于如下的语料:

I am a student
He is a teacher

输入什么样的命令,可以让ws的wordlist指只找到两个条目,即:

1 I am a student
2 He is a teacher

而不是一般的结果,即7个条目,如下:

1 a
2 am
3 he
4 I
5 is
6 student
7 teacher

PS:为已经两次专业细致地为我讲解语料库知道的李博士拜个年!祝身体健康!生活愉快!
 
羊年大吉!

可以把excel文件另存为csv格式,这种格式是wordsmith支持的、可导入wordsmith的;
Excel从2007版开始是xlsx这种格式,估计旧版甚至新版的wordsmith也不能处理;
你的问题二的需求,似乎是希望把语料进行句子切分,把每个句子切分为一个段落?
wordlist功能是把单词作为最小单位的,哪有把一个句子当作单词来处理的;
 
回复: 我想请教两个WordSmith的问题,谢谢!

老师们好,我也有一个关于Wordsmith的问题!因为wordlist功能把文本中所有的单词都按照频率或者首字母排列出来,而我的研究只需要提取实词,而不提取功能词,请问,怎样操作能让wordlist function只显示content words呢?谢谢!
 
Back
顶部