kontradikt的最近内容

  1. K

    紧急求助:研究关键字在文本集中的重要性,究竟是用简单频数,还是用TF-IDF权重?

    回复: 紧急求助:研究关键字在文本集中的重要性,究竟是用简单频数,还是用TF-IDF权重? 那比方说,我计算出关键词ABC在文本集1中的TF-IDF权重是0.0015,在文本集2中是0.0020,那可以说关键词ABC在文本集2中的重要性比在文本集1中的要高吗?
  2. K

    紧急求助:研究关键字在文本集中的重要性,究竟是用简单频数,还是用TF-IDF权重?

    现在有10个文本集,这10个文本集收集了10年间某领域的所有文章,每年的文章放在一个文本集中。每个文本集有两百篇左右的文章。 我想研究的是:某个概念在这十年间,在这个领域中的重要性是如何变化的。我首先统计了这个词在每个文本集中的简单频数(关键字出现次数/总字数),发现频数在10年间呈明显下降趋势。但我计算了一下这个词在每个文本集中的TF-IDF权重之后,发现,TF-IDF权重在10年间基本保持一致水平。...
Back
顶部