Xing Fukun的最近内容

  1. X

    如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载)

    回复: 如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载) 这个批评蛮严厉的,接受! (1)发现问题所在才有解决的思路和动力,这是科学前行的前提; (2)利用语言模型解决词长、句长的一些局限性的建议我已经提出,但这种方法也有局限,还要继续反思完善,但可以解决一些目前没解决的问题; (3)学术的纯粹的批评非常有利于学术发展,能破能立最好了!
  2. X

    如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载)

    回复: 如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载) 任何事情都是向着真理的逼近,你不可能到达真理,但你要尽可能离他越来越近。概率的问题同样是这个道理,为什么不找到更好的概率逼近呢,为什么不让自己的模型更有广泛性呢?这些问题都不是简单地用“不存在完全精确的东西”而可以躲避的事情。
  3. X

    如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载)

    回复: 如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载) 有一个思考,拿来跟大家讨论,在我做了100多个特征的测试之后,我突然觉得未必越复杂的算法越能得出好的结果。这似乎告诉我们,在实际中,根据不同目的,我们很可能不必舍近求远,非要经过很复杂运算,去分析文章难度。换句话说,文章难度是个既难又简单的问题。往往一些核心特征就足以判定文章难易了。...
  4. X

    如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载)

    回复: 如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载) Reading ease只是判断文本难易度的粗略标准,不要寄希望它做终极判断。 (1)既然要让机器判断当然越与实际符合越好了,否则就没有必要弄出上百个公式来,看来大家还是希望自动测量的结果更精确些。当然机器做完,还是给人用,需要人的鉴别筛选,就像搜索引擎返回大量结果,我们还是要继续再挑,不过我们希望机器返回的结果越符合我们的预期越好。...
  5. X

    如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载)

    回复: 如何解读Readability Analyzer中的数据(有Readability_Analyzer_Readme下载) 这个问题很有意思,文本易读性的测量已经不是通过词长、句长这些表面因素就可以完成的了,一些讨论者已经提到。 如何准确测量词、短语的难易程度(the与ski的长度一样,但难度肯定不同)、词语顺序对语句理解的影响(A cat sat on a mat与Mat a cat on sat...
  6. X

    Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答

    回复: Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答 "我觉得就汉语而言,目前较为通行的做法是“词无定类,类有定职”。" 这个观点我实在不敢苟同,当下大多数标注器(包括你提到的中科院的标注器)使用的都是北大的词类体系,这个体系遵循的“词类多功能”的原则,即同一个句法位置上可以出现多个词类,因此 去 是 可以 的 。 此句中“去”仍然是动词,标为v,而非活用为名词或vn 坚持 (v, 述) 改革 (vn, 宾) 促进 (v, 述) 持续 (adj) 发展 (n) (宾)...
  7. X

    Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答

    回复: Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答 标注器(tagger)是机器在模仿人的思想和行为去工作,它的标注过程其实就是一个拟合人的标注过程,因此标注器标的结果不足以说明任何问题,因此我们才需要从人的认识角度深入探讨词类问题,以便机器能更好地向人学习。 事实上,汉语词类在做的工作就是在“词无定类,类有定职”与“词有定类,类无定职”之间的抉择,无论哪种选择都难以解决汉语词类问题的困惑。其原因何在?此外,汉语的词类知识到底能为汉语教学和信息处理做多大贡献,英语知道句子中每个词的词性后可以基本顺利的parse出句法结构,而汉语行吗? 坚持/v...
  8. X

    Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答

    回复: Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答 以“活用”来解释汉语的词类似乎说服力不强,会导致“词无定类”,这已经被很多学者论述。且“活用”有一个前提假设,即“装帧”这类所谓被“活用”的词存在一个先于活用的类,但这个先验的类是如何确定的呢? 此外,汉语中词类与句法位置没有一一对应关系,主语位置上的词不一定就是名词或是被活用为名词。如: 去 是可以的。 不去 也是可以的。 “去”“不去”也被活用了吗? 再一个例句: 这本书 出版 及时,且价格便宜 “出版”活用了吗?
  9. X

    Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答

    回复: Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答 这本书 装帧 精美,但价钱便宜 这本书 编辑 细致,但价钱便宜 这本书 论述 严谨,但价钱便宜
  10. X

    Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答

    回复: Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答 感谢xusun575,推荐的汉语语法书我会去找来参考。 但如果单纯看“一件 包装 精美 的 礼品”这个短语,从汉语母语者的理解看,我们可以有两种理解: (1)礼品的外包装精美。如果如此理解“包装”此处应标为名词,与“精美”形成“主谓结构”; (2)礼品被“包装”得精美。如果如此理解,“包装”此处应标为动词,与“精美”形成“述补结构”。 无论哪种词性和结构,“包装 精美 的”都作为“礼品”的修饰语。...
  11. X

    Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答

    回复: Mike Scott在Corpora List上关于名词修饰语POS标注问题的回答 多谢许老师将词性讨论的邮件放到这里与大家共享。我很希望能够看到国内的同仁关于英语词类问题的见解,更希望能够看到英语与汉语比较中得到的英汉语词类特点。还是讨论中的例子: 一件 包装 精美 的 礼品 作为一名汉语母语者,我们应该如何分析这句话中的“包装”词性,是名词还是动词,为什么,以及如何确定语句结构,进而如何确定语句意义?这里的问题似乎与church tower 和 tall tower 还有不同。 希望各位老师同仁给予赐教!
Back
顶部