搜寻结果

  1. laohong

    《京华烟云》的中译本

    回复: 《京华烟云》的中译本 本坛曾经讨论过,你搜搜吧。
  2. laohong

    有没有语料库能满足如下检索要求?

    回复: 有没有语料库能满足如下检索要求? Xiaoz推荐Xaira有些道理,Xaira里的Query Builder是可以做到这样的检索,但是也有几个问题。一是Xaria处理语料时非常buggy,要求用户要有很大的耐心和自己解决问题的能力;二是Query Builder对大多数人来说用起来不易,就我了解,这里除了肖博士和我本人之外似乎还没有人常用到它;三是Xaira索引好的、公开免费使用的语料库还是很少的, 汉语的除了LCMC和UCLAWC外,似乎没有别的了。...
  3. laohong

    当代汉语翻译小说语料库(CCTFC)怎么用啊

    回复: 当代汉语翻译小说语料库(CCTFC)怎么用啊 老汉年纪大了,内存不够用,脑子不灵光,看不懂在说什么。不明白为什么在做米饭时,发现米不好,就要坐时光列车返回田里去给没长好的稻谷再施点肥。这个想法很了不起,可以随意来回跨越几个不同阶段和时段。也许,这位朋友先搞出个这样的检索引擎给大家示范一下,说服力就够强了。
  4. laohong

    当代汉语翻译小说语料库(CCTFC)怎么用啊

    回复: 当代汉语翻译小说语料库(CCTFC)怎么用啊 说的有些道理,但是你并没看懂我在说什么。如果把“牛皮”分词成了“牛_adj” “皮_n”,然后存入了数据库里。用户要求检索“牛皮_n”,你非要在检索过程中自作主张给人家把“牛_adj” “皮_n”合并成“牛皮_n”输出来,你不觉得这个检索器管的也太多了吧?要多大的智能运算能力啊?这是带词性的检索,不是google里的简单字符匹配而已。楼下也给了一些标错的例子,再思考一下,一股脑的把“好” “象”合并成“好象”就对了吗?人家说的是“这是一头好象,其它都生病了。”
  5. laohong

    当代汉语翻译小说语料库(CCTFC)怎么用啊

    回复: 当代汉语翻译小说语料库(CCTFC)怎么用啊 检索时提取的是已经储存在数据库里的分词结果,所以检索本身只是提取,并不是去给分词再加工。搜索好坏得看是不是能迅速准确地拿到数据库里的东东,分词阶段的错误怎么能怪检索本身呢?
  6. laohong

    pos-tagger的问题 Obsession!!!

    回复: pos-tagger的问题 Obsession!!! 阅读一下帮助文件,再自己亲自动手试试就很容易做到。
  7. laohong

    wordsmith 能不能查某一个词的多个词性的frequency啊

    回复: wordsmith 能不能查某一个词的多个词性的frequency啊 最好你自己先尝试之后再提问。如果自己没法得的结果,应该说清楚自己是用什么做的,怎么做的,得到了什么错误信息等。 建议你贴几个例句,也好方便大家帮你。
  8. laohong

    基于赋码语料的as不同词性检索

    回复: Killing me ,help!!! 1. Please mind you language and font settings when posting a message here; 2. You need specify which corpus you are using and what tools you used for the query, otherwise nobody can help you.
  9. laohong

    当代汉语翻译小说语料库(CCTFC)怎么用啊

    回复: 当代汉语翻译小说语料库(CCTFC)怎么用啊 谢谢!界面确实是参考了Mark Davis的。其实2008年3月在他办公室时,就问到能否使用他的engine,他当然不同意,回来后就开始着手开发我们自己的。不过他的一个建议非常管用,那就是“不要照书本上教的去做!”。 汉语分词的准确率很令人失望,但是这只是影响语料库的字词词性,和搜索engine的功能好坏无关。至于排序的方法,搜索一个词,排一下序就能看出来了。
  10. laohong

    [GOOD NEWS] MMAX Annotation Tool now FREE

    回复: [GOOD NEWS] MMAX Annotation Tool now FREE 不仅仅是由于出了钱。其实在决定出钱买的时候已经用了好长时间的免费试用版,而且和开发者常有通讯。决定花钱买以及后面的推广使用都是因为它确实很好。Standoff是其中的一个因素,其它方面,套用本山大叔的蚁力神的广告词“用了都说好!”。
  11. laohong

    请问国内或者网上有带声音文件的英语母语口语语料库吗?

    回复: 请问国内或者网上有带声音文件的英语母语口语语料库吗? 我这里打开没问题。你在国内吧?估计被党和政府给和谐了吧。
  12. laohong

    国内外比较有影响力的语料库有哪些?

    回复: 国内外比较有影响力的语料库有哪些? 这类问题没法回答,因为总得有个靶子来对比吧、得有个尺子来量吧?如不能简单问张三影响力大不大,而应该是张三和李四在某方面谁的影响力大。
  13. laohong

    万分急迫!求教如何在CLEC和BNC(XML版本)中检索and作为话语标记语的频率

    回复: 万分急迫!求教如何在CLEC和BNC(XML版本)中检索and作为话语标记语的频率 BNC只是做了词性标注而已。
  14. laohong

    万分急迫!求教如何在CLEC和BNC(XML版本)中检索and作为话语标记语的频率

    回复: 万分急迫!求教如何在CLEC和BNC(XML版本)中检索and作为话语标记语的频率 时间永远都是紧的。 没有标注话语标记语,就别指望有捷径。Concordance出来后,一个一个肉眼识别吧。
  15. laohong

    当代汉语翻译小说语料库(CCTFC)怎么用啊

    回复: 当代汉语翻译小说语料库(CCTFC)怎么用啊 顶一下,好多人没看到这个库的优点。
  16. laohong

    有没有语料库能满足如下检索要求?

    回复: 有没有语料库能满足如下检索要求? 你需要支持检索词性的语料库。不过,““目标”前有动词出现”,请问多前多远? 用“[v*] 目标”在“当代汉语翻译小说语料库”可以检索到“目标”前一个词为动词的结构: 瞄准 目标 2 无 目标 2 有 目标 1 失去 目标 1 缩小 目标 1 打中 目标 1 偏离 目标 1 到 目标 1 奋斗 目标 1 (注意有些是分词和词性标注错误) “[v*] * 目标”可以检索到“目标”前第二个词是动词的结构: 追求 的 目标 2 漫 无 目标 2 达 到 目标 1 瞄准 了 目标 1 能 打中 目标 1 没有 什么...
  17. laohong

    请问国内或者网上有带声音文件的英语母语口语语料库吗?

    回复: 请问国内或者网上有带声音文件的英语母语口语语料库吗? For your purpose, VOA or BBC audios with the transcripts are better. VOA Special English is also good.
  18. laohong

    请问国内或者网上有带声音文件的英语母语口语语料库吗?

    回复: 请问国内或者网上有带声音文件的英语母语口语语料库吗? The Buckeye Speech Corpus Go here for instructions on how to obtain a copy of the corpus. The Buckeye Corpus of conversational speech contains high-quality recordings from 40 speakers in Columbus OH conversing freely with an interviewer. The speech has...
  19. laohong

    请问国内或者网上有带声音文件的英语母语口语语料库吗?

    回复: 请问国内或者网上有带声音文件的英语母语口语语料库吗? 要母语,最好买ICE-GB带语音的。
  20. laohong

    请问有没有这样的软件?

    回复: 请问有没有这样的软件? 你要找的是natural language generation研究开发的工具,有很多人在做这方面的研究。在股沟里搜搜吧。 Natural Language Generation is a subfield of Computational Linguistics and language-oriented Artificial Intelligence research devoted to studying and simulating the production of written or spoken discourse. The...
Back
顶部