【完全無料】畅选日语语料库全面免费开放!

本文由 沉睡的小青年2015-01-11 发表於 "多语种语料库" 讨论区

  1. 这是我自己研发的语料库,希望得到大家的指点。

    http://www.chooshine.com/corpus/index.html

    语料库简介:

    为更好地服务于广大的日语学习者,畅选网日语语料库完全無料开放!欢迎您使用,并热切期盼您对我们语料库提出意见和建议,让我们共同打造一个属于我们中国日语学界自己的日语语料库平台!

    畅选在线日语语料库,是我们自主研发的在线日语语料检索系统。供各大院校日语专业师生及广大日语爱好者使用。语料库致力于成为书面日本语的缩影,通过严谨的样本选取,获取准确的语料原始样本。样本的来源主要为书刊、报纸、文集、小说、国会记录、法律议案等官方网站或专门网站,通过本网站自主研发的网页搜索引擎软件,对目标网页进行自动分析及内容抓取,确保内容与原出处一致,可供用户在日语研究时参考使用。

    主要特色:
    (1)收录多达 33万篇,共计31.9亿 字海量名家名作、新闻、国会记录、法律议案及网络小说等原始语料样本。语料样本的数量和类型将不断追加,也可根据客户需求,定制特定语料库;
    (2)在线即时搜索,无需安装软件。使用方便简单,界面友好,上手迅速;
    (3)文学作品、新闻及会议记录等语料样本均来自于权威官方网站,语料完整准确;
    (4)与用户合作,根据用户要求,定制专属语料库,包括用户专属样本、特定的检索方式等,为用户进行语言学研究提供强大的技术支持。


    检索方式:
    支持多维度精确检索,如作者、作品名、作品年代等,具体如下:
    (1)主关键词: 其他检索条件均以主关键词为基准,即只有在样本中找到主关键词,其他条件才生效。支持假名、汉字、英文及符号;
    (2)活用形:紧跟主关键词的活用形,用于检索如动词活用形等语法样本;
    (3)副关键词: 在主关键词出现的前提下,可定义与主关键词之间的关系进行检索;
    (4)前后文脉字数: 以主关键词为基准,出现在该次前后的文脉字数。前后文脉最长字数各为150字;
    (5)语料库: 可选择不同的类型的语料样本库进行语料检索,如近代文学、会議記録及新聞ニュース。网站会不断增加各类型的语料库;
    (6)两词关系: 支持主关键词与副关键词之间的多种关系的筛选检索;
    (7)作者: 可通过选定作者,精确检索该作者的作品语料;
    (8)时间: 可按作品发布的年代区间,检索相关作品语料。

    语料规模:
    语料库样本收录 329099 篇,总计 3198568479(31.9亿) 字。
    【近代文庫】:收录 11792 篇,共计 165901623 字
    【古典文庫】:收录 37 篇,共计 8015245 字
    【国会会議録】:收录 48732 篇,共计 2090835880 字
    【法律議案】:收录 3348 篇,共计 50627333 字
    【ネット小説】:收录 194156 篇,共计 848516928 字
    【新聞ニュース】:收录 71034 篇,共计 34671470 字
    朝日新闻:收录 37115 篇,共计 16655064 字
    毎日新聞:收录 3563 篇,共计 2348083 字
    産経新聞:收录 15084 篇,共计 6291347 字
    日本経済新聞:收录 5766 篇,共计 2566910 字
    読売新聞:收录 9506 篇,共计 6810066 字

    31亿字的日语语料库等你来!注册后即可完全免费使用!
    立即访问>> http://www.chooshine.com/corpus/index.html

    热切希望能够得到各位专家的指点。
    18658190803 (周一至周日 9:00~24:00)