请教 ICE 检索

请问哪位对 ICE 语料库比较熟悉。它是做了句法标注的, 能用 Antconc 或者 Wordsmith 一类的工具检索吗? 例如, 想要检索 it is adj. that 这样的结构怎么做?

还有, 不久前看到香港城市大学的 Alex Fang 用一个软件可以逐层折叠和展开下面这个从 ICE 中复制来的句子, 不知有谁知道是什么软件。

多谢。

PU CL(intr,pres)
SU NP()
NPHD PRON(pers,sing) {I}
VB VP(intr,pres,prog)
OP AUX(prog,pres) {am}
MVB V(intr,ingp) {writing}
A CL(depend,zsub,montr,infin,-su)
TO PRTCL(to) {to}
VB VP(montr,infin)
MVB V(montr,infin) {invite}
OD NP()
NPHD PRON(pers) {you}
A PP()
P PREP(ge) {to}
PC NP()
DT DTP()
DTCE ART(indef) {a}
NPPR AJP(attru)
AJHD ADJ(ge) {formal}
NPHD N(com,sing) {dinner}
NPPO CL(depend,zrel,intr,pass,edp,-su)
TO PRTCL(to) {to}
VB VP(montr,infin,pass)
OP AUX(pass,infin) {be}
MVB V(cxtr,edp) {held}
A PP()
P PREP(ge) {at}
PC NP()
DT DTP()
DTCE ART(def) {the}
NPHD N(prop,sing) {Grosvenor Hotel}
PUNC PUNC {,}
NPPO NP()
NPHD N(prop,sing) {London}
PUNC PUNC {,}
A PP()
P PREP(ge) {on}
PC NP(appos)
DEFUNC NP(appos)
NPHD N(prop,sing) {Saturday}
DEFUNC NP(appos)
DT DTP()
DTCE ART(def) {the}
NPHD NUM(ord) {14th}
NPPO NP()
NPHD N(prop,sing) {September}
PUNC PUNC {,}
NPPO NP()
NPHD NUM(card,sing) {1991}
PUNC PUNC(per) {.}
 
回复: 请教 ICE 检索

大家都不知道你是在哪里看到的,更加难以知道方博士用的什么软件啦。

ICE并不是每个库都做了标注和句法标注。

至于软件,我猜我猜我猜猜猜:会不会是专门检索ICE-UK的软件ICE-UP呢?
 
回复: 请教 ICE 检索

谢谢。也就是说, 一般的软件是不能检索这种做了句法标注的文本了。

关于方博士用的软件, 抱歉我没说明白, 我是想问问有什么软件可以逐层折叠和展开这种句法结构, 不是问方博士用的什么软件。

原来的结构可以看到层级的, 复制到这里就都顶格了, 从 {} 中可以看出这是一个句子的结构图。


大家都不知道你是在哪里看到的,更加难以知道方博士用的什么软件啦。

ICE并不是每个库都做了标注和句法标注。

至于软件,我猜我猜我猜猜猜:会不会是专门检索ICE-UK的软件ICE-UP呢?
 
回复: 请教 ICE 检索

谢谢!

他那天用的是 Windows 系统, 而且那个软件可以使句子的各级结构逐层展开, 是动态的那种, 不只是静态的直观展示。

我当时坐得比较靠后, 没能看清楚是什么软件。可能是他们专用的, 因为方博士开发了一些用于 ICE 的软件。

感觉这个工具可以在不同层次上比较清楚地分析句子的构成。

不过我们也许只能找到 linux 下用的吧。


软件好像有很多啦:http://en.wikipedia.org/wiki/Treebank

不过有些只能在linux下运行吧。
 
回复: 请教 ICE 检索

从楼主所提供的信息, Dr. Fang 所用的可能是The British Component of The International Corpus of English (ICE-GB), it is Bundled with the latest ICECUP software. ICE-GB is fully grammatically analysed, so you can use the specially designed ICECUP to perform three types of grammatical queries: single node queries, text fragments and fuzzy tree fragments(FTFs).

想了解该语料库相关信息请参见:
ICE-GB
http://www.ucl.ac.uk/english-usage/resources/sales.htm

http://www.ucl.ac.uk/english-usage/projects/ice-gb/index.htm

ICE
http://ice-corpora.net/ice/index.htm


You can download the software with sample corpora from here:
http://www.ucl.ac.uk/english-usage/projects/ice-gb/beta/index.htm
 
回复: 请教 ICE 检索

ICE-GB好像只能用专用的ICECUP工具检索,当然转换成TXT文件的ICE-GB文件是可以用Antconc 或者 Wordsmith 一类的工具检索的,但它已失去了它的亮点, 和其它ICE库无异.
 
回复: 请教 ICE 检索

谢谢!

应该是这个吧。等下了用用试试。

从楼主所提供的信息, Dr. Fang 所用的可能是The British Component of The International Corpus of English (ICE-GB), it is Bundled with the latest ICECUP software. ICE-GB is fully grammatically analysed, so you can use the specially designed ICECUP to perform three types of grammatical queries: single node queries, text fragments and fuzzy tree fragments(FTFs).

想了解该语料库相关信息请参见:
ICE-GB
http://www.ucl.ac.uk/english-usage/resources/sales.htm

http://www.ucl.ac.uk/english-usage/projects/ice-gb/index.htm

ICE
http://ice-corpora.net/ice/index.htm


You can download the software with sample corpora from here:
http://www.ucl.ac.uk/english-usage/projects/ice-gb/beta/index.htm
 
回复: 请教 ICE 检索

这个篇文章不知道对你有没有帮助。
 

附件

  • 国际英语语料库英国英语分库解析.pdf
    160.4 KB · 浏览: 63
回复: 请教 ICE 检索

那天方博士演示 ICE 检索时, 使用的是几个 Unix 命令, 主要是检索文本的句法特征。只是在呈现句子的树状图的时候才用了一个图形界面的工具。

其实如果不一定查看句子树形图的话, 用别的方法也可以检索 ICE 预料库的, 毕竟 ICECUP 是要花钱的。一个就是使用一些诸如 GREP 之类的命令; 另一种方法是使用几个 Unix 命令把树状结构改成线性结构之后, 用 Antconc 检索。而且好的一点是, 转换过程中可以保留原有的句法标注, 所以仍可以从句法上进行分析检索的结果。下面就是把一个句子从树状结构转换过来之后的样子:

PU CL(intr,pres) SU NP() NPHD PRON(pers,sing) {I} VB VP(intr,pres,prog) OP AUX(prog,pres) {am} MVB V(intr,ingp) {writing} A CL(depend,zsub,montr,infin,-su) TO PRTCL(to) {to} VB VP(montr,infin) MVB V(montr,infin) {invite} OD NP() NPHD PRON(pers) {you} A PP() P PREP(ge) {to} PC NP() DT DTP() DTCE ART(indef) {a} NPPR AJP(attru) AJHD ADJ(ge) {formal} NPHD N(com,sing) {dinner} NPPO CL(depend,zrel,intr,pass,edp,-su) TO PRTCL(to) {to} VB VP(montr,infin,pass) OP AUX(pass,infin) {be} MVB V(cxtr,edp) {held} A PP() P PREP(ge) {at} PC NP() DT DTP() DTCE ART(def) {the} NPHD N(prop,sing) {Grosvenor Hotel} PUNC PUNC {,} NPPO NP() NPHD N(prop,sing) {London} PUNC PUNC {,} A PP() P PREP(ge) {on} PC NP(appos) DEFUNC NP(appos) NPHD N(prop,sing) {Saturday} DEFUNC NP(appos) DT DTP() DTCE ART(def) {the} NPHD NUM(ord) {14th} NPPO NP() NPHD N(prop,sing) {September} PUNC PUNC {,} NPPO NP() NPHD NUM(card,sing) {1991} PUNC PUNC(per) {.}


ICE-GB好像只能用专用的ICECUP工具检索,当然转换成TXT文件的ICE-GB文件是可以用Antconc 或者 Wordsmith 一类的工具检索的,但它已失去了它的亮点, 和其它ICE库无异.
 
回复: 请教 ICE 检索

呵呵,楼主是位高手! 的确是个好方法,省钱! 但俺不懂unix命令.

ICE-GB语料库是收费的的, ICECUP可以免费下到的的,从网上下载的demo版的ICECUP和正式版的功能是完全一样的, 只是里面含的语料是很小的sample. 如果你有正版的ICE-GB语料库也应该有相配套的软件的(或者有朋友愿意与你分享语料的话,我相信他也会把软件给你的).
 
回复: 请教 ICE 检索

您的谬赞让我汗颜。我其实也不知到 Unix 究竟是什么样, 只是在方博士的课上学了几个命令而已, 想要拿它来做事几乎是不可能的, 而且用这些命令能做到的, 现在都有软件可以做得更好更容易。只不过觉得用命令好玩而已。

您是真的行家, 对语料库和工具都很了解, 而且一下子就说到问题上。的确, 只要有了 ICE 语料库就行了, 检索工具是免费的。

呵呵,楼主是位高手! 的确是个好方法,省钱! 但俺不懂unix命令.

ICE-GB语料库是收费的的, ICECUP可以免费下到的的,从网上下载的demo版的ICECUP和正式版的功能是完全一样的, 只是里面含的语料是很小的sample. 如果你有正版的ICE-GB语料库也应该有相配套的软件的(或者有朋友愿意与你分享语料的话,我相信他也会把软件给你的).
 
Back
顶部