TextPro的添加汉字间空格问题

xujiajin

管理员
Staff member
多谢oscar3将TextPro与大家分享。
不过您所提到的增加空格并不是我们所谓的分词(word segmentation),而是分字(character segmentation),即在每个汉字和标点符号后面加一个white space(见转换menu下的增加空格功能)。这样的问题时我们在检索加过空格的时使用检索词也必须在字之间加空格才可以。比如要检索“语料库”,则必须敲入“语 料 库”。

不过,反过来一想,我们要想得到一个字频表(character list)而不是(word list),textpro倒是还真有用。
 
Textpro只是一个文本处理软件。要分词肯定不能用这个软件,不过如果不具备分词技术,这个软件可以凑合着用。比如谢家成的英汉双语平行语料库汉语部分就没有分词而是用加空格的办法处理的。呵呵,我只是个门外汉。
 
不过真的很谢谢你。只是你又提到一个新的语料库信息而没有告诉我们它长得什么样?如何获得?等等。

谢家成的英汉双语平行语料库汉语部分
 
谢家成的英汉平行语料库在他的文章《小型英汉平行语料库的建设与运行》(解放军外国语学院学报2004年第3期)中专门有介绍,另外,他还用他的语料库研究过汉语“一......就......”的英语对应翻译(《“一.......就”的翻译》,中国科技翻译2004年第2期)。在别的场合到是没有见过这个语料库,看来是一个个人建设的语料库,not accessible to the public.
两篇相关的文章附上http://forum.corpus4u.org/upload/forum/2005072516181236.pdf
http://forum.corpus4u.org/upload/forum/2005072516182297.pdf


我好笨,要通过编辑才找到上传文件的途径


[本贴已被 作者 于 2005年07月25日 16时19分18秒 编辑过]
 
回复:TextPro的添加汉字间空格问题

选择回复,就可以上传文件了。
 
对了,记得hancunxin网友上次提醒过大家,这里想再赘述一下。

分词工具处理后,可能会将“中国”和“共产党”分成两个词,因此如果搜不到“中国共产党”的话,我们需要搜“中国[空格]共产党”。
同理,如果按照textpro在每个字后加空格的话,我们在做concordancing的时候要主要检查一下空格的有无。
 
回复:TextPro的添加汉字间空格问题

谢家成的英汉平行语料库在他的文章《小型英汉平行语料库的建设与运行》(解放军外国语学院学报2004年第3期)中专门有介绍,另外,他还用他的语料库研究过汉语“一......就......”的英语对应翻译(《“一.......就”的翻译》,中国科技翻译2004年第2期)。在别的场合到是没有见过这个语料库,看来是一个个人建设的语料库,not accessible to the public.
两篇相关的文章附上
[ 点击下载 ]
http://www.corpus4u.com/upload/forum/2005072516181236.pdf [ 点击下载 ] http://www.corpus4u.com/upload/forum/2005072516182297.pdf


You can find his adress in the above quoted papers.

[本贴已被 作者 于 2005年07月27日 15时44分23秒 编辑过]

[本贴已被 作者 于 2005年07月27日 16时09分25秒 编辑过]
 
回复:TextPro的添加汉字间空格问题

以下是引用 hancunxin2005-7-27 15:11:03 的发言:
是湖北荆州的谢家成老师吗? 可有他的联系方式?

this is his email address: xxxxxx@163.com

just now i wrote an email to him and invite him to come our BBS. But i am not sure if he can receive my email.

[本贴已被 xiaoz 于 2005年07月27日 19时40分35秒 编辑过]
 
you're welcome!
as i know, Xie Jiacheng has already been a member of our BBS.

[本贴已被 xiaoz 于 2005年07月27日 19时39分39秒 编辑过]
 
Sorry, guys. I have to edit your postings that disclose the privacy of other people - in case you have not got their permission fo this.
 
i am sorry for this Dr.xiao and also sorry for Mr. Xie, please forgive me, and i have no evil ideas of disclosing your personal information, coz Mr. Han wants to communicate with you.
 
回复:TextPro的添加汉字间空格问题

专用软件当然好,但Word 的功能确实强大:“查找与替换”(高级)功能加空格,非常方便。
 
回复:TextPro的添加汉字间空格问题

以下是引用 xusun5752005-7-30 19:30:02 的发言:
专用软件当然好,但Word 的功能确实强大:“查找与替换”(高级)功能加空格,非常方便。

你是指用“查找与替换”(高级),用通配符在所有的字符后都加空格吗?Or ...?
 
Back
顶部