搜寻结果

  1. W

    Python中文分句问题

    回复: Python中文分句问题 终于能运行了,感谢aarondeng、zhengyihzw、Haiyang等的帮助!提醒下,这段代码本身应该存为utf8的编码格式。 这段代码把中文段落分成了以下效果: se: 在 se: “ se: 开始 se: ” se: 选项卡上 se: , se: 通过从快速样式库中为所选文本选择一种外观 se: , se: 您可以方便地更改文档中所选文本的格式 se: 。 se: 您还可以使用 se: “ se: 开始 se: ” se: 选项卡上的其他控件来直接设置文本格式 se: 。 se: 大多数控件都允许您选择是使用当前主题外观 se: ,...
  2. W

    Python中文分句问题

    回复: Python中文分句问题 一直没试成功,把你运行成功的代码贴上来看看呢,谢谢!
  3. W

    Python中文分句问题

    回复: Python中文分句问题 谢谢zhengyihzw! 修改后,原来的错误没了,但出现如下错误: Traceback (most recent call last): File "C:\Python27\chn_cutter2.py", line 23, in <module> for line in l: TypeError: 'NoneType' object is not iterable 不知该在哪里加return返回什么值才能迭代?
  4. W

    “例不十,不立法”源出黎锦熙《新著国语文法》

    回复: “例不十,不立法”源出黎锦熙《新著国语文法》 上面只提供了一页。贴个《新著国语文法》全书下载链接,http://ishare.iask.sina.com.cn/f/5908533.html
  5. W

    论坛可以支持程序语言语法高亮了

    回复: 论坛可以支持程序语言语法高亮了 谢谢分享!五颜六色是好看,不过我的电脑会跳出窗口,"Can't find brush for: c"、"Can't find brush for: vb",按N多次确定才能关闭,例如:
  6. W

    如何实现语料的一对多平行对齐

    回复: 如何实现语料的一对多平行对齐 程博士开发的CUC ParaConc可以检索8译本对照,查看http://www.corpus4u.org/forum/showthread.php?t=8343&highlight=cuc+paraconc
  7. W

    Python中文分句问题

    回复: Python中文分句问题 如果把标点符号补回去的话,还是用editpad或word切分句子更直接、工作量更小些。
  8. W

    Python中文分句问题

    回复: Python中文分句问题 实现汉语句子大体切分倒不难,如editpad的正则表达式或录制宏、word的vba等。我不懂python,只是最近在看这类书籍;python的split可以基本实现句子切分,但切分后,句末的标点符号(如。?!)会丢失。
  9. W

    Python中文分句问题

    回复: Python中文分句问题 谢谢aarondeng!谢谢Haiyang! 改成findToken后还是“NameError: global name 'FindToken' is not defined ”,甚至改成find、findall等后还是提示类似错误。 find /findall应该是内置函数啊,不需要定义吧?! 只想对中文进行分句处理,以方便英汉对齐,不需要标注的,Stanford Parser好像不行。
  10. W

    Python中文分句问题

    回复: Python中文分句问题 尝试过import re/os/sys等,问题照旧,可能是Python2.7中已经没有FindTok函数,抑或是这段代码本身就有问题。
  11. W

    Python中文分句问题

    回复: Python中文分句问题 谢谢Haiyang,回老家过年了,刚看到回复,年后试后再给大家反馈。 祝广大C友蛇年快乐,身体健康,阖家幸福,万事如意!
  12. W

    Crown/CLOB语料库:2009年布朗家族语料库

    回复: Crown/CLOB语料库:2009年布朗家族语料库 谢谢许博士分享这么好的资源。
  13. W

    Python中文分句问题

    网上看见一段用Python写的中文分句代码,在Win XP、Python2.7中运行出错,提示“NameError: global name 'FindTok' is not defined ”,不知该如何修改,请教于大家! 另外,如果想处理某个文件夹下的全部文件该怎么修改? 谢谢! (“附件” 中的代码含有正确的缩进格式,为方便上传,特将“.py”后缀改成了“.txt”,改回至“.py”后缀可运行) 代码如下(此代码格式不正确,没有缩进): def Cut(cutlist, lines): l = [] line = [] for i in...
  14. W

    editpad pro 中文出现乱码 怎么办

    回复: editpad pro 中文出现乱码 怎么办 编码选择不对。 1. 如果只是临时更改编码,可按以下步骤: Convert--->text encoding,选“ENC-CN:Simplified Chinese(GB2312)”编码 ,参见fig-1; 2. 如果要设置系统默认编码,可这样设: Options--->Configure File Types--->Encoding:选“ENC-CN:Simplified Chinese(GB2312)”编码,参见fig-2。
  15. W

    关于CUC_Paraconc

    回复: 关于CUC_Paraconc 呵呵,强!期待……
  16. W

    IBM SPSS Statistics 20中文教程

    一、IBM SPSS Statistics 20中文教程在线: http://publib.boulder.ibm.com/infocenter/spssstat/v20r0m0/index.jsp?topic=%2Fcom.ibm.spss.statistics.coach%2Fstatcoach_main.htm 20 版本中的新增功能 地图。图形画板模板选择器现在包含用于创建不同类型的地图直观表示的模板,例如分区图(着色地图)、带有微型图表的地图和重叠地图等。IBM? SPSS? Statistics 附带了一些地图文件,但您可以使用地图转换实用程序来转换现有的地图...
  17. W

    请教大家,我到底是哪里出了问题???

    回复: 请教大家,我到底是哪里出了问题??? 我在antconc、editpad中测试没问题,估计你勾选的是“words”,勾选“Regex”应该就可以。
  18. W

    请教大家,我到底是哪里出了问题???

    回复: 请教大家,我到底是哪里出了问题??? 试试#\S+_VVZ\s#(不包括#号),注意表达式前后均不留空格。另,你是用什么软件进行检索?
  19. W

    求教正则表达式

    回复: 求教正则表达式 <.*?>|(TASK [0-9])?
  20. W

    孟庭苇《网上有些词做的云》:VBA之小试牛刀

    回复: 孟庭苇《网上有些词做的云》:VBA之小试牛刀 谢谢李亮1975重庆分享!
Back
顶部