求助:有关语料的扫描输入

问个小白问题,请教各位老师:想对语料进行扫描输入,扫描时有什么格式要求吗,可以转化成PDF(或WORD)的那种?复印店的机器应该可以做的吧,谢谢
 

oscar3

高级会员
回复: 求助:有关语料的扫描输入

问个小白问题,请教各位老师:想对语料进行扫描输入,扫描时有什么格式要求吗,可以转化成PDF(或WORD)的那种?复印店的机器应该可以做的吧,谢谢
看来是没有看过书的啊,扫描出来的格式一般有纯文本格式,也有word格式的,语料库一般要求纯文本格式的文本。
 
回复: 求助:有关语料的扫描输入

这种基本的问题好像在这个论坛里已经讨论过很多了,为什么不自己先找找看。

如果是扫描的话,不建议到复印店去扫描,因为那样你会花费不少钱,除非你愿意,如果你做大量文字录入还是自己去买台平板扫描仪吧,也就几百元,当然不用扫描仪也行,如果你有数码相机或者500万或者500万以上像素的手机,用手机拍摄然后用ABBYY Finereader 11.0 识别成文字。如果里面大量中文,建议采用汉王文本王软件去识别,如果里面大量英文,建议采用ABBYY Finereader, 如果是中英文混合,建议采用ABBYY Finereader, 如果上面有大量的笔记或者手写的内容,那还是用键盘敲吧,因为对于那些用笔在上面做过记录的书的识别效果会非常乱,估计你刚开始用,肯定遇到这种情况会疯掉。

如果用手机或者数码相机拍摄,建议采用微距拍摄,否则识别出来几乎肯定是一堆垃圾
 
回复: 求助:有关语料的扫描输入

可能之前只是按板块搜帖子,没看到相关内容。您的回复很详细,非常感谢!
 
顶部