jerrycheny
初级会员
下载了很多文学作品,但是都是PDF,而且转换成TXT的时候都乱码,求教高手有什么解决办法吗?谢谢!
中文还是英文?若是英文,可以试用专门的软件转换.以下是引用 jerrycheny 在 2006-7-10 15:00:19 的发言:
下载了很多文学作品,但是都是PDF,而且转换成TXT的时候都乱码,求教高手有什么解决办法吗?谢谢!
以下是引用 jackie 在 2006-7-11 22:08:16 的发言:
遇到过类似的事,当时采取的方法是2楼和4楼的综合,因为有的文章在pdf中不能复制但可在caj中进行。不过有些文章采用这两种方法都不行,我只好放弃。另外,变成txt后,要手动进行修正,主要是换行时的标点符号错误和单词内多余空格的问题。good luck
xu老师已经告诉我们怎么去空格,请问怎么去多余的空行?我一般是一个一个删掉的。应该有什么见到的办法吧?谢谢!以下是引用 armstrong 在 2006-7-12 18:48:46 的发言:
分三步进行:
1.用Cajview打开此文件,然后另存为.txt文件。
2.将.txt文件复制到Word.
3.用其中替换功能分两次进行,第一次去掉字间的空格,第二次去掉多余的空行。
我用xu老师的办法去空格"^? "替换为"^&",但是还是不能去除空格,字与字之间还是有一个空格,是不是我哪里设置有问题?还是我太笨了以下是引用 armstrong 在 2006-7-13 9:07:14 的发言:
在查找栏中输入^P^P
在替换栏中输入^P
然后进行替换,多进行几次,直至所有的多余的空行没有为止。