李亮1975重庆
语料库快乐军政委
TXT全能转码器2013李亮版,是高速简洁小巧免费的文本小工具。选中某个txt文件,或选中某个文件夹(包括子文件夹),进行ANSI、UTF-8、Unicode、Unicode big endian之间的互相转换,适合语料库建设或掌上阅读器的专门编码需求。经过VirusTotal的42款杀毒引擎的分析而100%无毒。
http://ishare.iask.sina.com.cn/f/37028216.html (2013版的下载地址)
去年6月,曾经发布过2012版,但不支持子文件夹,有点遗憾,所以2013版弥补了。
http://www.corpus4u.org/forum/showpost.php?p=45867&postcount=10 (2012版的发帖)
2013版是用"快手编程(AAuto Quicker)"开发的,关键代码只是……
function change_it(path1){
var mycode="";
select(mainForm.listbox2.selText) {
case "ANSI" {
mycode=null;
}
case "UTF-8" {
mycode="UTF-8"
}
case "Unicode (little endian)" {
mycode="UTF-16LE"
}
case "Unicode big endian" {
mycode="UTF-16BE"
}
}
var txt=fsys.codepage.load(path1);
fsys.codepage.save(path1,txt,mycode);
win.util.tray.pop(path1,"已经转换……")
}
附件中有"2013版的完整的源代码"供有编程兴趣的朋友研习。
http://ishare.iask.sina.com.cn/f/36996407.html (AAuto Quicker快手下载)
文字编码是文本文件的字符的底层表达,如果理解不足则很容易让自己的TXT文件出现各种情形的乱码。英语文本中往往夹杂了少量的带有声调标志的法语单词或法语字母,如果你直接保存为默认的ANSI编码,它们就变成"?(英语问号)"了。要想让这样的乱码不出现,你就需要让你的文本文件是UTF-8或Unicode的编码,而我们在"桌面"点右键直接新建一个文本文件都是默认的ANSI编码,所以,需要"全能TXT转换器"进行针对一个文件夹及其子文件夹的批量处理。
如果你能系统总结英语中夹杂的法语的特殊字母(顶上有小帽子)的全套,你把它们都批量替换为没有帽子的对应的英语字母,那你也不需要批量转换文字编码了,这也是一个solution。
问:如何知道某个TXT文件是哪种编码呢?
答:你双击这个TXT文件,就会发现"记事本"打开了它在你面前,而你就点菜单"文件"的"另存为",在弹出的另存为对话框的下半部分,你看到"编码",它当前是ANSI的话就是当前文件是ANSI编码了,另外还有UTF-8,Unicode,Unicode big endian这三种。当你完成了转换之后,你就会发现在另存为对话框的"编码"变化了!
http://ishare.iask.sina.com.cn/f/37028216.html (2013版的下载地址)
去年6月,曾经发布过2012版,但不支持子文件夹,有点遗憾,所以2013版弥补了。
http://www.corpus4u.org/forum/showpost.php?p=45867&postcount=10 (2012版的发帖)
2013版是用"快手编程(AAuto Quicker)"开发的,关键代码只是……
function change_it(path1){
var mycode="";
select(mainForm.listbox2.selText) {
case "ANSI" {
mycode=null;
}
case "UTF-8" {
mycode="UTF-8"
}
case "Unicode (little endian)" {
mycode="UTF-16LE"
}
case "Unicode big endian" {
mycode="UTF-16BE"
}
}
var txt=fsys.codepage.load(path1);
fsys.codepage.save(path1,txt,mycode);
win.util.tray.pop(path1,"已经转换……")
}
附件中有"2013版的完整的源代码"供有编程兴趣的朋友研习。
http://ishare.iask.sina.com.cn/f/36996407.html (AAuto Quicker快手下载)
文字编码是文本文件的字符的底层表达,如果理解不足则很容易让自己的TXT文件出现各种情形的乱码。英语文本中往往夹杂了少量的带有声调标志的法语单词或法语字母,如果你直接保存为默认的ANSI编码,它们就变成"?(英语问号)"了。要想让这样的乱码不出现,你就需要让你的文本文件是UTF-8或Unicode的编码,而我们在"桌面"点右键直接新建一个文本文件都是默认的ANSI编码,所以,需要"全能TXT转换器"进行针对一个文件夹及其子文件夹的批量处理。
如果你能系统总结英语中夹杂的法语的特殊字母(顶上有小帽子)的全套,你把它们都批量替换为没有帽子的对应的英语字母,那你也不需要批量转换文字编码了,这也是一个solution。
问:如何知道某个TXT文件是哪种编码呢?
答:你双击这个TXT文件,就会发现"记事本"打开了它在你面前,而你就点菜单"文件"的"另存为",在弹出的另存为对话框的下半部分,你看到"编码",它当前是ANSI的话就是当前文件是ANSI编码了,另外还有UTF-8,Unicode,Unicode big endian这三种。当你完成了转换之后,你就会发现在另存为对话框的"编码"变化了!