李亮1975重庆
语料库快乐军政委
《在线语料库:核心编程揭秘(PHP/ASP/NodeJS/Perl)》
在线语料库的核心编程包括前端编程和后端编程。
前端编程的最基本功能是2项:接收用户输入与发送用户输入。
后端编程的最基本功能是3项:接收用户输入、检索语料库、发送符合条件的语料段落。
前端编程至少要用HTML语言,也可以扩展使用Javascript、CSS、jQuery语言与SVG;
后端编程要根据网页服务器的现有条件来选择PHP或ASP或Perl或NodeJS;
后端编程往往涉及到数据库存取、压缩与解压、图像处理、媒体播放、网页抓取等等的后台扩展库的编程;
PHP可使用XML、ZIP、SQLite、cURL等扩展库;
ASP可使用MSXML、ADO、winHTTP等扩展库;
语料文件的最简单存储形式是txt格式,也可以是xml格式,也可以是sqlite格式等等,各有优劣;
前端编程的核心视觉:一个文本框供用户输入中英文词串,一个提交按钮供用户点击查询;
后端编程的核心流程:接收文本框的词或词串,读取语料文件,逐行搜索,发现一个段落就输出一个段落到前端;
主页文件:index.php或index.asp或index.js或index.pl (最好是utf-8的文字编码)
语料文件:corpus.txt (最好是utf-8的文字编码,单语或双语混合,可以每个自然段含有英汉对照两部分)
运行条件:本地架设http服务器、或上传源码文件到主页空间(PHP/ASP/Perl/NodeJS)、或本地运行NodeJS.exe
以下四段代码只是提供最基本的查询功能,如果要发展为一个界面美观且功能丰富且用户友好的在线语料查询与综合管理网站,则必须付出比下面代码几十倍到几百倍的辛勤编程研发的努力!
详细代码的在线全文阅读,在豆丁网……
http://www.docin.com/p-739178619.html
详细代码与本文的全文下载,在新浪爱问……
http://ishare.iask.sina.com.cn/f/64857071.html