前段时间有C友讨论了BNC的净化问题。
我在这个过程中遇到一个小小问题,求救各位老师。
我发现语料中有一些HTML标记,是以&开头;结尾的,如:
< 小于 <
> 大于 >
& &符号 &
" 引号 &equo;
—
&bquo;
£
%
…
–
•
©
½
é
á
ú
ñ
à
í
$
ü
ö
有些标记我从名称上看,能找出他的对应符号,但是有些却不能。
请求老师们的帮助。
我在这个过程中遇到一个小小问题,求救各位老师。
我发现语料中有一些HTML标记,是以&开头;结尾的,如:
< 小于 <
> 大于 >
& &符号 &
" 引号 &equo;
—
&bquo;
£
%
…
–
•
©
½
é
á
ú
ñ
à
í
$
ü
ö
有些标记我从名称上看,能找出他的对应符号,但是有些却不能。
请求老师们的帮助。