亂碼大全(10)──中文HTML與MSIE(第二版)
“亂碼大全”,作者:bluesea,水木清華 BBS 成員。歡迎在 BBS 中轉載,幫助計算機初學者解決使用軟件過程中遇到的實際問題。本文原載于水木清華 BBS 的 Internet討論區(qū)。地址是: telnet://bbs.tsinghua.edu.cn ,WWW訪問的地址是 http://bbs.tsinghua.edu.cn 。當下面的條件全部滿足時,轉載本文可以不經過作者允許:(1) 轉載水木清華 BBS 的信頭;(2)不修改原文;(3) 轉載僅限于各種 BBS 和非商業(yè)性質的個人網點。嚴禁各種形式的抄襲,嚴禁非作者將 本文或局部用于任何正式出版的刊物。請所有轉載文章的網友注意閱讀本文的第一段,遵守網絡的慣例、尊重作者的勞動。本自然段是全文的一部分。
二、所有的漢字都是不可辨認的亂碼,有點像在英文環(huán)境下閱讀中文時沒有啟動中文環(huán)境似的。這種問題都出現(xiàn)在中文 Internet Explorer 中,造成這個現(xiàn)象的具體原因有兩種情況,我們先說第一種。因為無法用 GB 漢字來表達那些亂碼,下面就給出這樣的例子,一個能夠產生亂碼的 HTML 文件。
<HTML>
<BODY>
¡°ÂÒÂë´
óÈ«¡±£¬×÷Õ
ߣºbluesea£¬Ë®Ä¾Ç
廪BBS³ÉÔ±¡£
</BODY>
</HTML>
看這個(類)文件會導致漢字無法識別的條件是使用的是中文 Windows 和中文 Internet Explorer,呵呵,很多人因此罵 Microsoft 弱智。實際上這是 HTML 中用于規(guī)范表示歐洲字符的方法。 這些字符在 Windows 字符集中可以方便地用于表示法語、德語等使用特殊拉丁字母的文字。這些字符到底是這些語言還是漢語,如果遵從 Microsoft 的解釋方法,將有可能在同一個中文的網頁中同時表達。
我們可以通過 IE 瀏覽器的菜單“查看/源文件”功能,看看 HTML 源文件中是否包含上面這樣的“漢字”,來判斷亂碼是否屬于這個情況。解決這種亂碼的只有兩個途徑:(1) 換用 Netscape 3.x 或 4.x 瀏覽器;(2) 在英文 Windows 下面使用英文 IE 3.x,通過中文之星或 Richwin 來閱讀。
對于有保存價值的網點,可以通過手工的方法進行一下轉換。方法是首先安裝一套 Netscape Navigator Gold 3.x 或 Communicator 4.x;對于你需要的網點先用瀏覽器保存(Save as)到本地,然后用 Netscape Composer ( Netscape的 簡易網點編輯器 ) 讀入這個網頁,然后選擇菜單 “ View / Encoding / Simplified chinese (GB2312) ”,然后再保存。
這個轉換方法實際上也指出了,當你用 Netscape Composer 制作一個中文網頁的時候,應該怎樣設置使得用 中文MSIE 的用戶也能夠閱讀這個網頁。這實際上又一次為我們提出了網點制作的一些問題。顯然上面的亂碼一定是由 HTML 編輯工具產生的。很多網頁編輯工具,不像 Netscape Composer 這樣存在一個語言的設置,例如 Adobe PageMill 2.0 等工具,你在里面輸入中文,它無論如何都會存成上面的樣子。這樣的工具顯然就不適合來制作中文網頁和網點。
因此我們在選擇一個新的工具(尤其是所見即所得的設計工具)的時候,不妨多花點時間去找一找、試一試它的相關選項,然后輸入幾個漢字并存一個 HTML 文件,看看中文是不是肉眼可以識別的,如果不行就只能放棄。當然你如果賭氣偏不讓那些用中文 IE 的人來看你的網點,那么另當別論。
第二種情況,HTML 源文件中,漢字是肉眼可見的,為什么中文 IE 看上去還是亂碼呢?這是因為網頁的作者沒有在 HTML 文件中正確標識網頁的語言類型,如在英文 Windows 中使用 Frontpage,網頁會自動被加上 iso-8859-1 標記,如:
<HTML><HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
</HEAD>
<BODY>
脊柱是我們這種生命的重要特征,在此基礎上我們才有了光芒的智慧和<BR>
豐富的情感。上帝賦予我們自由的意志,同時也賦予我們選擇的重擔。
</BODY>
</HTML>
這樣的網頁就會是導致中文 IE 不認中文的后果,只需將 “iso-8859-1” 改成 “gb_2312-80”、“gb2312”(會產生本文上一篇導致的問題) 或者干脆去掉這一行。具體選擇什么方案需要 WebMaster 進行權衡。當然,這個改變只能由網頁的制作者來做,閱讀網點的人是無法改變 WWW 服務器上的內容的,只能將源文件存到本地,去掉上面的標記再將就地看,或換 Netscape 瀏覽器。
盡管 Netscape 3.x 不會出現(xiàn)上面兩篇文章提到的兩種類型的亂碼,但是除了漢字的亂碼外, IE 和 Netscape 瀏覽器在很多方面都表現(xiàn)出顯著的差異,正是網點設計的千差萬別,決定了我們單純使用一種瀏覽器顯然不如同時擁有兩個瀏覽器更方便一些。有的網友耽心它們之間有沖突是不必要的,除了你自己拿注意定下誰是缺省(默認)瀏覽器外,它們之間相安無事,無論是Netscape 3.x/4.x 還是 IE 3.x/4.x。
最后再提示一下,關于解決安裝 P IE4 后,Windows 95 的 Help 成為亂碼的問題參見《亂碼大全(3)──漢字與亂碼》最后的介紹。
聯(lián)系客服