|
|
Help:中文维基百科的繁简、地区词处理中文維基百科的繁簡處理是中文維基百科的一項自動轉換,目的是以電腦程式適應不同用字模式的差異。 中文維基百科的讀者和編者來自世界各地。他們所需求或貢獻的中文在性質上有許許多多的差異,像是簡化字和繁体字的差異、各地区詞彙的差異、方言差異造成的书面語言的差異等等。MediaWiki將這些中文性質集合在一起,稱為「用字模式」。可以說:一種用字模式就是某些中文性質的一個集合。 為了整合讀者和編者多元的資源,也為了促進各方的交流,本百科並不規範讀者或編者要使用何種用字模式,而是嘗試以電腦程式的自動轉換來適應這些差異,讓編者可以以自己的用字習慣提供資料,也讓讀者可以選擇所要的資料的用字遣詞。 因此編輯和閱讀中文維基百科時有特別的事項需要注意。事實上,就連本頁嘗試說明的事項,也有許多模糊之處。
[编辑] 現行的自動轉換用字模式自動轉換與維基系統本身的原理有關。大部分編者輸入系統的文章內容,包括文字和維基語法等等,在此稱為源碼。維基系統通常會保留完整不變的源碼,不作自動轉換。讀者使用維基系統時,並非直接閱讀源碼,而是由系統將源碼即時自動轉換成合適的形式,例如加上圖片、超連結等等。而中文维基百科的用字模式轉換就是眾多自動轉換程序中的一道。 自動轉換電腦程式的能力範圍不只是百科的條目文章,也包括頁面分類等等頁面。 大多數時候(預設情況),維基程序是根據轉換表進行轉換。有的時候,則是根據編者在源碼中指定的方式作自動轉換,包括不轉換或是所謂「手動轉換」。 轉換表就是一份列出各種不同用字模式之間,字與字或是詞與詞之間的對應關係的表格。目前只有管理員能編輯轉換表。 所謂「手動轉換」仍然是維基系統在讀者使用時即時作的自動轉換,但是這時程序是根據編者在源碼中指定的方式為優先。 編者可以在編輯存檔後切換至其他用字模式查看情況。 [编辑] 用字模式選擇目前中文百科系统支持中文的zh(中文用字),zh-hans(簡體用字),zh-hant(繁體用字),zh-cn(中國大陸用字),zh-tw(台灣用字),zh-hk(香港用字),和zh-sg(新加坡用字)七種用字模式。要支持更多的用字模式需要修改程序,如果有實際需要請在討論頁中提出。 文章主体繁体/简体选择(按优先级):
另外,不同的面板(Skin)都增加了到各個用字模式的链接,如現在MonoBook面板,链接是在文章的右上方。链接的名称可以通过MediaWiki:variantname-zh-tw/zh-cn、MediaWiki:variantname-zh-tw/zh-tw等修改。如果要去掉某个链接,只需将相应的MediaWiki:variantname-zh-xx的页面内容设为disable。 [编辑] 界面的用字模式界面的用字模式是独立于文章内容的用字模式的。除了中文的各種用字模式,还可以选择英文、法文等等语言。界面用字模式在已登入用戶的个人参数里设置。 [编辑] 转换表目前,系统預設的自动转换是根據數個「轉換表」。轉換表就是一份表格,記載各種不同用字模式之間,字與字或是詞與詞之間的對應關係。又叫系统默认转换表。目前只有管理員能編輯轉換表,一般人可以向管理員提出申請。 [编辑] 系统默认转换表系统默认的转换表存在于mediawiki程式中: 参见Wikipedia:简繁一多对应校验表及Wikipedia:繁简一多对应校验表。 [编辑] 定制转换表管理员可以通过Mediawiki:Conversiontable/zh-hans, Mediawiki:Conversiontable/zh-hant, Mediawiki:Conversiontable/zh-cn, Mediawiki:Conversiontable/zh-tw, Mediawiki:Conversiontable/zh-sg, 及 Mediawiki:Conversiontable/zh-hk 来定制转换表。普通用户可以在Wikipedia:繁简体转换请求里提出修改转换表的建议。定制转换表可以用来修正系统默认转换表里的错误。这些页面可以象其他页面一样编写,但是描述转换关系需依以下格式:
-{
皇后 => 皇后 ;
波斯尼亚=>波士尼亞;
萨拉热窝=>塞拉耶佛 //Sarajevo的翻译;
...
}-
为方便显示,每条对应前可加星号(*)或井号(#),可用“//”加写注释,注意每条转换关系要以“;”终止。 Zhconversiontable/zh-cn页面用于向zh-cn的转换,Zhconversiontable/zh-tw页面用于向zh-tw的转换,等等。 这些页面更新后,其效果并不一定会即时显示出来,因为有些页面可能放在頁面缓存裡。要看即时效果可以用编辑预览功能。 [编辑] 关于-{}-标记例如:“張國榮曾在英國利兹大学學習。”所用的-{}-标记是[[利兹大學|-{zh:利兹;zh-hans:利兹;zh-hk:列斯}-大学]] 參見本頁「禁止自动转换一段文字的标签」。 注意:该-{}-标记的设计意图是仅对文字进行手工转换,对链接、模板、图像、HTML属性等等进行手工转换可能会出错!可能会在以后支持对非文字信息进行手工转换,需要要对代码作较大的改动。 [编辑] 源碼一般不做轉換大部分編者輸入系統的文章內容,包括文字和維基語法等等,在此稱為源碼。維基系統通常會保留完整不變的源碼,不會對源碼作自動轉換。 [编辑] 斷詞問題--自動轉換程式很常見的問題注意:中文维基百科不保证用字模式自動轉換程式和内容的正确性。用字模式自動轉換並不一定正確,甚至可以說是各種自動轉換中問題特別多的。 转换程序使用最简单的“最大匹配法”进行转换。这会导致如下的错误:假设转换表中有一对应关系为 内存 => 記憶體 现对以下句子作转换 人体内存在很多微生物 基于最大匹配,系统会对“内存”进行转换,得到“記憶體”。整个句子将会被错误地转换成 人體記憶體在很多微生物 解决这个问题的根本方法是采用智能的斷詞匹配,将上述句子先拆分为 人体 内 存在 很多 微生物 然后再对每个词单独转换。 在具有這種智能的斷詞系统没有实现之前,要修正上述错误,可以有两种方法:
這就是斷詞的錯誤。閱讀本百科時請多加注意。遇到可疑的部分可以前往編輯頁面去查源碼,或是多多留意不同用字模式之間的轉換關係,以養成自行「反轉換」的能力。 [编辑] 控制自动转换的代碼出于特殊的需要,可以用以下的語法設定不自動转换,或是「手工转换」。 設定了所謂「手工轉換」,其實維基系統仍然會在閱讀者使用時根據系统默认转换表作自動轉換,但是這時系統還會根據編者在源碼中指定(增添)的方式作轉換,並且將編者的方式優先排在转换表所列出的方式之前。也就是由編者自行增添轉換方式。 [编辑] 常用的轉換工具語法
[编辑] 條目標題有时文章的标题不需要转换,如維基詞典里的单字,或如《计算机世界报》之类的专有名词。在这种情况下,可以在文章中加一 注意:这个标记要放在文章最开始的地方。 有时一篇文章的标题裡,可能含有各地區認知不同或翻譯方式差異很大的辭彙,但因為某些理由不適合透過修改转换表來達成自动转换的目的,通常是因為一些常用字。如果冒然修改轉換表,可能會造成更多地方產生錯誤。这种情况下可以在文章内指明标题的正确显示: 實例:美國政治家John Kerry分別有「约翰·克里」、「約翰·凱利」與「約翰·克里」的不同譯名,但如果在轉換表中進行「克里<=>凱利」的互換,那麼歐洲地名克里米亞與克里姆林宮將會變成「凱利米亞」與「凱利姆林宮」的錯誤情況,為了避免製造更多的混亂,這情況比較適合在约翰·克里的條目中以手工轉換標籤修正標題與內文部份的相關譯名。 注意:该标记仅仅是指明文章显示时对标题的转换,而不能自动处理链接时的转换。所以使用该标记时切记要通过重定向将各种用字模式的同一标题指向该文章。如約翰·凱利。 [编辑] 全文禁止自動轉換有时通篇文章都需要不转换,例如讨论繁体/简体的文章。在这种情况下,可以在文章中加一 注意:这个标记要放在文章最开始的地方。 [编辑] 自動轉換的能力範圍本百科很多頁面都可進行自動轉換。但是仍有很多例外。例如最近更新頁面Special:Recentchanges這樣的特殊頁面,就有一部分是不轉換的。 [编辑] 頁面分類目前自動轉換電腦程式的能力範圍不只是百科的條目文章,也包括頁面分類等等頁面。因此除非特別指定,否則條目標題或是子分類標題的分類是根據經過自動轉換之後的結果來分類。然而在此的自動轉換也和別處不同,僅僅是簡單的「繁簡轉換」,並沒有進一步轉換。 實例:美國政治家John Kerry分別有「约翰·克里」、「約翰·克里」與「約翰·凱利」的不同譯名。譯名的關係已加入轉換表,而條目的源碼中並沒有特別指定不轉換,所以閱讀者使用維基系統時,並非直接閱讀源碼,而是由系統將源碼自動轉換成合適的形式。但是在頁面分類中,的自動轉換也和別處不同,僅僅是簡單的「繁簡轉換」,並沒有進一步轉換。 在分類頁Category:美國政治家之中,如果讀者選擇中國大陸用字或新加坡用字模式,將看到约翰·克里的條目歸類在「约」字之下的约翰·克里: 而選擇台灣用字或香港用字的讀者則會看到這條目歸類在正體的「約」字之下,然而條目名稱是約翰·凱利: 子分類也是一樣。 [编辑] 軟體問題2006年1月開始出現一個問題,可能與新版本的mediawiki有關。只要是分類名繁體對簡體,條目或子分類就會從母分類消失,但是條目或子分類頁經過任何編輯之後又會恢復,但系統下一次的link更新時又會消失。另外,分類是不可使用重定向功能的。 參看:頁面分類。 [编辑] 內部連結、URL、重定向與搜尋雖然源碼一般不做轉換。只有程序產生出來的頁面有經過轉換。然而讀者收到的頁面上,在維基系統之內的「內部連結」(不是外部連結或普通的URL,參見Help:链接),並不是由源碼決定,是由程序產生出來的頁面決定。也就是說:連結也會受到自動轉換電腦程式影響。
用字自動轉換電腦程式的能力範圍不包括維基百科的URL與搜索功能。百科的系統不會對URL之中的漢字(有時是Punycode的代號形式),或是輸入搜索功能的查詢字串作用字轉換。
重定向頁的內容不會受到自動轉換電腦程式影響。
#f1f2f1CT[[约翰·克里]]
本百科的條目名稱搜索(「進入」)不會受到自動轉換電腦程式影響。因此條目名稱完全是一個用字模式的條目還需要一個重定向頁才能直接搜索。但是如果重定向頁的「名稱」和已存在的條目名稱完全一樣,只是繁簡用字模式不同,則需要特殊做法來製造重定向頁。 本百科的條目全文搜索(「搜尋」)不會受到自動轉換電腦程式影響。 本百科之外的搜尋引擎如Google可能有自己的自動轉換電腦程式。目前已知搜索時會作簡單的繁簡轉換。當需要建立繁簡重定向頁的時候,建立新條目的方式往往無法奏效。 [编辑] 如何建立繁簡重定向頁登录的用戶可以使用移動頁面功能來建立繁簡重定向頁。比方說,假設現在有個名為「沈阳」的條目,而你想要建立從「瀋陽」到「沈阳」的重定向頁,那麼應該要進行兩次移動:
其結果將是「沈阳」的條目維持原狀,而「瀋陽」成為指向「沈阳」的重定向頁。 第二次移動看似多餘,但會帶來兩個好處:
[编辑] 編輯一般文章時的注意事項
[编辑] 参看 |