|
|
Wikipedia:字詞轉換處理字詞轉換處理即對繁简字、地区词的轉換处理,本頁面闡述中文維基在字詞轉換使用中的一些基本要求。
[编辑] 歷史中文维基百科建立时,虽然只有用一个域名“zh.wikipedia.org”,但实际上有不少条目都写了两个版本,如法国和法國(国<=>國)就曾经是两个不同的条目;繁简名称没有区别的条目(如日本)也分成两个条目(日本/简,日本/繁)。这个方法的好处在于:条目内部不存在繁简问题,繁体条目使用繁体字、港台詞彙;简体条目使用简体字、大陆词汇,两者互不干擾。但这种方法却为大家大大地增加了工作量,因为繁简版本之间很快地就不同步了,只能靠人工来整合繁简之间的差异。 最早的中文維基每個條目都可能有繁简分立的兩個版本。如何处理繁体简体的并存,中文维基百科必须采取特殊的方法,不然就只能面临繁简分家的命运,這是中文维基百科自创建以来最为迫切的问题之一。 繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题,已经超出了繁简之间的字体转换问题。由于大陆、港澳、台湾、马来西亚、新加坡等地多年来交流较少,许多外国译名以及新生词语也有非常大的分歧。如台湾所说的“帛琉”,在大陆却是“帕劳”,大陆使用“打印机”,台湾用的却是“印表機”。如此案例,屡见不鲜,且大大地超出了英语维基百科上英美词语之间的分歧。 中文維基百科的繁简体地區詞问题在Zhengzhu、Shinjiman和许多用户的努力下,已经得到了初步解决。取消了過去的繁简分立体系,每个条目只保留一个版本,并通过电脑程序自动转换繁简体和地區詞。即不仅仅要处理繁体字和简体字的问题,还要处理大陆和港台之间词汇分歧问题,如“帕劳”和“帛琉”也应该实现自动转换。在以前存在有繁简体两个版本的文章现在仍然需要通过手工进行合并。具体请参看Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項。 每一種轉換都可以分成全局轉換與手動轉換,全局由系統轉換表來維護,對所有頁面都有效,手動轉換僅對應用它的頁面有效。 [编辑] 基本要求編者請不要將含有各種用字的源碼全部轉換成同一種用字,尤其不要用本百科自動轉換的結果。但是,我們鼓勵用戶在擴充簡體頁面或與中國大陸有關的頁面時,盡量也使用簡體;擴充繁體頁面或與香港、臺灣有關的頁面時,盡量也使用繁體。注意:自動轉換程式可能會輸出很多錯誤結果。 [编辑] 繁簡轉換與地區詞轉換分開「繁簡轉換」的意義應只是字體上的轉換(例如簡體的「打斗」會正確轉換成繁體的「打鬥」),而地區詞转换旨在为中国大陆、台湾、新加坡、马来西亚、香港、澳门地区的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡与马来西亚(zh-sg)的地區詞为简体中文;台湾(zh-tw)、香港与澳门(zh-hk)的地區詞为繁体(正体)中文。 目前維基系統用簡體轉換表、繁體轉換表來處理繁簡全局轉換,用中國大陸轉換表、港澳轉換表、新馬轉換表、臺灣轉換表來處理地區詞全局轉換。 原先地區詞的分歧,納入簡繁轉換全局系統處理,但其後發現這樣的做法產生不少問題:
全局转换是最为方便快速的转换处理方式,但也较容易出现过度转换的问题,基於以上各項理由:
即:對手動轉換,應當主要用於地區轉換,對全局轉換,應當主要用於繁簡轉換。 [编辑] 繁简处理用繁体或简体创建的文章,标题必须是全部为简体或繁体字,如果标题繁简混杂,例如“中國历史”,那么系统将无法自动转换。 所有的簡繁轉換應當納入到全局轉換管理(zh-hans<==>zh-hant)中,遇到有繁簡體的轉換出現問題,應當到Wikipedia:繁简体转换请求反映。 對於進入全局轉換後出錯的詞彙,可以采用下方的地區詞手動轉換處理方式,用{{NoteTA}}或其它相關模板在具體頁面中進行。 [编辑] 地區詞处理[编辑] 參見 |