Wikipedia:字詞轉換處理

本页被视为维基百科的一项指引本指引为一些或许多维基编者原则接受。但本指引并非正式方针。自由地更新此页,不过在进行较大修改之前请在讨论页发起讨论
捷徑
WP:LC

字詞轉換處理即對繁简字、地区词的轉換处理,本頁面闡述中文維基在字詞轉換使用中的一些基本要求。

目录

[编辑] 歷史

中文维基百科建立时,虽然只有用一个域名“zh.wikipedia.org”,但实际上有不少条目都写了两个版本,如法国法國(国<=>國)就曾经是两个不同的条目;繁简名称没有区别的条目(如日本)也分成两个条目(日本/简,日本/繁)。这个方法的好处在于:条目内部不存在繁简问题,繁体条目使用繁体字、港台詞彙;简体条目使用简体字、大陆词汇,两者互不干擾。但这种方法却为大家大大地增加了工作量,因为繁简版本之间很快地就不同步了,只能靠人工来整合繁简之间的差异。

最早的中文維基每個條目都可能有繁简分立的兩個版本。如何处理繁体简体的并存,中文维基百科必须采取特殊的方法,不然就只能面临繁简分家的命运,這是中文维基百科自创建以来最为迫切的问题之一。

繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题,已经超出了繁简之间的字体转换问题。由于大陆、澳、台湾、马来西亚、新加坡等地多年来交流较少,许多外国译名以及新生词语也有非常大的分歧。如台湾所说的“帛琉”,在大陆却是“帕劳”,大陆使用“打印机”,台湾用的却是“印表機”。如此案例,屡见不鲜,且大大地超出了英语维基百科上英美词语之间的分歧。

中文維基百科的繁简体地區詞问题在ZhengzhuShinjiman和许多用户的努力下,已经得到了初步解决。取消了過去的繁简分立体系,每个条目只保留一个版本,并通过电脑程序自动转换繁简体和地區詞。即不仅仅要处理繁体字和简体字的问题,还要处理大陆和港台之间词汇分歧问题,如“帕劳”和“帛琉”也应该实现自动转换。在以前存在有繁简体两个版本的文章现在仍然需要通过手工进行合并。具体请参看Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項

每一種轉換都可以分成全局轉換與手動轉換,全局由系統轉換表來維護,對所有頁面都有效,手動轉換僅對應用它的頁面有效。

[编辑] 基本要求

編者請不要將含有各種用字的源碼全部轉換成同一種用字,尤其不要用本百科自動轉換的結果。但是,我們鼓勵用戶在擴充簡體頁面或與中國大陸有關的頁面時,盡量也使用簡體;擴充繁體頁面或與香港、臺灣有關的頁面時,盡量也使用繁體。注意:自動轉換程式可能會輸出很多錯誤結果

[编辑] 繁簡轉換與地區詞轉換分開

「繁簡轉換」的意義應只是字體上的轉換(例如簡體的「打斗」會正確轉換成繁體的「打鬥」),而地區詞转换旨在为中国大陆、台湾、新加坡、马来西亚、香港、澳门地区的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡与马来西亚(zh-sg)的地區詞为简体中文;台湾(zh-tw)、香港与澳门(zh-hk)的地區詞为繁体(正体)中文。

目前維基系統用簡體轉換表繁體轉換表來處理繁簡全局轉換,用中國大陸轉換表港澳轉換表新馬轉換表臺灣轉換表來處理地區詞全局轉換。

原先地區詞的分歧,納入簡繁轉換全局系統處理,但其後發現這樣的做法產生不少問題:

  1. 地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。
  2. 維基百科的簡繁轉換系統,與其他維基姊妹計劃共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如不需要地區詞轉換的維基文庫
  3. 自動轉換過程會出現一些「失誤」,例如簡體的「數位人士」,轉換成繁體的時候會變成「數碼人士」,要透過其他技術解決,造成編輯上的困難。

全局转换是最为方便快速的转换处理方式,但也较容易出现过度转换的问题,基於以上各項理由:

  • 繁簡轉換除了一些轉換後出錯的詞彙外,都應當進入全局轉換中,盡可能不要手動繁簡轉換;
  • 而地區詞的轉換,由於會對全局轉換造成可能的失誤,應盡可能地用手動轉換實現,除了穩定和使用廣泛的地區對應詞彙,盡可能不要進入全局地區轉換。

即:對手動轉換,應當主要用於地區轉換,對全局轉換,應當主要用於繁簡轉換。

[编辑] 繁简处理

用繁体或简体创建的文章,标题必须是全部为简体或繁体字,如果标题繁简混杂,例如“中國历史”,那么系统将无法自动转换。

所有的簡繁轉換應當納入到全局轉換管理(zh-hans<==>zh-hant)中,遇到有繁簡體的轉換出現問題,應當到Wikipedia:繁简体转换请求反映。

對於進入全局轉換後出錯的詞彙,可以采用下方的地區詞手動轉換處理方式,用{{NoteTA}}或其它相關模板在具體頁面中進行。

[编辑] 地區詞处理

[编辑] 參見

幫助文檔
Help:中文维基百科的繁简、地区词处理 讨论页
Help:進階字詞轉換處理 讨论页
Help:繁简处理/技术方案 讨论页
Help:繁简处理/转换原理(介紹轉換表的原理)  
字詞轉換處理
Wikipedia:字詞轉換處理(一般性對繁簡體、地區詞的政策)
Wikipedia:繁简处理 讨论页 存档 1 2 3 4 5 6
Wikipedia:地区词处理  
Wikipedia:简繁一多对应校验表  
Wikipedia:繁简一多对应校验表  
相關討論/投票
Wikipedia:繁简体转换请求  
Wikipedia:字词转换错误修复请求  
Wikipedia:地区词转换候选  
已完成的討論/投票
Wikipedia:投票/增加「香港繁體」轉換標籤 討論頁
Wikipedia:馬新簡體標籤顯示民意調查 討論頁
Wikipedia:投票/頁頂自動轉換標籤 討論頁
Wikipedia:關於改革字體、地區詞轉換功能的調查 討論頁
不再维护的旧頁面
Wikipedia:Unihan繁简体对照表  
Wikipedia:Unihan繁简体对照表/简繁一一对应表  
Wikipedia:Unihan繁简体对照表/简繁一多对应表  
Wikipedia:Unihan繁简体对照表/繁简一一对应表  
Wikipedia:Unihan繁简体对照表/繁简一多对应表  
Wikipedia:中文繁简体对照表
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
讨论页
Wikipedia:简繁词表  
Wikipedia:繁简词表  
Wikipedia:繁简分歧词表(介紹轉換表本身的內容)  
Wikipedia:繁简处理/简繁单字  
Wikipedia:繁简处理/简繁词汇  
Wikipedia:繁简处理/繁简单字  
Wikipedia:繁简处理/繁简词汇  
Mediawiki 系统转换表
MediaWiki:Conversiontable/zh-cn 讨论页
MediaWiki:Conversiontable/zh-hans 讨论页
MediaWiki:Conversiontable/zh-hant 讨论页
MediaWiki:Conversiontable/zh-hk 讨论页
MediaWiki:Conversiontable/zh-sg  
MediaWiki:Conversiontable/zh-tw 讨论页

system wymiany linków system wymiany linków SEO Tools system wymiany linków kreatyna Gry Online Plaza 3 star hotel Los Angeles krynica noclegi Kredyty odnawialne