Wikipedia:字词转换错误修复请求

维基百科,自由的百科全书

跳转到: 导航, 搜索

现在繁简体、地區詞转换的程序已经初具雏形。本页将用来對已投入的轉換進行檢驗,對過度轉換的情況可以在此報請修復。请大家热心参与!

目录

[编辑] 一對多轉換原理及錯誤原因

由於简体中文以單一简体字來取代多個繁體字,因此必須有額外的資料來補足原先丟失的資訊。舉例說明:例如在繁體中的“髮”或“發”,在简体下都是“发”。在程式裡,我們有一個預設的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程式遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢? 這個就要看詞庫內而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。

那詞庫是如何建立的呢? 我們先有每個字的預設對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含(繁體)“發”的的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的預設對應關係。

修復過度轉換也是由上述的方法來處理。

下面的请求处理后,如有必要,处理者应将之完善到Wikipedia:简繁一多对应校验表Wikipedia:繁简一多对应校验表

[编辑] 修復討論

现在繁简体、地區詞转换的程序已经初具雏形。本页将用来對已投入的轉換進行檢驗,對過度轉換的情況可以在此報請修復。请大家热心参与!

目录

[编辑] 一對多轉換原理及錯誤原因

由於简体中文以單一简体字來取代多個繁體字,因此必須有額外的資料來補足原先丟失的資訊。舉例說明:例如在繁體中的“髮”或“發”,在简体下都是“发”。在程式裡,我們有一個預設的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程式遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢? 這個就要看詞庫內而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。

那詞庫是如何建立的呢? 我們先有每個字的預設對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含(繁體)“發”的的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的預設對應關係。

修復過度轉換也是由上述的方法來處理。

下面的请求处理后,如有必要,处理者应将之完善到Wikipedia:简繁一多对应校验表Wikipedia:繁简一多对应校验表

[编辑] 修復討論

2008年8月

[编辑] 错误转换:繁体词“恐佈”被转换成了“恐布”

[编辑] 錯誤轉換:干涉 → 幹涉

[编辑] 錯誤轉換:新西兰→紐西蘭

[编辑] 錯誤轉換:福斯→福士

[编辑] 錯誤轉換:索贊尼辛→蘇辛尼津

[编辑] 錯誤轉換:“迈克尔”被过度转换成了“米高”

請修復“迈克尔”被过度转换成了“米高”;錯誤案例:所有並非運動員、藝人的「迈克尔」;其他說明:香港並非盲目把所有Michael譯「米高」,只有在運動員、藝人人名上才譯「米高」,其餘依大陸用「邁克爾」。。—QúnQúnFáng 2008年8月6日 (三) 06:12 (UTC)

[编辑] zh-hans:人参; zh-hant:人蔘;

[编辑] 錯誤轉換:zh-hans:人参; zh-hant:人蔘;

[编辑] 錯誤轉換:「大坂」被转换為「大阪」

[编辑] 错误转换:zh-hans:复平面;zh-hant:復平面

[编辑] 錯誤轉換:「相干」變了「相乾」,無論簡繁應該都是「相干」

[编辑] 錯誤轉換:「批准」被過度轉換成「批準」

[编辑] 错误转换:暴鲤鱼在简体中应为暴鲤龙

请修复暴鲤鱼在简体中应为暴鲤龙;错误案例:词条:暴鲤鱼。—116.24.95.57 (留言) 2008年8月10日 (日) 08:42 (UTC)

[编辑] 错误转换:RAID陣列 被过度转换成了 RAID数组

[编辑] 錯誤轉換:「水平」不完全等於「水準」

[编辑] 地区词转换候选:zh-cn:数; zh-tw:数; zh-hk:暂缺; zh-sg:暂缺

[编辑] 錯誤轉換:“於”、“于”

[编辑] 錯誤轉換:“多隻”、“只是”

[编辑] 错误转换:简体:上签;繁體:上籤

[编辑] 错误转换:珎/珍

[编辑] 錯誤轉換:面

[编辑] 錯誤轉換:港澳繁體中的「多明尼加」--> 「多明尼加共和國」

過度轉換,錯誤案例:柯絲蒂·考文垂條目中的──「...入讀津巴布韋的多明尼加共和國修女高校(Dominican Convent High School)」—hose'neru(Talk) 2008年8月18日 (一) 11:07 (UTC)

[编辑] 错误转换:请求咲在简体下不要转换为笑

[编辑] 錯誤轉換:港澳繁體中的「尼日」--> 「尼日爾」

過度轉換,導致「尼日利亞」被轉換「尼日爾利亞」—hose'neru(Talk) 2008年8月19日 (二) 18:10 (UTC)

[编辑] 错误转换:嚮應 被转换为 向应

请修复嚮應 被转换为 向应;错误案例:香港奧運馬術比賽場地#場地特色;其他说明:个人设置:zh-cn。—Liangent (留言) 2008年8月24日 (日) 10:11 (UTC)

[编辑] 错误转换:項目 被转换为 專項

请修复項目 被转换为 專項;错误案例:香港奧運馬術比賽場地#可持續發展;其他说明:个人设置:zh-cn。—Liangent (留言) 2008年8月24日 (日) 10:11 (UTC)

[编辑] 錯誤轉換:港澳繁體中的「卡達」--> 「卡塔爾」

過度轉換,導致「卡達山族」被轉換「卡塔爾山族」,「卡達巴地猿」被轉換成「卡塔爾巴地猿」—hose'neru(Talk) 2008年8月25日 (一) 09:59 (UTC)

[编辑] 錯誤轉換:原文:表演→繁體:錶演

請修復原文:表演→繁體:錶演;錯誤案例:新花園娛樂場於繁體顯示下:... 將亦曾於[[2000年]][[奧運會]]後到過澳門作親善交流,而跳水錶演場地亦在新花園泳池。另一方面,愛都酒店早於多年前 ...;其他說明:「表演」不必進行轉換。—Quest for Truth (留言) 2008年8月27日 (三) 14:40 (UTC)

己經在rev:40254中去除『水表』→『水錶』。 Shinjiman 2008年8月30日 (六) 10:17 (UTC)

[编辑] 錯誤轉換:原文:表示→繁體:錶示

請修復原文:表示→繁體:錶示;錯誤案例:戒急用忍於繁體顯示下:... 林濁水錶示,台灣產業困境是國民黨製造的:[[李登輝]]在執政初 ...;其他說明:「表示」不必進行轉換,此錯誤估計是因為資料庫中有(zh-hans:水表;zh-hant:水錶;)造成。—Quest for Truth (留言) 2008年8月27日 (三) 14:46 (UTC)

己經在rev:40254中去除『水表』→『水錶』。 Shinjiman 2008年8月30日 (六) 10:17 (UTC)

[编辑] 錯誤轉換:原文:水表面→繁體:水錶面

請修復原文:水表面→繁體:水錶面;錯誤案例:水黽科於繁體顯示下:水黽科昆蟲于春天至初夏交配。此後數個月中雌蟲在水錶面附近的植物傷其類產卵。[[幼蟲]]變態五次。;其他說明:「水表面」不必進行轉換,此錯誤估計是因為資料庫中有(zh-hans:水表;zh-hant:水錶;)造成。—Quest for Truth (留言) 2008年8月27日 (三) 15:21 (UTC)

注:在談手錶時,(zh-hans:表面;zh-hant:錶面;)是正確的。 —Quest for Truth (留言) 2008年8月27日 (三) 15:30 (UTC)
己經在rev:40254中去除『水表』→『水錶』。 Shinjiman 2008年8月30日 (六) 10:17 (UTC)

[编辑] 错误转换:滑鼠手勢 被转换为 中关村, 不知道为什么...

请修复滑鼠手勢 被转换为 中关村, 不知道为什么...;错误案例:Maxthon。—Liangent (留言) 2008年8月28日 (四) 03:51 (UTC)

  • 没事了,系统故障--Liangent (留言) 2008年8月28日 (四) 08:08 (UTC)

[编辑] 错误转换:计畫 被转为 计画 (zh-cn)

请修复计畫 被转为 计画 (zh-cn);错误案例:Wikipedia;其他说明:应为 计划。—Liangent (留言) 2008年8月28日 (四) 07:59 (UTC)

  • 没事了,错别字--Liangent (留言) 2008年8月28日 (四) 08:08 (UTC)

[编辑] 錯誤轉換:取消繁體下「注」轉為「註」

請修復取消繁體下「注」轉為「註」;錯誤案例:許多古書稱為XX注,卻被轉為XX註。;其他說明:作「解釋」之意時,繁體下「注」可通「註」,所以不需要轉換;作「標示」之意時才有明顯區分,但常單字使用,難以用機器判斷。。—百楽兎 (留言) 2008年8月29日 (五) 05:18 (UTC)

[编辑] 錯誤轉換:取消「威斯特法伦」轉為「威斯伐倫」

請修復取消「威斯特法伦」轉為「威斯伐倫」;錯誤案例:所有條目;其他說明:從北莱茵-威斯特法伦條目來看,兩岸三地都不使用「威斯伐倫」,不知為何系統要自動轉換為「威斯伐倫」。。—百楽兎 (留言) 2008年8月29日 (五) 05:26 (UTC)

[编辑] 錯誤轉換:“裡面包括”

請修復“裡面包括”;錯誤案例:“這裡麵包括允許用於人名的異體字”。—Ivor (留言) 2008年8月31日 (日) 05:09 (UTC)

2008年9月

[编辑] 錯誤轉換:簡體「世田谷」錯誤轉換為繁體「世田穀」

[编辑] 錯誤轉換:簡體「有栖川」錯誤轉換為繁體「有棲川」

[编辑] 錯誤轉換:迈克尔·舒马赫→舒密加

  • 請修復「迈克尔·舒马赫→舒密加」
  • 說明:哥哥迈克尔·舒马赫(Michael Schumacher)、弟弟拉夫·舒马赫(Ralf Schumacher)同樣具高知名度,為了區別,香港傳媒仍會把他的名字(Michael)和姓氏(Schumacher)一同翻譯,而沒有忽略名字不譯。所以迈克尔·舒马赫在「港澳繁體」應轉換為→米高·舒密加QúnQúnFáng 2008年9月5日 (五) 07:51 (UTC)

[编辑] 錯誤轉換:「冬冬」在台灣正體變成「鼕鼕」

為何有這樣的轉換,令人摸不著頭腦,請取消。—jitcji 2008年9月8日 (一) 13:31 (UTC)

  • 可以举一些错误转换的例子吗?—菲菇维基食用菌协会 2008年9月28日 (日) 12:46 (UTC)
    • 都是人物的名字。例一:王牌大賤諜,台灣有個女藝人叫冬冬,若不加上取消轉換都會變成鼕鼕。例二:大學生了沒,也是人物冬冬變鼕鼕。例三:奇天烈大百科,與前面相同。實在不懂「鼕鼕」究竟為何義(有這個詞嗎?),為何會與「冬冬」畫上等號,難以理解。—jitcji 2008年9月28日 (日) 15:33 (UTC)

[编辑] 建議取消「澳大利亞」在台灣正體被轉換為「澳洲」

「澳大利亞」一詞在台灣也通用,不必強制轉換成澳洲。只要保留澳洲轉換成澳大利亞即可。—jitcji 2008年9月11日 (四) 11:02 (UTC)

这个,最好听听其他人的意见。—菲菇维基食用菌协会 2008年9月28日 (日) 12:44 (UTC)

[编辑] 錯誤轉換:簡体筋斗→繁體筋鬥