如何當稱職的支語警察?

簡介

PTT 上常有支語警察

也常發現 Google 翻譯的中文常常會翻譯成中國慣用語(可以參考 Google 翻譯修好了沒?)

所以就寫了一個支語警察的網站:支語警察

流程

  1. 文章分詞
  2. 標出非台灣習慣用語
  3. 從資料庫尋找對應的用語
  4. 若無對應用語則尋找其解釋

資料庫

基本上都是使用現有的詞典,其資料都是人工更新的,目前還沒有自動辨識習慣用語的方法

  • 萌典
    • 從萌典的兩岸字典獲取用語中台灣和中國的意思不同者(同字不同義,同義不同字)
  • 開放中文轉換 OpenCC
    • 支援詞彙的轉換、異體字轉換和地區習慣用語及字體轉換(中國大陸、臺灣、香港、日本)。
    • 使用詞典對應的方式實作,像是簡體轉台灣繁體就使用此詞典搭配習慣用語詞典

實作

  • Google Trends
    • 使用台灣的搜尋趨勢比較原本用語及對應的外來用語

困難

  1. 資料庫通常沒有收錄網路流行語
  2. 同詞不同義
    1. 質量:中國常用於表示「品質」,但兩岸都有「重量」的意思 範例
    2. 土豆:中國為「馬鈴薯」,台灣為「花生」

個人評價

為了避免被貼上「逢中必反」的標籤(我不是綠衛兵),介紹幾個常用的詞

喜歡的

  1. 優化(最佳化, optimization)
    1. 少一個字,意義也相同
  2. 酸奶(優酪乳, yogurt)
    1. 意譯比較合理

討厭的

  1. 視頻(影片)
  2. 默認(預設, default)
  3. IT用語:實在是翻譯的很爛
    1. 兆位元組(MB),千兆(GB)
    2. 面向對象(物件導向, Object-Oriented)

其他案例

最近發現一位倭語大將軍 - 嚴復,他是提出信達雅翻譯理論,和將達爾文思想傳入中國的人。
他將和製漢語全都重新翻譯一遍(evolution → 天演, total → 拓都, unit → 么匿),結果是大敗收場;只留下烏託邦、物競天擇、適者生存等少數詞語留傳至今。


法國也有英語警察,詳見參考資料。


中國是目前最大的英語警察

  • 2010年4月,廣電總局要求不能使用諸如NBA、GDP、WTO、CPI等外語和縮略詞。但時至今日,此規定已名存實亡
  • 2017年,要求遊戲中不能出現英文
    • 不過經我觀察(我沒玩過中國服的遊戲),英文還是存在的,只是少很多。大多也就是Auto改自動、Success改成功、Item改道具、Level改等級這種程度而已

IT用語

可以說,英語是IT業界的絕對主導語言。

之前看見有人用中文當作Python變數名稱的,拜託不要(雖然合法)。

大學時,教授大多用英文詞語介紹內容,有些直接用英文教學,想不到某個詞的中文怎麼說是很正常的。

之前發現,如果預設語言是中文,Ubuntu也會用中文作為預設資料夾名稱(文件、下載、圖片…),這種漢化大可不必。

心得

中文也有很多從日本傳入的詞彙,明治維新後有一部份,現在也有,如課金、同接、無料、生放送、通販等二次元詞語居多。

沒有必要過度敏感,但也不要過度放縱。

參考資料

  • 萌典
  • OpenCC
  • 圖片來源
    • [閒聊] 支語警察是誰畫的?
    • [問卦] 支語警察怎麼知道哪些詞是支語
    • 支語警察總整理
    • 情報】支語警察系列支援包(圖多注意
  • 愛台灣卻為了中國用語吵架:支語警察,與討厭支語警察的人們
  • 黃克武(Huang, Max K. W.)(20081200)。新名詞之戰:清末嚴復譯語與和製漢語的競賽
  • 他翻譯、創造的詞彙已被遺忘,但會通中西的思想卻綿延不絕:中研院黃克武談你所不知道的「嚴復」
  • 法國英語警察
    • 唯美食與法語不可辜負:現代法國的反美情結
    • 為什麼要給盧旺達總統頒發門墊子?【小約翰可汗】
  • 有夠狂! 中國遊戲將不准出現英文,如HP、MP...