機器翻譯及澳門的研究*

李怡平 (澳門大學科技學院)



Machine Translation and current Research in Macau
LI YI PING
(FACULTY OF SCIENCE & TECHNOLOGY,UNIVERSITY OF MACAU)


  A growing number of machine translation (MT) systems has been used or developing by governments, businesses and industries around the world. It is imperative for Macau to develop a Portuguese-English-Chinese multilingual machine-translation system. An international co-operation with MT research groups from Portugal and China has been proposed.

一、機譯簡史


  人類語言的翻譯被認爲是數字計算機最早的應用之一。四十年代計算機剛出現時就有人開始了機器翻譯的硏究。
  機器翻譯硏究人員在頭十年,即於五十年代,滿懷信心,勁頭十足。機器翻譯硏究組織如雨後春筍般遍布全球。
  但是到了六十年代,語言學問題的復雜性與困難度明顯地暴露出來。人們認識到翻譯過程並不如早期設想的那樣容易實現自動化。很多由美國政府資助的機譯硏究項目在六十年代中期到七十年代被迫取消。然而,日本和歐洲等地還繼續在機器翻譯硏究方面作不懈的努力。終於計算機可以在處理翻譯問題時大顯身手。
  自八十年代以來,機器翻譯硏究工作在全球再度復興。機譯系統的軟件市場迅速增長。越來越多的機譯(MT)和機助翻譯(MAT)系統應用於各地的政府機構,商業和工業部門。
  1991年,國際機器翻譯網絡正式在紐約成立。這個世界性的組織由國際機器翻譯協會(IAMT)領頭,下屬三個區域分機構:亞洲—太平洋機器翻譯協會(AAMT)、美洲機器翻譯協會(AMTA)、和歐洲機器翻譯協會(EAMT)。

二、機譯概况


  如國際機器翻譯網絡的分布,機器翻譯世界通常划分爲三個最活躍的區域:北美、西歐和遠東。本節對這些區域的硏究槪况作些介紹。
  1.北美
  在這些區域裡,北美被認爲是最不活躍的地區,因爲它基本上是一個使用單一語言的社會,但是隨着法語被採用爲國家的官方語言,加拿大的情况開始變化:對翻譯的需求急劇增加,翻譯部門窮於應付。因此,機器翻譯在該國家極爲重視,蒙特利爾大學(University of Montreal)的TAUM是其中的一個硏究項目。
  在美國,英語足於應付所有政府和商業部門的使用。但是隨着國內經濟向國際經濟的轉移,對翻譯服務的需求也大量增加。近幾年以來,主要的機器翻譯系統供應商也放眼國外市場。已經有十多家美國公司將它們的機譯系統推向全球。這些機譯產品目前已廣泛應用於個人電腦和計算機工作站平台。表1列出部分公司目前提供的機譯軟件系統及其應用的語言對。


  2.西歐
  歐洲社會自古就有語言的麻煩。通常從事商業人員要會用多種語言。廠家須爲顧客準備各種語言的產品說明文件。歐共體成立後,政府工作對翻譯的需求量更是驚人地激增。
  處於這樣的環境,人們對機器翻譯自然期望甚高。所以,歐洲的公司與政府部門都樂意在機器翻譯的技術領域投資。已經有多個硏究項目在歐洲幾個國家進行。它們的目標是極大地提高翻譯工作的效率。歐共體組織的機器翻譯硏究項目爲 EUROTA。從1972開始,在法國Grenoble 的 GETA 硏究中心繼續在 CETA 十年工作的基礎上進行自動翻譯的硏究工作,MENTOR 爲 IBM 與 INESC 合作開發的葡文機器翻譯系統的原型。
  3.遠東
  遠東地區的國家沒有歐美國家那樣的優勢,罕有客戶學習他們的語言。而他們的經濟,尤其象日本,是建立在出口貿易的基礎上。能否用客戶的語言提供產品文檔至關重要。同時翻譯作爲獲取情報資料的手段也必不可少。
  數年來翻譯在日本已經形成了幾萬億日元年銷量的市場,而且這個市場每三年還要翻一倍。這個需求量猶如天文數字。難怪許多日本公司熱衷於應用、硏究和開發機器翻譯系統。在韓國,機譯硏究正在五所大學和三所硏究機構展開。到目前已有六個機譯系統可以處理英文,日文和韓文。
  中國軟件公司的譯星(TRANSTAR)英漢翻譯系統三年前已在市場上出現。該系統在386電腦上運行每小時可處理三萬個英文單詞。去年,譯星的漢英翻譯系統也已經推出市場。快譯通EC—863A首次在袖珍計算器上實現語句智能翻譯。該產品推出市場的頭三個月,月銷售額即達到三千萬港元。
  1987年,CICC(國際電腦合作中心)宣布了一項硏究開發多語言機器翻譯系統的計划。該系統將處理日文、中文、印尼文、馬來文和泰文。這個項目促進了各成員國對機器翻譯的硏究工作。

三、系統分類


  這裡按照機譯系統的自動化程度來分類。如果系統不是完全自動化,在產生“原始輸出”(未經修改的翻譯)之前,翻譯人員需要參與系統的工作。其自動化程度可由翻譯人員與機器交互作用過程中(生成原始輸出前)所需的時間來衡量。

  1.機助人譯(MAHT)
  機助人譯基本上是人在翻譯。他利用的機器輔肋是有限的。翻譯人員在此系統中可以得到下列輔助:
  ·帶詞典的文字處理系統
  ·上下文關鍵詞工具
  ·語法資料
  ·詞法分析
  ·翻譯文章的語料庫
  ·拼寫和語法的修改

  2.人助機譯
  使用人助機譯系統,翻譯人員僅需提供有限的資料。當某些語言結構難於進行自動分析,或者某些單詞有多種意義時,機器會向翻譯人員求助:
  ·確定連接詞(‘and’,‘or’等)的作用範圍;
  ·在句子中分隔開一連串的名詞;
  ·指出介詞的功能;
  ·解決一詞多義的問題等。

  3.全自動機譯(FAMT)
  全自動機譯系統運行時,從輸入原文本到最後輸出原始翻譯之間,不需要任何人員的參與。當然,“全自動”並不是不需要翻譯人員的後修改或者後編輯工作。
  除了系統的自動化程度外,機譯系統也可以按下列特性分類:對源語言的語法分析的深度,在源語言和目標語言之間資料轉換的類型,在翻譯鏈中相位控制的結構,以及系統的詞法和語法對應用領域的依賴性。

四、澳門的需求


  澳門在促進東、西方文化交流方面起着重要的作用。由於葡文和中文都成爲官方語言,行政事務對翻譯的需求驚人地增長。不僅政府的新文件需用雙語發表,而且大量的現存葡語文件,如法律文件,仍待翻譯成中文。
  澳門居民來自世界各地。除中、葡文以外,英文也在某些敎育機構、科技中心和商貿部門裡使用。很難想象沒有機器翻譯系統如何在澳門推行辦公自動化。
  澳門還是一個每年吸引數百萬游客的國際城市。除了旅游業以外,出口貿易也是澳門的一項重要的外匯來源。澳門的發展還依賴於從發達的工業國家吸收和引進技術及設備。這些活動都表明澳門對翻譯服務的需求十分迫切。
  在這樣的環境裡,有必要在澳門開發一個葡—英—中的多語言機器翻譯系統。由於這個機譯系統的市場有限,很難期待一個盈利公司會作開發性的投資,迄今仍未見有些類系統推出市場。因此有必要在澳門組織力量硏究和開發這個機譯系統。

五、目前的研究


  早在幾年以前,澳門政府已認識到機器翻譯的重要性。但是要開設這樣的硏究項目祇是當科技學院,特別是軟件工程專業,在澳門大學裡建立後才有可能提到議事日程上來。
  1992年,原澳門大學校長李天慶敎授會晤歐共體和葡國的來訪官員和專家時,曾經一起探討過開發“葡—中—英多語言計算機輔助翻譯系統”的可行性。從那次會議後,校長要求科技學院準備關於機器翻譯硏究的提案。
  李天慶敎授和原科技學院院長周禮杲敎授於1993年9月受 JNICT 的邀請到葡國訪問。在訪問期間曾經討論過在科技硏究方面合作的事項。訪問歸來後,李天慶敎授向澳門政府行政、敎育曁靑年事務司黎祖智博士寫了訪問報告,並提議召開一次會議以建立與葡萄牙及中國關於機器翻譯硏究的國際合作。
  這次會議於1994年3月16至19日在澳門大學召開。與會者包括來自 JNICT 的António Serralheiro敎授、新里斯本大學的Pereira Lopes 博士、中國科學院陳肇雄敎授、淸華大學黃昌寧敎授、和澳門大學周禮杲敎授、Rui Martins博士、Otakar Babka博士、和李怡平博士。澳門基金會協辦了這次會議並派馮少榮先生與會。會議還邀請了澳門政府華務司和法律翻譯辦公室的代表介紹澳門對翻譯服務的需求情况。在會議中,各代表介紹了他們各自的機器翻譯硏究現狀,討論了合作項目的可行的硏究方法、技術方案、和工作計劃。會議最後就聯合硏究項目提案達成共議。
  爲了配合這項聯合硏究工作,去年澳門大學硏究委員會資助了一項爲期一年的硏究項目。主要爲葡—英—中多語言機器翻譯系統的開發硏究作準備。我們收集並整理了有關資料。這個學期,我們還安排部分軟件工程的畢業生開發一些輔助翻譯的軟件系統,作爲他們的畢業設計工作。
  自去年三月會議後,我們一直與葡國和中國的合作伙伴保持聯系。關於聯合硏究項目的建議書已經最後定稿。目前各個合作伙伴正在所在地向有關科學基金會申請硏究費用。機器翻譯是一個大系統,開發費用不菲。籌集足夠的資金並非易事。我們除了爲硏究經費努力外,也要根據實際情况,隨時調整我們的硏究計劃,盡力而爲並量力而行,力爭取得較佳的成果,以促進澳門翻譯工作的發展。

參考文獻


   1. Campbell and J. Cuena, Perspectives in Artificial Intelligence, Volume Ⅱ: Machine Translation, NLP, Databases and Computer-aided Instruction, Eillis Horwood, 1989.
   2. 陳肇雄:機器翻譯硏究進展,電子工業出版社,1992.
   3. Chris Miller, Babelware for the desktop, Byte, January, 1993.
   4. Resource Guide: Machine-Translation Software, Byte, January, 1993.
   5. Gil Chang Kim, Current status of machine translation research in Korea, Presentation in International Conference on Computer Processing of OrientalLanguages, May 1994.
   6. John Lehrberger and Laurent Bourbeau, Machine Translation, Linguistic Characteristics of MT System and General Methodology of Evaluation, John Benjamins, 1988.
   7. 劉淑英,趙啓迪:機器翻譯的優勢與局限,中國翻譯,No.2,1993.
   8. Klaus K. Obermeier, Natural Language Processing Technologies in Artificial Intelligence, The Science and Industry Perspective, Ellis Horwood, 1989.
   9. Darmawan Sukmadjaja, Machine translation research in Indonesia, MT News International, Issue no. 8, May 1994.
   10. 張文:機器翻譯硏究最新進展,中國翻譯,No.5,1993.
   11. Proceedings of Workshop on Machine Translation, University of Macau, March 1994.

   *澳門大學研究委員會資助課題。本文的初稿(英文)曾刊於第四屆環太平洋研討會文集,澳門,1994.