国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

15158846557 在線咨詢 在線咨詢
15158846557 在線咨詢
所在位置: 首頁(yè) > 營(yíng)銷資訊 > 信息時(shí)代 > 機(jī)器翻譯

機(jī)器翻譯

時(shí)間:2024-01-22 02:10:01 | 來源:信息時(shí)代

時(shí)間:2024-01-22 02:10:01 來源:信息時(shí)代

機(jī)器翻譯是通過計(jì)算機(jī)來實(shí)現(xiàn)不同自然語言之間的轉(zhuǎn)換,也稱為自動(dòng)翻譯,一般是指自然語言之間的部分句子或全文的翻譯。它作為應(yīng)用語言學(xué)的一個(gè)分支,是建立在語言學(xué)、數(shù)學(xué)和計(jì)算機(jī)科學(xué)基礎(chǔ)上的跨學(xué)科研究。由于需要通過電腦數(shù)據(jù)庫(kù)和翻譯軟件來完成操作,因此,機(jī)器翻譯的發(fā)展與計(jì)算機(jī)科學(xué)、數(shù)學(xué)、人工智能、語言學(xué)等各學(xué)科的發(fā)展密不可分,可以說,機(jī)器翻譯的推進(jìn)需要這些學(xué)科的技術(shù)支撐和理論支持。人類進(jìn)入21世紀(jì)以來,隨著經(jīng)濟(jì)的發(fā)展,國(guó)際交流合作日益頻繁,對(duì)機(jī)器翻譯的需求日益增大。機(jī)器翻譯是規(guī)避國(guó)家間交流障礙的有效手段,但作為綜合性的學(xué)科,它的發(fā)展受到多方面牽制,因此需要相關(guān)研究人員和學(xué)者對(duì)其相關(guān)學(xué)科進(jìn)行更深入的研究。
1機(jī)器翻譯發(fā)展歷史
  機(jī)器翻譯的歷史最早可以追溯到20世紀(jì)30年代相關(guān)學(xué)者提出其雛形,如今處于高速發(fā)展的階段。然而在初期機(jī)器翻譯受到過阻礙,一度陷入低潮期。直到移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來,一方面,隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)快速發(fā)展,人們要求用計(jì)算機(jī)實(shí)現(xiàn)語言翻譯的愿望越來越強(qiáng)烈。另一方面自1990年統(tǒng)計(jì)機(jī)器翻譯模型提出以來,基于大規(guī)模語料庫(kù)的統(tǒng)計(jì)翻譯翻譯方法迅速發(fā)展,機(jī)器翻譯再次成為人們關(guān)注的熱門研究課題,取得了一些令人矚目的成果。但是,在機(jī)器翻譯飛速發(fā)展的同時(shí),也遇到了很多難題,在目前的技術(shù)條件下翻譯的質(zhì)量還不能夠達(dá)到人們的期望的程度,想讓機(jī)器讓人類一樣去理解和分析語言還遠(yuǎn)不能行。在當(dāng)今信息大數(shù)據(jù)時(shí)代,機(jī)器翻譯正發(fā)揮越來越重要的作用。
  機(jī)器翻譯的發(fā)展可以歸結(jié)為以下幾個(gè)發(fā)展階段:
1.1機(jī)器翻譯人員的獨(dú)立工作階段
  20世紀(jì)50年代初期,隨著第一臺(tái)計(jì)算機(jī)的問世,美國(guó)的科學(xué)家W.Weaver和英國(guó)工程師A.D. Booth就發(fā)表了翻譯備忘錄,提出了利用計(jì)算機(jī)進(jìn)行翻譯的設(shè)想。隨后,通過不懈的努力和試驗(yàn),美國(guó)的喬治倫敦大學(xué)和IBM公司合力推出了首個(gè)MT系統(tǒng),為各國(guó)的機(jī)器翻譯奠定了堅(jiān)實(shí)的實(shí)踐基礎(chǔ)。但是由于受到計(jì)算機(jī)硬件局限性的限制,尤其是內(nèi)存不足和存儲(chǔ)速度慢,以及缺乏高級(jí)編程語言,研究人員無法完全依賴機(jī)器來完成大規(guī)模、高質(zhì)量的翻譯任務(wù)。同時(shí),由于研究是在沒有句法學(xué)家和語義學(xué)家的協(xié)助下獨(dú)立進(jìn)行的,翻譯的質(zhì)量難以保證。
  在這樣的背景下,早期研究者意識(shí)到,無論開發(fā)出什么樣的系統(tǒng)都只能產(chǎn)生出低質(zhì)量的輸出,因此專家建議,先發(fā)展對(duì)有控制的語言進(jìn)行翻譯,并限定于某些特定領(lǐng)域。
1.2進(jìn)入高質(zhì)量的翻譯輸出
  20世紀(jì)60年代,受到改進(jìn)了的計(jì)算機(jī)硬件和編程語言的鼓舞,研究人員對(duì)機(jī)器翻譯產(chǎn)生了盲目的樂觀。編程語言在句法分析上取得的長(zhǎng)足進(jìn)步讓翻譯人員感受到了技術(shù)革新的成果,他們相信機(jī)器翻譯有巨大的前景,幾年之內(nèi)就可以達(dá)到高質(zhì)量的輸出,這一樂觀論調(diào)很快傳遍了全世界。研究人員還提出假設(shè):機(jī)器翻譯的目標(biāo)是產(chǎn)出高質(zhì)量翻譯的全自動(dòng)系統(tǒng)。研究的重點(diǎn)在于尋求完善的翻譯理論和方法。
1.3翻譯軟件和工具的發(fā)展
  20世紀(jì)70年代以來,隨著科技發(fā)展和各國(guó)間頻繁交流,大規(guī)模翻譯需求日益增加,對(duì)計(jì)算機(jī)翻譯的依賴更加突出,機(jī)器翻譯進(jìn)入了新的發(fā)展階段。實(shí)用性翻譯和軟件系統(tǒng)如雨后春筍頻頻出現(xiàn),如Weinder系統(tǒng)、EURPOTRA多國(guó)種翻譯系統(tǒng)、TAUM-METEO系統(tǒng)等。80年代產(chǎn)生了大量連接網(wǎng)絡(luò)和大容量存儲(chǔ)的微型計(jì)算機(jī),各種翻譯工具也應(yīng)運(yùn)而生,如詞典和術(shù)語資料庫(kù)、多語文字處理、詞匯和術(shù)語資源的管理、信息傳遞的輸入和輸出。最近又新添了“翻譯記憶”功能,它能夠存儲(chǔ)已存在譯文,以便為再利用和修訂提供范例。
  這一時(shí)期的機(jī)器翻譯已經(jīng)逐步進(jìn)入了機(jī)器和人工相結(jié)合的階段,機(jī)助人譯(Computer-aided Machine Translation)和人助機(jī)譯(Human-aided Translation)相互結(jié)合,對(duì)各種類型和規(guī)模的翻譯做出了突出的貢獻(xiàn)。同時(shí)語料庫(kù)的發(fā)展和應(yīng)用為機(jī)譯提供了堅(jiān)實(shí)的理論和技術(shù)來源,機(jī)器翻譯進(jìn)入到嶄新的上升階段。
1.4我國(guó)機(jī)器翻譯的歷程
  我國(guó)的機(jī)器翻譯始于1956年,由于當(dāng)時(shí)與蘇聯(lián)的經(jīng)濟(jì)政治往來,我國(guó)對(duì)于機(jī)器翻譯的需求逐漸顯現(xiàn),中俄語言間的互譯催化了MT系統(tǒng)。80年代后,我國(guó)研制了KY-1和IMT/EC863兩個(gè)英漢機(jī)譯系統(tǒng),隨著計(jì)算機(jī)技術(shù)的成熟和發(fā)展,許多計(jì)算機(jī)公司研制出了一系列高科技的機(jī)譯軟件,如“譯星”、“雅信”、“通譯”、“科建”等。
  機(jī)器翻譯由簡(jiǎn)單到復(fù)雜,從初級(jí)到高級(jí),不斷進(jìn)行著理論和實(shí)踐的雙重革新。其發(fā)展歷程可概括為以下三代:第一代初級(jí)階段,利用機(jī)器翻譯詞匯,不進(jìn)行語法分析;第二代進(jìn)步階段,對(duì)句子的結(jié)構(gòu)和語義進(jìn)行分析;第三代人工智能階段,隨著心理學(xué),特別是認(rèn)知心理學(xué)的發(fā)展,人們認(rèn)為電腦可以復(fù)制人腦的信息處理機(jī)制,使機(jī)器翻譯更加智能化和自動(dòng)化。目前,各國(guó)學(xué)者正經(jīng)歷著第三階段,不斷地攻克各種難關(guān),提高機(jī)器翻譯的質(zhì)量和效率。
2機(jī)器翻譯的研究方法
  機(jī)器翻譯研究方法可以從兩個(gè)方面來敘述,一方面是語言學(xué)理論的應(yīng)用,另一方面是MT研究者們實(shí)際所從事的內(nèi)容。
2.1語言學(xué)的方法
  機(jī)器翻譯研究已經(jīng)被看作一個(gè)試驗(yàn)新的語言理論或新的計(jì)算技術(shù)的領(lǐng)域。換言之,MT已經(jīng)被視為語言理論的實(shí)驗(yàn)基礎(chǔ),因?yàn)榉g翻譯的質(zhì)量能由非專家來判斷。
  與之相關(guān)的理論有:20世紀(jì)50、60年代的信息理論、范疇語法、轉(zhuǎn)換生成語法、從屬語法和層次語法;70、80年代的人工智能、非語言知識(shí)基礎(chǔ),諸如詞匯功能語法、廣義短語結(jié)構(gòu)語法、中心詞驅(qū)動(dòng)短語結(jié)構(gòu)語法和蒙太古語法等形式主義理論;90年代的神經(jīng)系統(tǒng)網(wǎng)絡(luò)、連接主義、平行處理和統(tǒng)計(jì)學(xué)方法以及他理論?! ∪藗冞€發(fā)現(xiàn),那些以小樣本為基礎(chǔ),在最初的試驗(yàn)中取得成功的新理論,最終都被證實(shí)存在一些問題。為了解決這些問題,必須檢驗(yàn)一切有希望的方法并鼓勵(lì)修正。
  20世紀(jì)90年代初期,以語料庫(kù)為基礎(chǔ)的方法的出現(xiàn)使機(jī)器翻譯研究有所增強(qiáng),特別是引入了統(tǒng)計(jì)學(xué)方法和以實(shí)例為基礎(chǔ)的翻譯。統(tǒng)計(jì)學(xué)技術(shù)已經(jīng)擺脫了以前專門以規(guī)則為基礎(chǔ)(通常定位于句法)的方法的不足和它越來越明顯的限制。在以語料庫(kù)為基礎(chǔ)的技術(shù)幫助下,歧義消除的問題、首語重復(fù)的解決和更多慣用語的生成都已經(jīng)變得更容易駕馭。
2.2轉(zhuǎn)移法
  根據(jù)機(jī)器翻譯轉(zhuǎn)移理論的多數(shù)觀點(diǎn),在機(jī)器翻譯系統(tǒng)中有某種轉(zhuǎn)移成分。這種成分是特定的,從而一對(duì)語言可產(chǎn)生一個(gè)目標(biāo)句子。轉(zhuǎn)移成分有一個(gè)相應(yīng)的詞庫(kù),這是源語言的范式和短語映現(xiàn)于目標(biāo)語言的包羅萬象的清單(Napier,2000)。大量工作取決于對(duì)兩種語言具體比較的信息。這種轉(zhuǎn)移系統(tǒng)意味著,對(duì)每?jī)煞N語言來說便要翻譯,因此這種方法主張翻譯本質(zhì)上就是一種比較語言學(xué)的練習(xí)。由此可見,必須建立一個(gè)詞庫(kù)。
2.3語際法
  語際法基于這樣的理解:在一批語言的每?jī)煞N語言之間,只要求將每一個(gè)成語語言翻譯成中間語言(interlingua),再?gòu)闹虚g語言翻譯成某種語言。如果有n種語言,就需要n個(gè)成員被翻譯成目標(biāo)語言。但Arnold等(1995)對(duì)這種方法不以為然,認(rèn)為使用中間語會(huì)導(dǎo)致信息的丟失。
2.4基于知識(shí)的方法
  近來的趨勢(shì)是轉(zhuǎn)向基于知識(shí)的機(jī)器翻譯,這是由Carnegie Mellon大學(xué)與新墨西哥州立大學(xué)的語言研究中心創(chuàng)導(dǎo)的。Arnold等(1995)認(rèn)為需要3種知識(shí)來改進(jìn)機(jī)器翻譯系統(tǒng)。
 ?。?)不依賴語境的語言學(xué)知識(shí)(語義學(xué))。研究者將詞語和語義特征聯(lián)系起來,從而能對(duì)其他出現(xiàn)的詞語加以制約。
 ?。?)依賴語境的語言學(xué)知識(shí),有的成為語用知識(shí)(語用學(xué))。有多種方法處理語用學(xué)問題,其中之一是學(xué)習(xí)句子焦點(diǎn)的概念。
 ?。?)常識(shí)/真實(shí)世界的知識(shí)(非語言學(xué)知識(shí))
  前兩類是針對(duì)語言本身的,問題不是最大,計(jì)算機(jī)缺乏真實(shí)世界的知識(shí)才使研究人員苦惱不已。例如,計(jì)算機(jī)不能發(fā)現(xiàn)一個(gè)可吃的蘋果和個(gè)人計(jì)算機(jī)蘋果品牌之間的區(qū)別,也不能說明漢語中“山頂”的“頂”、“頂風(fēng)”的“頂”和“頂好”的“頂”的不同意義。多少年來,正是這樣的問題不僅困擾機(jī)器翻譯的理論家,也困擾神經(jīng)網(wǎng)絡(luò)和人工智能的研究者。
  隨著語料庫(kù)語言學(xué)的發(fā)展,最近研究者轉(zhuǎn)向基于例句的機(jī)器翻譯的研究。該方法將正確的翻譯作為信息資源,以建立新的翻譯作品。
3轉(zhuǎn)換生成語法――機(jī)器翻譯的語言學(xué)理論支撐
  機(jī)器翻譯作為一門交叉學(xué)科,涉及到多學(xué)科的理論支持,其中語言學(xué)為機(jī)器翻譯提供了文本的語法和語義的規(guī)范基礎(chǔ),尤其是美國(guó)語言學(xué)家諾姆?喬姆斯基 (Noam Chomsky)提出的轉(zhuǎn)換生成語法。該語法經(jīng)過不斷修正和改進(jìn),探索了人類語言的本質(zhì)、起源和人類普遍語法的深層機(jī)制。喬姆斯基提出表層結(jié)構(gòu)和深層結(jié)構(gòu)能夠?qū)φZ義進(jìn)行語法和句法分析。借由他的理論,可以對(duì)詞典中的詞條進(jìn)行描述,分析機(jī)器翻譯中的詞義,從而有效地避免語義錯(cuò)誤。喬姆斯基的理論給計(jì)算機(jī)科學(xué)的發(fā)展帶來了革命性的變化,也推動(dòng)了機(jī)器翻譯的發(fā)展。
4機(jī)器翻譯存在的問題
一是自然語言中普遍存在各種歧義、未知現(xiàn)象,以及層出不窮的新詞熱詞。歧義;導(dǎo)致歧義有兩個(gè)原因,一是自然語言中固有的歧義現(xiàn)象,包括詞匯歧義和語法歧義;另一個(gè)是由于語言、文化間的差異產(chǎn)生的歧義。一個(gè)句子如果有以上問題,就可能表達(dá)兩種或多種意思,容易給機(jī)器造成理解上的偏差和誤解。而是機(jī)器翻譯自身的局限,正如翻譯不應(yīng)該是單純字對(duì)字的轉(zhuǎn)換,理想的機(jī)器翻譯也并不是僅僅是字符串的轉(zhuǎn)換。機(jī)器翻譯是人工翻譯的模擬,它能幫助譯者完成大量簡(jiǎn)單的翻譯工作,但做不到像譯者那樣靈活。譯者可以根據(jù)原文、結(jié)合語境、自己的生活經(jīng)驗(yàn)、雙語知識(shí)和相關(guān)文化背景來對(duì)原文進(jìn)行理解,對(duì)原文進(jìn)行自由組合、增加或刪減,也可以適當(dāng)添筆修飾潤(rùn)色。在不違背原文又考慮到譯入語的情況下,譯者有足夠的翻譯自由。但機(jī)器翻譯不同,它的翻譯過程是建立在嚴(yán)密的邏輯程序基礎(chǔ)上的,它沒有思考、判斷、推理、修改的能力,機(jī)器翻譯永遠(yuǎn)不可能真正地替代譯者。
5解決方案
  機(jī)器翻譯如果想得到長(zhǎng)足的發(fā)展,必須采取一些相應(yīng)的措施。
5.1加強(qiáng)系統(tǒng)中詞典的研究
機(jī)器翻譯中的詞典是為語言處理程序提供源語言基本構(gòu)成元素所具有的各種相關(guān)詞法、語法、詞義、語義、語用、常識(shí)等方面信息,包括目標(biāo)語言的對(duì)譯關(guān)系的一個(gè)復(fù)雜特征信息集合。它是自然語言處理程序賴以對(duì)源語言進(jìn)行分析加工的主要信息來源。
面向機(jī)器翻譯的詞典配備各種語言學(xué)知識(shí)。例如固定搭配和固定句型的知識(shí)等。把固定搭配和固定句型等相對(duì)穩(wěn)定的英語用法以詞條的形式構(gòu)成專項(xiàng)典。該方法可有效地避免很大一部分的詞義選擇的錯(cuò)誤。還要加強(qiáng)詞典的結(jié)構(gòu)建設(shè),以便最優(yōu)地綜合利用詞中的信息, 對(duì)原語進(jìn)行分析加工處理。
5.2尋求復(fù)雜多義區(qū)分的途徑
多義區(qū)分是機(jī)器翻譯研究中最難解決的問題?,F(xiàn)有系統(tǒng)使用的方法一般都是通過深入分析原文輸入, 并把它轉(zhuǎn)化為不含多義性的一種內(nèi)部結(jié)構(gòu)表示,如帶有注釋或詞義作為終極節(jié)點(diǎn)語法分析樹。多義問題的解決,其關(guān)鍵在于如何通過對(duì)原語言的深入分析排除多義性。這就要求詞典提供盡可能全面的, 根據(jù)特定的上下文相關(guān)性選擇詞義的搭配、語用、語境等基本信息。這些信息可以語義限定的方式記載在詞典中。以序數(shù)詞為例,限定在一個(gè)英文句子中,當(dāng)序數(shù)詞之后出現(xiàn)1至12月份中的任何一個(gè)月份名稱時(shí),則該序數(shù)詞譯為相應(yīng)的基數(shù)詞加上“號(hào)”。
5.3重視系統(tǒng)中上下文相關(guān)處理
所謂上下文,一般是指一個(gè)語言結(jié)構(gòu)成分或意段的語法或語義屬性的選擇,與其上下文中的某一位置的結(jié)構(gòu)成分或意段的語法或語義特性的當(dāng)前值有關(guān)。在現(xiàn)有大多數(shù)實(shí)用文法系統(tǒng)中,這種成分之間的相關(guān)性只能解決規(guī)則內(nèi)成分的相關(guān)性,而規(guī)則外成分間的相互關(guān)系基本上都回避了。因此,根據(jù)自然語言的這種上下文相關(guān)性,分析總結(jié)自然語言中的上下文相關(guān)現(xiàn)象的各種規(guī)律,并使這些現(xiàn)象的處理能夠直接被結(jié)構(gòu)分析規(guī)則所支持,是完善MT系統(tǒng)的一個(gè)重要方面。
5.4設(shè)計(jì)強(qiáng)有力的文法體系
文法體系的設(shè)計(jì),應(yīng)打破以往以句法為主的局面,要充分發(fā)揮語義在體系中的主導(dǎo)作用。以基于語義的格語法和依存語法為理論基礎(chǔ)的文法體系,就曾在機(jī)器翻譯中顯示出獨(dú)特的優(yōu)勢(shì)。雖然,語義與句法相比變化更為復(fù)雜,但它可以成功地回避英漢語言間結(jié)構(gòu)上的差異。隨著計(jì)算機(jī)存儲(chǔ)量的增加和處理速度的提高,復(fù)雜的語義是可以被系統(tǒng)很好地解決的。英漢機(jī)器翻譯的實(shí)現(xiàn),是加強(qiáng)中國(guó)與世界聯(lián)系和合作的有效途徑。提高系統(tǒng)的譯文質(zhì)量要靠各方面專業(yè)人士的共同努力,尤其是不可忽視語言學(xué)者的參與。對(duì)現(xiàn)行系統(tǒng)中存在的諸多問題要給予足夠的重視。多設(shè)立專題研究,在考慮全局的條件下,把研究工作做深做細(xì),爭(zhēng)取各個(gè)有所突破。英漢機(jī)器翻譯不容忽視,相信隨著語言學(xué)理論和計(jì)算機(jī)技術(shù)的發(fā)展,英漢機(jī)器翻譯一定會(huì)逐步走向成熟。
6結(jié)語
機(jī)器翻譯自19世紀(jì)60年代以來,歷經(jīng)不同時(shí)期,目前雖已形成穩(wěn)定的發(fā)展模式,仍需要各方面的努力使之趨于完善。全球化、科技化日益發(fā)展的今天,國(guó)家間交流頻繁,機(jī)器翻譯的重要性愈加凸顯。然而,不成熟的機(jī)器翻譯體系還不能實(shí)現(xiàn)高質(zhì)量的純機(jī)器譯本,這需要計(jì)算機(jī)科學(xué)、語言學(xué)及其他相關(guān)學(xué)科的人員相互配合,不斷完善翻譯技術(shù)。期待在不久的將來,機(jī)器翻譯可以得到一個(gè)質(zhì)的飛躍,更好地服務(wù)社會(huì)生活的各個(gè)領(lǐng)域。

關(guān)鍵詞:

74
73
25
news
  • 網(wǎng)站
  • 營(yíng)銷
  • 設(shè)計(jì)
  • 運(yùn)營(yíng)
  • 優(yōu)化
  • 效率
  • 專注
  • 電商
  • 方案
  • 推廣
為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉