傳說中的新版Google翻譯到底有多厲害??
谷歌翻譯是目前世界上使用最廣泛的翻譯產品,支持90種語言之間的翻譯,包括阿拉伯語、英語、法語、德語、漢語和西班牙語等所有流行語言。據《紐約時報》報道,目前web、iOS、Android等各種平臺的月活躍用戶已經超過5億,僅Android中的Google Translation Application(非預裝應用)下載安裝量就達到1億。
在機器翻譯領域,主要有三類翻譯技術,即“基于規則的”、“基于統計的”和混合的。其中,谷歌屬于“統計型”,可以通過用戶直接搜索的翻譯結果、網頁內容的爬行翻譯等多種渠道獲取大量語料庫資源進行深度學習,從而逐漸獲得一種理解兩種語言之間如何匹配的能力,并將這種能力作為服務提供給用戶。
顯然,谷歌翻譯的服務水平已經達到了一個新的水平。如果把自己安裝了谷歌翻譯的手機當成一個人,其實ta已經成為了一個翻譯效率高的電子翻譯器。然而,谷歌翻譯之前并沒有給很多人留下很好的印象。比如那些出現在交通標志、超市甚至廁所上的可笑翻譯,往往被吐槽為“谷歌翻身”的結果。人們不禁感嘆:谷歌這么強大的公司,連一臺電腦都翻不過來?
一位前谷歌翻譯團隊科學家告訴記者,即將發布的新翻譯產品谷歌背后的研發遠比預期復雜。
<愛尬聊_百科知識>過去,谷歌翻譯功能背后的主要技術是機器翻譯。后來隨著安卓和iOS操作系統的發展,移動終端支持語音輸入,引入了語音識別。“機器翻譯和語音識別在技術上是分開的產品,背后使用了許多自然語言處理(NLP)和‘深度學習’的基礎技術。”專家說。
專家認為,從目前媒體報道和業內了解到的信息來看,全新的Google Translation是一款集機器翻譯和語音識別于一體的產品。“從技術角度來說,谷歌早就應該可以推出這個功能了(編者按:指語音識別和實時翻譯),但是到現在還沒有出來,可能還有一些其他的考慮。總的來說,這兩種技術的集成需要大量的優化,而不是簡單的拼湊。”
也即意味著,新版Google翻譯是Google的機器翻譯技術和語音識別技術進行了系統性的整合之后投產的結果,將能夠代表Google在自然語言處理方面的深度學習所取得的進展,以及其商業化能力。提到的前谷歌科學家指出,在他任職期間(兩年前),谷歌的翻譯技術已經處于行業領先水平。近兩年來,谷歌在深度學習方面取得了突出的進步,因此有理由(相對安全)相信谷歌基于深度學習的翻譯服務背后的技術仍能代表行業最高水平。
當然,人們可能對谷歌翻譯技術有多強大沒有太多的認知。他們能感知到的是,他們不應該把干貨變成混賬貨。