微軟在其翻譯服務(wù)Translator中,又加入12種新語言和方言,包括巴什基爾語、迪維希語、藏語、土庫(kù)曼語、維吾爾語和烏茲別克語等,當(dāng)前全球總共有8,460萬人使用這些語言。微軟提到,在加入12種語言之后,Translator已經(jīng)可以支援100種語言,語言復(fù)蓋人數(shù)達(dá)到56.6億人。
由于主流語言資源多,因此翻譯服務(wù)要提供像是英語、華語、印地語、阿拉伯語和西班牙語,相對(duì)簡(jiǎn)單許多,而近年來由于技術(shù)的進(jìn)步,人工智慧技術(shù)也逐漸可以對(duì)資源匱乏或是瀕臨滅絕的語言,提供翻譯服務(wù)。
微軟的機(jī)器翻譯服務(wù),使用一種稱為Z-code的多語言人工智慧模型,該模型能夠結(jié)合同一家族語言,像是印地語、馬拉地語和古吉拉特語等印度語,透過讓各個(gè)語言模型相互學(xué)習(xí),降低達(dá)到高品質(zhì)翻譯所需要的資料量。微軟舉例,當(dāng)翻譯模型使用相關(guān)的法語、葡萄牙語、西班牙語和義大利語資料一起訓(xùn)練,羅馬尼亞語的翻譯品質(zhì)會(huì)得到提升。
微軟提到,借由共通性和遷移學(xué)習(xí),能同時(shí)改進(jìn)整個(gè)語言家族的翻譯品質(zhì),而且減少資料需求,對(duì)資源有限或是母語人口減少,而瀕臨滅絕的語言,得以建立語言模型。