Google 搜尋能力進化 數秒辨識800種疫苗用語
Google推出語言模型新工具MUM,可在幾秒鐘內辨識出800種以上、超過50種語言用來稱呼疫苗的詞語,幫助使用者在Google搜尋中找到COVID-19(2019冠狀病毒疾病)疫苗的可靠資訊。
Google搜尋研究員暨副總裁納雅克(Pandu Nayak)在官方部落格發文說,根據Google的分析,AstraZeneca、CoronaVac、Moderna、Pfizer、Sputnik 等廣泛使用的疫苗,在全世界共有超過800種名稱。使用者搜尋疫苗資訊時,可能會使用Coronavaccin Pfizer、mRNA-1273、CoVaccine等各式各樣的關鍵字。
納雅克強調,Google是否能正確識別所有疫苗名稱,對於使用者能否獲得可靠的最新疫苗資訊至關重要。然而,想辨識出全球使用者對於疫苗的不同稱呼,就得付出大量的時間成本,以人工而言需要幾百小時。
現在有了MUM(Multitask Unified Model),Google可以在短短幾秒鐘內辨識出800種以上、超過50種語言用來稱呼疫苗的詞語。納雅克表示,在驗證MUM的搜尋結果後,Google已能將這個模型應用在Google搜尋服務中,幫助使用者找到全世界有關COVID-19疫苗的資訊。
MUM之所以能在幾秒內完成一項原本需要數週時間的工作,是因為具有知識轉移能力。納雅克說,MUM能夠從本身接受訓練的超過75種語言中學習並轉移知識。以閱讀一本書為例,如果一個人會多種語言,就可以在閱讀後用自己會的其他語言來分享書中重點,MUM對於不同語言知識的轉移也很類似這樣的概念。
納雅克指出,這種跨語言遷移學習能力,可以幫助Google快速擴展系統改善,這在一定程度上要歸功於MUM的樣本效率;相較於之前的模型,MUM在完成同一件工作時需要的資料量大幅減少。以疫苗名稱來說,只需要一小部分官方疫苗名稱作為樣本,MUM就能快速識別這是疫苗在不同語言間的名稱。
Google期待MUM在未來可以透過多種方式,讓Google搜尋變得更實用。納雅克說,Google早期的測試結果顯示,MUM不僅可以在許多面向上改進Google現有的系統,還可以幫助打造全新的方式來探索和搜尋資訊。
本新聞授權來自中央通訊社 cna.com.tw
.