據最新報道,谷歌計劃在即將到來的“谷歌 I/O”年度開發者大會上,以人工智能 (AI) 為主題,發布一系列重磅產品和技術成果。其中,備受期待的大型語言模型 (LLM) “PaLM 2”將以其強大的編程能力和超過100種語言的支持,引領人工智能應用的新篇章。
一、走進PaLM 2:谷歌最新的大型語言模型
內部文件顯示,谷歌將在這次大會上對外發布最新版本的大型語言模型“PaLM 2”。這個語言模型已經在谷歌內部進行試驗,測試代號為“統一語言模型(Unified Language Model)”。據悉,這一語言模型具有更高的“智商”,已經能夠編寫軟件代碼,完成數學考試,也能夠完成創意作文和分析方面的測試。而就在不久前,谷歌剛剛宣布要將 Bard 的輕量級 LaMDA 模型升級為更大規模的 PaLM 模型,使 Bard 在處理常識推理和編程問題等任務時能力更強。
對于即將發布的PaLM 2,谷歌期待它能夠進一步拓展AI的應用范圍,提高AI的實用性,以滿足不同用戶的需求。谷歌及其母公司 Alphabet 首席執行官 Sundar Pichai 將在此次大會上進行演講,介紹該公司在人工智能領域的最新進展。
二、與競爭對手的較量:人工智能領域的競爭加劇
此次谷歌的更新正值人工智能領域的競爭日益激烈之際。尤其是,谷歌和微軟都在競相將聊天人工智能技術融入自己的產品中。微軟正在借助對 ChatGPT 創建者 OpenAI 的投資來支持其必應搜索引擎,而谷歌則迅速行動起來,試圖在不同的團隊中整合其 Bard 技術,并推出自己的 LLM。
有文件顯示,谷歌還計劃分享 Bard 和搜索方面取得的進展,提供所謂的“生成式體驗”,包括將 Bard 用于編碼、數學和“邏輯”。另一份內部文件顯示,谷歌還在內部開發了一個名為“Multi-Bard”的多模態模型版本,它使用了更大的數據集,可以幫助解決復雜的數學和編碼問題。此外,谷歌還測試了名為“Big Bard”和“Giant Bard”的版本。
三、谷歌大模型PaLM2的代碼生成能力
PaLM 2 的發布無疑將成為大會的一個重要的亮點。谷歌于 2022 年 4 月首次宣布推出 PaLM Language 模型。此后,PaLM 的應用在這一年取得了很大的進展,今年 3 月,該公司推出了一款適用于 PaLM 的 API 以及一系列人工智能企業工具,稱這將幫助企業“通過簡單的自然語言提示生成文本、圖像、代碼、視頻、音頻等”。
上個月,谷歌稱其名為“Med-PaLM 2”的醫學 LLM 可以回答“專家醫生級別”的醫學檢查問題,準確率達 85%。這一結果令人震驚,顯示了大模型在特定領域的專業應用可能性。
PaLM 是谷歌基于 Pathways 系統訓練的一個 5400 億參數的大型語言模型,相比之下,Bard 的 LaMDA 模型使用了 1370 億個參數進行訓練。為了訓練這個模型,谷歌動用了 6144 塊 TPU,讓 Pathways 在兩個 Cloud TPU v4 Pods 上訓練 PaLM。
去年谷歌還發布了長達 83 頁的 Pathways 系統論文,論文作者陣容很強大,還包括了 BERT 之父 Jacob Devlin。作者之一 William Fedus 在 Twitter 上說,這個項目花了 1 年多的時間,跨了多個部門(基礎架構、數據、硬件等)。
這種強大的系統和算力投入帶來了驚艷的結果,PaLM 在許多非常困難的任務上顯示出了突破性的能力,包括語言理解、生成、推理和代碼等相關任務。
PaLM 使用英語和多語言數據集進行訓練,包括高質量的 web 文檔、書籍、維基百科、對話和 GitHub 代碼。研究者還創建了一個“無損(lossless)”詞匯表,它保留了所有空格(對于代碼來說尤其重要),將詞匯表之外的 Unicode 字符拆分成字節,并將數字拆分成單獨的 token,每個 token 對應一個數字。
因此,PaLM 在許多非常困難的任務上顯示出突破性的能力。在需要多步驟算術或常識推理的推理任務上,PaLM 能解決 GSM8K 中 58% 的問題,這是一個包含數千個具有挑戰性的小學水平數學問題的基準,這個得分接近 60% 的 9 到 12 歲兒童解決問題的水平。
在代碼生成方面,給定自然語言描述(文本到代碼)的情況下,PaLM 能很好地編寫代碼,將代碼從一種語言翻譯成另一種語言,以及修復編譯錯誤(代碼到代碼)。這一能力顯示了它在處理編程任務時的強大能力。
大模型相對小模型來說,可以更好地從其他編程語言和自然語言數據中實現遷移學習,所以具有 540B 參數的 PaLM 在單個模型中顯示了橫跨編碼任務和自然語言任務的強大性能,即使它在預訓練數據集中只有 5% 的代碼。
另外,谷歌還通過在純 Python 代碼數據集上微調 PaLM ,將模型性能進一步提高,谷歌稱之為 PaLM-Coder。對于給定的“DeepFix 示例代碼”修復任務,谷歌研究人員想讓大模型修改損壞的 C 程序,直到可以編譯成功,PaLM-Coder 540B 展示了令人印象深刻的性能,實現了 82.1% 的編譯率。這為修復軟件開發過程中出現的更復雜的錯誤提供了機會。
四、谷歌Bard將接入PaLM模型,提升編程語言能力
谷歌首席執行官 Sundar Pichai 在接受 Hard Fork 播客節目采訪時表示,谷歌語言模型助手 Bard 將從基于輕量級 LaMDA 模型升級為更大規模的 PaLM 模型。
此前,Bard 只能回答一些基本的編程問題,但如果用戶想要了解更高級的編程概念或技巧,Bard 就會遇到困難。為了解決這個問題,Pichai 表示,Bard 有必要接入更大的語言模型。接入 PaLM 模型后,Bard 在處理常識推理和編程問題等任務時能力會表現得更強。
接入 PaLM 模型后,Bard 的編程語言能力將得到大幅提升。PaLM(Pretraining and Autoencoding for Language Modeling)是一種基于自編碼器的大型語言模型,由谷歌 AI 實驗室提出。PaLM 模型能夠處理自然語言處理中更加復雜的任務,例如語言推理和情感分析等。
谷歌每年一度的開發者大會“谷歌 I/O”將于 5 月 10 日上午 10 點至下午 1 點(太平洋時間)舉行,我們將繼續關注谷歌 Bard 的動態,特別是關于大型模型編程語言能力提升方面的進展。這一進展將使得Bard 更加強大,有助于提高用戶在編程學習中的體驗和效率。
總的來說,谷歌的新語言模型 PaLM 2 的推出無疑是一個重大突破。它不僅在語言理解、生成、推理等方面顯示出了突破性的能力,更在編程方面展現出了強大的實力。它的出現將有望為全球的開發者帶來更多的便利,并進一步推動人工智能技術的發展。
然而,如此強大的技術也帶來了新的挑戰。如何確保這種新技術在不受監管的環境下不被濫用,是所有科技公司,甚至是全社會需要面對的問題。同時,如何在保護用戶隱私和數據安全的前提下,推動這種新技術的發展,也是一個需要解決的問題。
無論如何,PaLM 2 的出現無疑為人工智能領域帶來了新的可能性。我們期待看到,它將如何幫助人類實現全部潛能,如何推動人工智能技術的發展,以及如何影響我們的生活。