Google 最新開放的 AI 產品 Gemma 旨在讓幾乎所有開發人員都能使用,但嚴格遵守該公司的 AI 原則。在 OpenAI 的文字轉影片模型 Sora 上週主導新聞報導後,Google 現在推出了 Gemma,這是其最新的開放人工智慧 (AI) 產品。
在過去幾個月中,Google 已經推出了 Gemini 模型,這些模型多是大型和中型的,用於執行複雜任務。然而,新推出的 Gemma 是一款輕量化、小型的模型,旨在幫助全球開發人員負責任地建構 AI,並遵守 Google 的 AI 原則。
什麼是 Gemma?
Gemma 是一系列輕量化的最先進開放模型,採用 Google DeepMind 和 Google 其他團隊在 Gemini 模型中使用的相同研究和技術建構而成。Google 表示,它的名稱源自拉丁語「gemma」,意為寶石。
Gemma 提供兩種模型大小:Gemma 2B 和 Gemma 7B – 已經發布預先訓練和指令調整的版本。除了 Gemma 之外,Google 還發布了一個新的生成式 AI 工具組,提供指導和必要的工具,以便使用 Gemma 建構更安全的 AI 應用程式。
對於開發人員,Google 提供跨主要架構(例如 JAX、PyTorch 和 TensorFlow)的推理和監督微調 (SFT) 工具鏈,並透過原生 Keras 3.0 提供。該模型附帶即用型 Colab 和 Kaggle 筆記本,以及與 Hugging Face、NVIDIA、NeMo、MaxText 和 TensorRT-LLM 等熱門工具的整合。
這些整合讓幾乎任何開發人員都可以開始使用 Gemma。根據 Google 在 Gemma 發布聲明中的官方說法,該公司預計會讓 AI 模型實現「民主化」。
Gemma 的效能如何?
Google 表示,Gemma 與 Gemini 共享一些關鍵技術和基礎架構元件,Gemini 是迄今為止功能最強大的 AI 模型。此外,基於其底層技術,Gemma 2B 和 Gemma 7B 都能針對其大小實現「同級最佳效能」。
據報導,Gemma 在關鍵基準測試中優於明顯更大的模型,同時符合安全和負責任輸出的嚴格標準。
Google 分享了 Gemma 7B 在推理、數學和程式碼等領域與 Meta 的 Llama 2 7B 相比獲得的分數清單。在推理方面,Gemma 在 BBH 基準測試中獲得 55.1 分,而 Llama 2 獲得 32.6 分。同樣地,在數學方面,Gemma 在 GSM8K 中獲得 46.4 分,而 Llama 2 獲得 14.6 分。在數學複雜問題求解方面,該模型也超越了 Llama 2,Gemma 在 MATH 4-shot 基準測試中獲得 24.3 分,而 Llama 2 獲得 2.5 分。在 Python 程式碼產生方面,Gemma 獲得 32.3 分,而 Llama 2 獲得 12.8 分。
「Gemma 是負責任的」:這是什麼意思?
Google 聲稱 Gemma 是根據其 AI 原則設計的。這家科技巨頭表示,為了讓 Gemma 預先訓練的模型安全可靠,他們使用自動化技術從其訓練集中過濾掉某些個人資訊和敏感資料。
Google 還根據人類回饋微調了 Gemma 的模型,以促進負責任的行為,並進行了徹底的評估,包括手動和自動化測試,以將風險降到最低。
除此之外,Google 還提供一個工具組與 Gemma 搭配使用,以幫助開發人員在 AI 應用程式中優先考慮安全性。此工具組隨附建構安全分類器、除錯工具和基於 Google 在開發大型語言模型方面的經驗提供的指南。