IBM 開源其 Granite AI 模型，釋放新世代商機

基於種種版權、法律及技術上的問題，開源大型語言模型（ LLM ）並不容易。一些公司如 Meta ，聲稱他們已經開源了他們的 LLM，實際進程卻遙不可及。但是，現在 IBM Granite 已經踏出這一步。

IBM通過使用來自公開可用數據集（例如GitHub Code Clean、Starcoder數據、公共代碼存儲庫和GitHub問題）的預訓練數據來進行 Granite 代碼的開源管理。簡而言之，IBM 不惜一切代價避免版權或法律問題。

Granite 代碼基模型是在3至4TB的代碼數據和自然語言代碼相關數據上進行訓練的。所有這些模型都根據 Apache 2.0 許可證進行研究和商業用途。正是最後一個詞 ——商業—— 阻止了其他主要的 LLM 進行開源。其他公司都不想分享他們的LLM好處。

但正如 IBM 研究首席科學家 Ruchir Puri 所說：「我們通過發布性能最高、成本最低的代碼 LLM ，改變了軟件生成 AI 領域，使開放社區能夠無限制地進行創新。」

正如 IBM 生態系統總經理 Kate Woolley 去年所說，Granite 模型不是「試圖迎合每個人的需求，幫助用家寫文章讚美他們的寵物。這是關於為我們希望企業使用的商業用例提供定制模型。具體而言，它們是為編程而設計的。」

為了降低開發人員使用的門檻，使用者可用 IBM 和 Red Hat的 InstructLab 作為接口來使用 Granite LLM。

除了 InstructLab，您可以使用 Ollma 打包在一個模型文件中在本地運行 LLM，簡而言之可以將其視為 LLM 的 Docker 。

因此，如果您的公司因法律原因而猶豫不決是否使用 AI 來構建程序，IBM剛剛提供了您需要改善軟件開發工作的開源工具。當中蘊含無限的商機，有待有先見之明的公司開發。