基於種種版權、法律及技術上的問題, 開源 大型語言模型( LLM )並不容易。一些公司如 Meta ,聲稱他們已經開源了他們的 LLM,實際進程卻遙不可及。但是,現在 IBM Granite 已經踏出這一步。
IBM通過使用來自公開可用數據集(例如GitHub Code Clean、Starcoder數據、公共代碼存儲庫和GitHub問題)的預訓練數據來進行 Granite 代碼的開源管理。簡而言之,IBM 不惜一切代價避免版權或法律問題。
Granite 代碼基模型是在3至4TB的代碼數據和自然語言代碼相關數據上進行訓練的。所有這些模型都根據 Apache 2.0 許可證進行研究和商業用途。正是最後一個詞 ——商業—— 阻止了其他主要的 LLM 進行開源。其他公司都不想分享他們的LLM好處。
但正如 IBM 研究首席科學家 Ruchir Puri 所說:「我們通過發布性能最高、成本最低的代碼 LLM ,改變了軟件生成 AI 領域,使開放社區能夠無限制地進行創新。」
正如 IBM 生態系統總經理 Kate Woolley 去年所說,Granite 模型不是「試圖迎合每個人的需求,幫助用家寫文章讚美他們的寵物。這是關於為我們希望企業使用的商業用例提供定制模型。具體而言,它們是為編程而設計的。」
為了降低開發人員使用的門檻,使用者可用 IBM 和 Red Hat的 InstructLab 作為接口來使用 Granite LLM。
除了 InstructLab,您可以使用 Ollma 打包在一個模型文件中在本地運行 LLM,簡而言之可以將其視為 LLM 的 Docker 。
因此,如果您的公司因法律原因而猶豫不決是否使用 AI 來構建程序,IBM剛剛提供了您需要改善軟件開發工作的開源工具。當中蘊含無限的商機,有待有先見之明的公司開發。