2023-07-19
INSIDE 硬塞的網路趨勢觀察 Chris
INSIDE 硬塞的網路趨勢觀察 Chris

shutterstock
Meta 新版 AI「Llama 2」登場!攜手微軟、AWS、高通,能打贏 GPT-4 嗎?
2023-07-19
INSIDE 硬塞的網路趨勢觀察
Chris

收藏
已完成
已取消
{
clearTimeout(timeout);
shown = true;
timeout = setTimeout(() => { shown = false }, 7000);
}"
x-show.transition.out.opacity.duration.1500ms="shown" x-transition:leave.opacity.duration.1500ms x-cloak
class="text-sm text-gray-600">
前往收藏資料夾

社群鉅子 Meta 發表最新版大型語言模型 Llama 2,而且意外的是,竟然是跟原本的競爭對手微軟合作,Llama 2 第一時間就可以在微軟 Azure 雲上使用!更值得一提的是,Llama 2 不僅開源,還具有授權商業使用的許可,這就意味著許多企業、新創在使用 Llama 2 時可以更不用擔心是否能商用的問題。除了微軟 Azure 之外,Llama 2 也可以在 AWS、Hugging Face 或其他平台上使用。
Llama 2 的訓練量比前一代多出 40%,依資料量還能細分為 3 個版本:70 億參數、130 億和 700 億,其預訓練模型甚至接受了約 2 兆個 token 進行訓練,並經過超過 100 萬人次人類註釋微調。
除了單純的大型語言模型之外,Meta 也把「ChatGPT」式的雙向對話型機器人機器人 Llama 2-chat 的初始版本訓練好了,並且接下來還會使用人類反饋強化學習 (RLHF) 進行迭代強化。
除此之外,Meta 還跟高通緊密合作,打算在 2024 時把 Llama 2 導入高階 Snapdragon,讓旗艦智慧型手機、 PC 等終端裝置不用連線到雲端就可以使用大型語言模型;最終目標則是擴展到讓 VR / AR、汽車等可以直接使用 Llama 2 的 AI 功能。
但根據外媒報導,Llama 2 的表現略遜於競爭對手 GPT-4 和 PaLM 2,特別在寫程式碼上明顯落後於 GPT-4,不過, Llama 2 甚至可以用表情符號回答問題(果然是做社群起家的)。但就跟眾多語言模型一樣,Meta 強調 Llama 2 不可能涵蓋所有現實世界的使用場景,而且還是可能會亂說話、或不以為意說出有問題的回答。
(本文出自 INSIDE 硬塞的網路趨勢觀察)
繼續閱讀
時事觀點