Llama Stack – 專注於機器學習模型部署和優化的框架

691次閱讀

Llama Stack 簡介

Llama Stack 是一個專注於機器學習模型部署和優化的框架，是用於構建生成式人工智慧（Generative AI）應用程式的標準化模組化 API 規範。它定義了從模型訓練、微調，到產品評估，再到在生產環境中運行 AI 代理所需的各種構建模組。這些 API 涵蓋了推理（Inference）、安全（Safety）、記憶（Memory）、智能體系統（Agentic System）、評估（Evaluation）、訓練後處理（Post Training）、合成數據生成（Synthetic Data Generation）和獎勵評分（Reward Scoring）等關鍵元件。

Llama Stack - 專注於機器學習模型部署和優化的框架

Llama Stack 不僅提供了 API 規範，還在構建開源的 API 提供者（Provider），並與各種供應商合作，確保開發者能夠使用一致且可互操作的元件在不同平台上構建 AI 解決方案。例如，對於推理 API，可以選擇 PyTorch、vLLM 或 TensorRT 等開源庫作為後端實現。

除了 API 提供者，Llama Stack 還提供了發行版（Distribution），將 API 和提供者組裝在一起，為應用程式開發者提供一致的整體解決方案。開發者可以混合搭配不同的提供者，例如在本地使用小型模型，但為大型模型選擇雲端供應商。無論選擇何種組合，高階應用程式介面保持不變。

Llama Stack 開源地址

開源地址：https://github.com/meta-llama/llama-stack

正文完

发表至：電腦教程

2024-10-25

0

notepad– : 開源文字編輯器

docker-kms：基於 Docker 的 KMS 伺服器映像檔

Mac Launchpad啟動台圖示刪除不了怎麼辦 (附三個解決辦法)

ANTO- 字幕翻譯的軟體

superfile – 終端檔案管理器

BananaBin – 提醒你及時清理Mac電腦回收站的工具

PairDrop – 跨平台檔案傳輸助手（開源免費）

Notes – 開源免費跨平台筆記軟體

妙言 – Mac的 Markdown 筆記軟體

分析師預測蘋果 iPhone 17 Pro Max 將採用動態島 2.0

評論（尚無留言）