2025白菜网官网入口-博一吧论坛免费白菜大全-999全讯白菜网-三度白菜网论坛

新聞信息 Product Center

聯絡我們 Contact Us

全國免費銷售熱線
24小時熱線：13910836570
話機：010-61705388/996
010-61705119/109
郵箱 :sale@wispower.com
位置：北京市昌平區昌平路97號新元科技園D座C門3層
偉仕QQ咨詢1  (1165945893)
偉仕QQ咨詢2  (2440920865）
偉仕QQ咨詢3  (1604294231）
偉仕QQ咨詢4  (1923434741）

作者：發布時間： 2024-11-06 閱讀： 0

11月5日消息，近日，摩爾線程上線了大語言模型高速推理框架開源項目vLLM的MUSA移植版本，為開發者供應基於摩爾線程全性能GPU進行開源項目MUSA移植的範例。

摩爾線程表示，正努力圍繞自主研制的統一系統架構GPU、MUSA軟件平臺，構建完善好用的MUSA應用生態。

vLLM是一個高效且易用的大模型推理和效勞框架，幫助創新的PagedAttention內存管理、連續批處理請求、CUDA/HIP圖的快速模型執行、CUDA核心優化、分布式推理幫助等，可顯著提高大語言模型(LLM)的推理性能。

目前，vLLM已在各種大語言模型中得到廣泛應用，成為業界常用的開源大模型推理框架。

摩爾線程基於vLLM v0.4.2版本，進行了移植適配，使之幫助摩爾線程GPU後端Device，並完全開源，開發者可以二次開發、升級vLLM到社區更新版本等。