小米發佈及開源聲音理解大模型MiDashengLM-7B

2025-08-03 21:09:00

據內媒報道，小米今日（4日）發佈及全量開源聲音理解大模型MiDashengLM-7B。根據介紹，新模型在速度精度上實現突破，單樣本推理的首Token延遲僅為同類模型四分之一、同等顯存下數據吞吐效率是業界先進模型的20倍以上，並在22個公開評測集上刷新多模態大模型最佳成績（SOTA）。

該模型基於Xiaomi Dasheng作為音訊編碼器和Qwen2.5-Omni-7B Thinker作為自回歸解碼器，透過創新的通用音訊描述訓練策略，實現了對語音、環境聲音和音樂的統一理解。

即時財經

富衛推指數型萬用壽險攻專業投資者派息率無上限

周大福創建旗下中鐵聯集首度亮相鏈博會鄭志明親身參與

中電半年少賺5.5% 派息0.63元本港平均淨電價下調1.9%

港元拆息全線回落 1個月Hibor報0.94厘

蘋果應對關稅影響 iPhone 17料加價近5% Pro機售價或首逾1000美元

花樣年提新債務重組方案選項涉及債轉股控股股東提供600萬美元貸款

印度強硬回應特朗普關稅威脅籲國人買國貨料無意停購俄羅斯石油

影星趙薇持3間公司股權再被凍結涉資近1600萬

騰訊有一天可見1600元？｜曾淵滄

OPEC+據報9月起增產助抑制油價上漲

更多