阿里云發(fā)布通義千問2.5 全面趕超GPT-4 Turbo
- 來源:快科技
- 作者:3DM整理
- 編輯:方形的圓
快科技5月9日消息,阿里云正式發(fā)布了通義千問2.5,模型性能全面趕超GPT-4 Turbo,聲稱地表最強中文大模型。
據(jù)了解,通義千問2.5最新開源的1100億參數(shù)模型在多個基準(zhǔn)測評中均取得了最佳成績,成功超越了Meta的Llama-3-70B模型,成為開源領(lǐng)域的新標(biāo)桿。
相比通義千問2.1版本,通義千問2.5在上述四項能力上分別提升了9%、16%、19%和10%,其中中文能力更是持續(xù)領(lǐng)先業(yè)界。
在權(quán)威基準(zhǔn)OpenCompass上,通義千問2.5的得分追平了GPT-4 Turbo,這是該基準(zhǔn)首次有國產(chǎn)大模型取得如此出色的成績。這一成績不僅證明了通義千問2.5在中文語境下的卓越性能,也展示了阿里云在人工智能領(lǐng)域的創(chuàng)新能力。
除了通義千問2.5外,阿里云還發(fā)布了最新款開源模型Qwen1.5-110B。這款擁有1100億參數(shù)的模型在MMLU、TheoremQA、GPQA等基準(zhǔn)測評中均超越了Meta的Llama-3-70B模型,并在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上榮登榜首,進一步鞏固了通義開源系列在業(yè)界的領(lǐng)先地位。
通義的多模態(tài)模型和專有能力模型也展現(xiàn)出了業(yè)界頂尖的影響力。其中,通義千問視覺理解模型Qwen-VL-Max在多個多模態(tài)標(biāo)準(zhǔn)測試中超越了Gemini Ultra和GPT-4V,目前已在多家企業(yè)落地應(yīng)用,為各行各業(yè)帶來了實質(zhì)性的幫助。
此外,通義千問代碼大模型CodeQwen1.5-7B也是值得一提的亮點。這款模型在HuggingFace代碼模型榜單Big Code上位居前列,同時還是國內(nèi)用戶規(guī)模第一的智能編碼助手通義靈碼的底座。
玩家點評 (0人參與,0條評論)
熱門評論
全部評論