阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳
网友
2025-01-30 00:55:55
0

农历除夕夜,全球华人喜迎新春之时,纽约证券交易所的电子屏上,阿里巴巴美股股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后,是一场技术上的奇袭。

1月29日凌晨,阿里通义千问团队悄然上线了大模型Qwen2.5-Max,在多个权威基准测试中展现出与全球顶级模型比肩的性能。这是继DeepSeek之后,中国AI阵营在高性能、低成本技术路线上的又一重要突破。

市场人士分析称,此前过度聚焦DeepSeek,却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示,若阿里Qwen-2.5-max的性能超过V3,可以对其RL推理模型给予更大期待。

当阿里云展现出“强大模型+充足算力+完整云平台”的组合优势时,是否印证了类似去年北美云计算服务商的投资逻辑?如果美股因AI整体增值10万亿美元,中国AI资产的重估时机是否已至?

Qwen2.5-Max采用超大规模MoE(混合专家)架构,基于超过20万亿token的预训练数据。在MMLU-Pro、LiveCodeBench、LiveBench以及Arena-Hard等多个权威评测中,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩甚至领先的性能。阿里团队表示,随着后训练技术的进步,下一个版本将有望达到更高水平。

Qwen2.5团队同步发布了两个创新型号:Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。这些开源模型支持高达100万token的上下文窗口,成为业内首个达到此规模的公开可用模型。这些模型使用稀疏注意力,处理百万token输入的速度比传统方法快3到7倍,输出长度可达8000个token。

相关内容

阿里除夕夜抛出重磅新模型 ...
农历除夕夜,全球华人喜迎新春之时,纽约证券交易所的电子屏上,阿里巴...
2025-01-30 00:55:55

热门资讯

吴艳妮全锦赛夺冠 太霸气了! 【吴艳妮全锦赛夺冠】9月16日晚,在2024年全国田径锦标赛女子100米栏决赛中,田径名将吴艳妮以1...
台风贝碧嘉来袭 上海现紫红色天... 随着第13号台风“贝碧嘉”逐步逼近,上海的居民们在阵阵寒颤中翘首以待。白昼平和,仅风势略显强劲,而黄...
中国留学生晕倒被韩国女公交司机... 近日,一名中国留学生在韩国乘坐公交车时因低血糖突然晕倒。当时,54岁的女司机李诗英立即停车查看情况。...
儿子出租屋丢失夫妻原地守20多... 儿子出租屋丢失夫妻原地守20多年不敢离开!1998年5月的一天,艾尚洪在贵阳市环南巷摆摊卖米。那天上...
台上班族请假只为见马龙一面 希... 12月3日,大陆高校师生团上午赴台湾大学参访,奥运金牌乒乓球选手马龙一抵达,便被学生与大批粉丝热情包...
公园方回应网红断臂猴来福面部受... 近日,多名网友发布视频称,在贵阳黔灵山公园拍到网红猴“来福”嘴部受伤,引起社会广泛关注。12月2日,...
重庆多人将大量矿泉水倒入长江 ... 4月13日,一段拍摄于重庆长江边的视频在网络上引发关注。视频画面显示,十几箱矿泉水被放置在路边,多人...
德国汽车撞人事件已升致28人受... 当地时间2月13日,德国慕尼黑发生了一起汽车撞人事件。巴伐利亚州州长索德尔在现场举行的新闻发布会上表...
老师在女同事屋内装摄像头否认偷... 管某和谭某曾是同一学校的老师。某天早上,谭某看到管某的房屋钥匙后,将钥匙拿走并擅自进入管某的住房内安...
今天别忘了吃羊肉!这个日子有讲... 今天10时33分,我们迎来了小寒节气。虽然名字中有一个“小”字,但实际上一年中最寒冷的日子已经到来。...