兰 亭 墨 苑
期货 · 量化 · AI · 终身学习
首页
归档
编辑文章
标题 *
URL 别名 *
内容 *
(支持 Markdown 格式)
阿里发布了 Qwen3.6-27B。27B 参数,Dense 架构,不是 MoE!原生支持 上下文,Apache-2.0 开源。官方给的数据很夸张:SWE-bench Verified 77.2,超过了 Qwen3.5-397B-A17B 这个 397B 参数的 MoE 旗舰。也就是说,参数量只有对方 1/15,但编码能力反而更好。这种模型跑分我通常不太信,得自己跑一下。我的设备,RTX 4090(24GB 显存,Windows,LM Studio 加载模型。用的是 Q4_K_M 量化版,体积大概在 16GB 出头。
配图 (可多选)
选择新图片文件或拖拽到此处
标签
更新文章
删除文章