阿里巴巴(09988.HK) +2.500 (+2.142%) 沽空 $6.57亿; 比率 13.730% 通义千问於内地微讯发布更小尺寸新模型——Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 。
帖文指,今次大幅提升新模型性能。在非推理领域,Qwen3-4B-Instruct-2507 全面超越了闭源的 GPT4.1-Nano;在推理领域,Qwen3-4B-Thinking-2507能够和中等规模的 Qwen3-30B-A3B (thinking)媲美。
通义千问相信, 小型语言模型(SLM)对代理式人工智能(Agentic AI)的发展极具价值。「2507」版本的 Qwen3-4B 模型不但体积小,而且性能强,同时有利於手机等端侧硬件部署,期待更多的AI硬件采用Qwen3-4B-2507新模型系列。目前新模型已在魔搭社区、Hugging Face正式开源。(ca/u)
(港股报价延迟最少十五分钟。沽空资料截至 2025-08-07 12:25。)
AASTOCKS新闻