
階躍星辰 Step 3.5 Flash 榮登 OpenRouter Trending 榜首,不僅驗(yàn)證了該模型作為技術(shù)黑馬在高吞吐與復(fù)雜推理場(chǎng)景下的強(qiáng)勁實(shí)力,更彰顯了其作為兼具極致性能與穩(wěn)定性的實(shí)戰(zhàn)首選地位作為面向?qū)崟r(shí) Agent 工作流場(chǎng)景的模型,Step 3.5 Flash 在推理效率上表現(xiàn)突出,最高推理速度可達(dá)每秒 350 個(gè) token。該模型款稀疏混合專家(MoE)架構(gòu),在保持較為精巧的1960總參數(shù)量的同時(shí),每個(gè) token 在處理過(guò)程中僅需激活約 110 億個(gè)參數(shù),在保障模型性能的同時(shí)實(shí)現(xiàn)運(yùn)行效率的優(yōu)化,從而彌合前沿級(jí)智能體智能與計(jì)算效率之間的鴻溝。
在官方發(fā)布的Step 3.5 Flash Tech Report里顯示,該模型聚焦于構(gòu)建智能體的精準(zhǔn)推理能?以及快速可靠的執(zhí)行效率。Step 3.5 Flash 通過(guò)交錯(cuò)的 3:1 滑動(dòng)窗口/全注意力機(jī)制(Sliding Window/Full Attention)和多 Token 預(yù)測(cè)(MTP-3)進(jìn)行優(yōu)化,以最小化多輪智能體交互的延遲和成本。為實(shí)現(xiàn)前沿級(jí)智能,Step 3.5 Flash 還采用了可擴(kuò)展的強(qiáng)化學(xué)習(xí)(RL)框架,推動(dòng)模型在數(shù)學(xué)、代碼和?具使用等領(lǐng)域持續(xù)自我提升。
Step 3.5 Flash 在智能體、編碼和數(shù)學(xué)任務(wù)中展現(xiàn)出卓越性能:在 IMO-AnswerBench 上達(dá)到 85.4% 的準(zhǔn)確率,在 LiveCodeBench-v6(2024.08?2025.05)上達(dá)到 86.4%,在 τ2-Bench 上達(dá)到 88.2%,在 BrowseComp(含上下文管理)上達(dá)到 69.0%,在 Terminal-Bench 2.0 上達(dá)到 51.0%——其性能與 GPT-5.2 xHigh、Gemini 3.0 Pro 等前沿模型相當(dāng)。通過(guò)重新定義效率邊界,Step 3.5 Flash 為在真實(shí)工業(yè)環(huán)境中部署復(fù)雜智能體提供了高密度基礎(chǔ)。
Step3.5Flash 僅1960億總參數(shù)、110億激活參數(shù),就能做到與前沿“巨模”在推理能力、智能體能力上性能相當(dāng)。

上圖:Step 3.5 Flash 僅需 110 億激活參數(shù)(1960 億 MoE 總參數(shù))即可實(shí)現(xiàn)前沿級(jí)智能,性能比肩主流閉源和開源模型。
責(zé)任編輯: 江曉蓓