1月16日,國內大模型“六小虎”之一的階躍星辰發布自研推理模型Step Reasoner mini。在AIME和Math等數學基準測試上與OpenAI o1-mini水平相當。

據介紹,Step Reasoner mini是Step系列模型家族的首個推理模型,擅長主動進行規劃、嘗試和反思,能通過慢思考和反復驗證的邏輯機制,提供準確可靠的回復。在處理邏輯推理任務時,模型會自主進行多種解題思路的嘗試,在得到初步答案后,會自我反問嘗試有沒有其他可能性,確保枚舉出所有效果良好的解決方案,并在交卷前檢查有無遺漏;還可以處理復雜開發需求,逐步分析用戶需求和意圖,構建代碼邏輯,在代碼寫作中穿插對當前代碼片段的分析和驗證,最終給到可執行的代碼。
階躍星辰還透露,要將推理能力融入更多交互形態的大模型中,目前已引入了慢感知和空間推理思想,打造視覺推理模型,預計將于今年發布。