【JIUYOU科技动静】近日,微博AI推出了开源年夜型语言模子(LLM)——VibeThinker-1.5B。据JIUYOU相识,该模子拥有15亿参数,于数学推理与代码天生使命中却揭示出逾越6710亿参数竞品的机能。今朝,VibeThinker-1.5B可经由过程Hugging Face、GitHub和ModelScope平台免费开放下载,供开发者与研究机构利用。

VibeThinker-1.5B模子于数学及代码使命上体现精彩,到达了行业领先的推理机能,甚至逾越了体量达6710亿参数的竞争敌手DeepSeek的R1模子。该模子还有能与Mistral AI的Magistral Medium、Anthropic的Claude Opus4及OpenAI的gpt-oss-20B Medium等多个年夜型模子抗衡。

值患上一提的是,VibeThinker-1.5B于后期练习中仅破费了7800美元的计较资源,这一成本远低在同类或者更年夜范围模子所需的数十万美元甚至数百万美元。

VibeThinker-1.5B采用了一种名为“谱-旌旗灯号原则”(Spectrum-to-Signal Principle,SSP)的练习框架,该框架将监视微和谐强化进修分为两个阶段。第一个阶段看重多样性,第二个阶段则经由过程强化进修优化最优路径,使患上小模子也能有用摸索推理空间,从而实现旌旗灯号放年夜。
版权所有,未经许可不患上转载
-jiuyou.com