微软推出 14B 参数最先进的小语言模型 Phi-4-电脑志

今年年初，微软推出了 Phi-3 系列小型语言模型。今天，微软又推出了Phi-4，这是一款 14B 参数的最先进的小型语言模型（SLM），在 MATH 和 GPQA 人工智能基准测试中甚至击败了 OpenAI 的 GPT-4 大型语言模型。

微软 Phi-4 模型

微软称，Phi-4 在数学相关推理方面的强劲表现得益于高质量合成数据集的使用、高质量有机数据的整理以及训练后的改进。用于训练的合成数据是通过多种技术生成的，包括多代理提示、自我修正工作流和指令反转，生成的合成数据构成了 Phi-4 训练数据的主体。在后期训练过程中，微软还使用了拒绝采样等技术来完善模型的输出。

在 Phi-4 技术论文中，微软还解决了通过网络泄露基准测试集的问题。微软改进了 Phi-4 的数据净化流程，以确保不会对评估结果产生不公平的影响。为了证实这一点，微软在 2024 年 11 月的 AMC-10 和 AMC-12 数学竞赛中测试了 Phi-4 模型，这些竞赛是在微软的训练数据收集之后进行的。

Phi-4 性能图表