法国AI创企Mistral AI近日宣布推出两款新AI模型,面向程序员与开发人员的代码生成模型Codestral Mamba 7B,以及专为数学相关推理与科学发现设计的Mathstral 7B。Codestral Mamba 7B以其更快的推理速度与更长的上下文处理能力脱颖而出。即使在输入文本较长的情况下,也能提供快速响应时间。该模型能处理多达...
明星AI独角兽Mistral AI亮出大模型新王炸,代码和数学能力超群
法国AI创企Mistral AI近日宣布推出两款新AI模型,面向程序员与开发人员的代码生成模型Codestral Mamba 7B,以及专为数学相关推理与科学发现设计的Mathstral 7B。
Codestral Mamba 7B以其更快的推理速度与更长的上下文处理能力脱颖而出。即使在输入文本较长的情况下,也能提供快速响应时间。该模型能处理多达256000个token的输入,是GPT-4o的两倍。
Mathstral 7B则专注于数学推理与科学发现。该模型具有一个32K上下文窗口,并采用Apache 2.0开源许可证。它在具有更多推理时间计算的基准上,获得了优于其他数学推理模型的效果,并具备微调功能。
Mistral AI测试了Codestral Mamba 7B,在HumanEval等基准测试中,表现优于其他开源模型,如CodeLlama 7B、CodeGemma-1.17B与DeepSeek。
Mathstral 7B作为专为数学推理与科学发现设计的模型,具有32K上下文窗口,优于其他为数学推理设计的模型,并在更多推理时间计算的基准上获得“明显更好的结果”。用户可以按原样使用或进行微调。
Mistral AI强调,Codestral Mamba 7B与Mathstral 7B展示了为特定目的构建模型时的出色性能,以及在la Plateforme中的积极开发理念。
这些模型的推出,不仅体现了AI工具的专业化趋势,也突显了开源AI的重要性。它们通过提供强大的AI工具,进一步推进了AI大模型领域的迅速迭代与发展。2024-10-26