明星AI独角兽Mistral AI亮出大模型新王炸,代码和数学能力超群

法国AI创企Mistral AI近日宣布推出两款新AI模型,面向程序员与开发人员的代码生成模型Codestral Mamba 7B,以及专为数学相关推理与科学发现设计的Mathstral 7B。Codestral Mamba 7B以其更快的推理速度与更长的上下文处理能力脱颖而出。即使在输入文本较长的情况下,也能提供快速响应时间。该模型能处理多达...
明星AI独角兽Mistral AI亮出大模型新王炸,代码和数学能力超群
法国AI创企Mistral AI近日宣布推出两款新AI模型,面向程序员与开发人员的代码生成模型Codestral Mamba 7B,以及专为数学相关推理与科学发现设计的Mathstral 7B。

Codestral Mamba 7B以其更快的推理速度与更长的上下文处理能力脱颖而出。即使在输入文本较长的情况下,也能提供快速响应时间。该模型能处理多达256000个token的输入,是GPT-4o的两倍。

Mathstral 7B则专注于数学推理与科学发现。该模型具有一个32K上下文窗口,并采用Apache 2.0开源许可证。它在具有更多推理时间计算的基准上,获得了优于其他数学推理模型的效果,并具备微调功能。

Mistral AI测试了Codestral Mamba 7B,在HumanEval等基准测试中,表现优于其他开源模型,如CodeLlama 7B、CodeGemma-1.17B与DeepSeek。

Mathstral 7B作为专为数学推理与科学发现设计的模型,具有32K上下文窗口,优于其他为数学推理设计的模型,并在更多推理时间计算的基准上获得“明显更好的结果”。用户可以按原样使用或进行微调。

Mistral AI强调,Codestral Mamba 7B与Mathstral 7B展示了为特定目的构建模型时的出色性能,以及在la Plateforme中的积极开发理念。

这些模型的推出,不仅体现了AI工具的专业化趋势,也突显了开源AI的重要性。它们通过提供强大的AI工具,进一步推进了AI大模型领域的迅速迭代与发展。2024-10-26
mengvlog 阅读 7 次 更新于 2025-07-21 03:44:56 我来答关注问题0
  •  文暄生活科普 英伟达Mistral炼出新模型:12B小杯、128k上下文,性能超过Llama 3 8B

    英伟达与法国AI独角兽Mistral联合发布了名为Mistral NeMo的小杯模型,旨在提供性能优越、部署便捷、安全性高的企业级AI功能。Mistral NeMo的参数大小为120亿,具备128k的超大上下文窗口,相较于同量级开源模型,具备最先进的推理、世界知识和代码能力,对多种语言进行了优化,为全球企业应用提供便利。英伟达深度...

檬味博客在线解答立即免费咨询

代码相关话题

Copyright © 2023 WWW.MENGVLOG.COM - 檬味博客
返回顶部