Skip to content

主流模型介绍

本文档介绍目前主流的大语言模型,帮助你了解各家产品的特点。

数据更新

本文档最后更新于 2026年3月7日,信息可能随时变化,请以官方最新发布为准。

OpenAI

数据来源:OpenAI 官网 | 截止时间:2026年3月

GPT-5.4

OpenAI 目前最新的旗舰模型,2026年3月发布。

特性说明
多模态支持文本、图像、音频输入
上下文1M tokens(100万)
计算机操作原生支持计算机操作能力
速度比前代更快的token效率

版本说明

  • GPT-5.4 Thinking - 高级推理能力,可展示思考过程
  • GPT-5.4 Pro - 针对高性能工作负载优化

性能提升(对比 GPT-5.2):

  • SWE-Bench Pro: 57.7%
  • OSWorld-Verified: 75.0%

GPT-4o

2024年5月发布的多模态模型,仍广泛使用。

特性说明
多模态支持文本、图像、音频输入
上下文128K tokens
速度响应快速

GPT-4o-mini

轻量级模型,适合简单任务。

特性说明
速度非常快
价格
适用简单任务、高并发

Anthropic

数据来源:Anthropic 官网 | 截止时间:2026年2月

Claude Opus 4.6

Anthropic 最新最强模型,2026年2月发布。

特性说明
编程能力业界领先,SWE-bench 72.5%
上下文1M tokens(Beta)
特点安全性高、逻辑推理强
工具调用支持并行工具使用

定价:$5/$25 每百万token(输入/输出)

Claude Sonnet 4

2025年5月发布,平衡性能与效率。

特性说明
编程能力SWE-bench 72.7%
上下文200K tokens
模式支持即时响应和扩展思考两种模式

定价:$3/$15 每百万token


Google

数据来源:Google AI 官网 | 截止时间:2025年3月

Gemini 2.5 Pro

Google 最新旗舰模型,2025年3月发布。

特性说明
思考模式原生支持复杂问题推理
多模态文本、图像、音频、视频
上下文1M+ tokens
编程代码生成和调试能力强

Gemini 2.5 Flash

轻量高效版本。

特性说明
速度响应快速
效率更高性价比
适用高吞吐场景

Meta

数据来源:Meta AI 官网 | 截止时间:2025年4月

Llama 4

Meta 最新开源模型系列,2025年4月发布。

版本活跃参数特点
Llama 4 Scout17B10M上下文、多模态、单卡可运行
Llama 4 Maverick17B更快推理、成本优化
Llama 4 Behemoth288B训练中,最强版本

核心特性

  • 10M token 上下文 - 无需RAG即可处理整个文档库
  • 原生多模态 - 集成文本、图像、视频理解
  • 200+ 语言 - 包含多种小语种
  • 完全开源 - 无API限制,可自由微调和部署

阿里巴巴

数据来源:阿里云官网 | 截止时间:2026年1月

Qwen 3 (通义千问 3)

阿里最新旗舰模型,2026年1月发布。

特性说明
架构MoE,235B总参数,22B活跃参数
训练数据36T tokens
上下文256K tokens
语言119种语言

主要版本

版本说明
Qwen3-Max-Thinking旗舰推理模型,超越GPT-5.2-Thinking
Qwen3-72B高性能开源版本
Qwen3-7B轻量级开源版本

优势

  • 中文能力顶尖
  • 编程能力强
  • 支持超长上下文

DeepSeek

数据来源:DeepSeek 官网 | 截止时间:2026年3月

DeepSeek V4

深度求索的最新模型,2026年3月发布。

特性说明
架构万亿参数 MoE,约320亿活跃参数
上下文1M tokens
多模态原生支持文本、图像、视频、音频
开源MIT/Apache 2.0 许可证

性能

  • HumanEval: ~90%
  • SWE-bench Verified: 80%+

优势

  • 开源免费
  • 极具性价比的API
  • 中文能力强

DeepSeek R1

推理专用模型,2025年1月发布。

特性说明
能力复杂推理、数学、编程
特点开源、可本地部署

Mistral AI

数据来源:Mistral AI 官网 | 截止时间:2025年

Mistral Large 2

法国AI公司的旗舰模型。

特性说明
参数量123B
上下文128K tokens
能力编程、推理、多语言

Mistral 7B

最受欢迎的开源小模型之一。

特性说明
参数量70亿
优势效率高、可在消费级 GPU 运行

模型分类总览

按访问方式

类型代表模型特点
商业 APIGPT-5.4、Claude 4.6、Gemini 2.5能力强、付费、云端
开源可商用Llama 4、Qwen 3、DeepSeek V4可本地部署、可微调

按参数规模

规模参数量显存需求适用场景
小模型<10B8GB边缘设备、快速响应
中模型10B-70B16-48GB本地部署、平衡性能
大模型>70B48GB+服务器部署、最强能力

按应用场景

场景推荐模型
日常对话GPT-5.4、Claude Opus 4.6
编程开发Claude Opus 4.6、GPT-5.4
长文档处理Llama 4 Scout (10M上下文)、Gemini 2.5
本地部署Llama 4、Qwen 3、DeepSeek V4
中文任务Qwen 3、DeepSeek V4
成本敏感DeepSeek V4、本地开源模型

下一步

了解了各家模型后,查看详细的模型对比分析

基于 VitePress 构建