主流模型介绍

本文档介绍目前主流的大语言模型，帮助你了解各家产品的特点。

数据更新

本文档最后更新于 2026年3月7日，信息可能随时变化，请以官方最新发布为准。

OpenAI

数据来源：OpenAI 官网 | 截止时间：2026年3月

GPT-5.4

OpenAI 目前最新的旗舰模型，2026年3月发布。

特性	说明
多模态	支持文本、图像、音频输入
上下文	1M tokens（100万）
计算机操作	原生支持计算机操作能力
速度	比前代更快的token效率

版本说明：

GPT-5.4 Thinking - 高级推理能力，可展示思考过程
GPT-5.4 Pro - 针对高性能工作负载优化

性能提升（对比 GPT-5.2）：

SWE-Bench Pro: 57.7%
OSWorld-Verified: 75.0%

GPT-4o

2024年5月发布的多模态模型，仍广泛使用。

特性	说明
多模态	支持文本、图像、音频输入
上下文	128K tokens
速度	响应快速

GPT-4o-mini

轻量级模型，适合简单任务。

特性	说明
速度	非常快
价格	低
适用	简单任务、高并发

Anthropic

数据来源：Anthropic 官网 | 截止时间：2026年2月

Claude Opus 4.6

Anthropic 最新最强模型，2026年2月发布。

特性	说明
编程能力	业界领先，SWE-bench 72.5%
上下文	1M tokens（Beta）
特点	安全性高、逻辑推理强
工具调用	支持并行工具使用

定价：$5/$25 每百万token（输入/输出）

Claude Sonnet 4

2025年5月发布，平衡性能与效率。

特性	说明
编程能力	SWE-bench 72.7%
上下文	200K tokens
模式	支持即时响应和扩展思考两种模式

定价：$3/$15 每百万token

Google

数据来源：Google AI 官网 | 截止时间：2025年3月

Gemini 2.5 Pro

Google 最新旗舰模型，2025年3月发布。

特性	说明
思考模式	原生支持复杂问题推理
多模态	文本、图像、音频、视频
上下文	1M+ tokens
编程	代码生成和调试能力强

Gemini 2.5 Flash

轻量高效版本。

特性	说明
速度	响应快速
效率	更高性价比
适用	高吞吐场景

版本	活跃参数	特点
Llama 4 Scout	17B	10M上下文、多模态、单卡可运行
Llama 4 Maverick	17B	更快推理、成本优化
Llama 4 Behemoth	288B	训练中，最强版本

阿里巴巴

数据来源：阿里云官网 | 截止时间：2026年1月

Qwen 3 (通义千问 3)

阿里最新旗舰模型，2026年1月发布。

特性	说明
架构	MoE，235B总参数，22B活跃参数
训练数据	36T tokens
上下文	256K tokens
语言	119种语言

主要版本：

版本	说明
Qwen3-Max-Thinking	旗舰推理模型，超越GPT-5.2-Thinking
Qwen3-72B	高性能开源版本
Qwen3-7B	轻量级开源版本

优势：

中文能力顶尖
编程能力强
支持超长上下文

DeepSeek

数据来源：DeepSeek 官网 | 截止时间：2026年3月

DeepSeek V4

深度求索的最新模型，2026年3月发布。

特性	说明
架构	万亿参数 MoE，约320亿活跃参数
上下文	1M tokens
多模态	原生支持文本、图像、视频、音频
开源	MIT/Apache 2.0 许可证

性能：

HumanEval: ~90%
SWE-bench Verified: 80%+

优势：

开源免费
极具性价比的API
中文能力强

DeepSeek R1

推理专用模型，2025年1月发布。

特性	说明
能力	复杂推理、数学、编程
特点	开源、可本地部署

Mistral AI

数据来源：Mistral AI 官网 | 截止时间：2025年

Mistral Large 2

法国AI公司的旗舰模型。

特性	说明
参数量	123B
上下文	128K tokens
能力	编程、推理、多语言

Mistral 7B

最受欢迎的开源小模型之一。

特性	说明
参数量	70亿
优势	效率高、可在消费级 GPU 运行

模型分类总览

按访问方式

类型	代表模型	特点
商业 API	GPT-5.4、Claude 4.6、Gemini 2.5	能力强、付费、云端
开源可商用	Llama 4、Qwen 3、DeepSeek V4	可本地部署、可微调

按参数规模

规模	参数量	显存需求	适用场景
小模型	<10B	8GB	边缘设备、快速响应
中模型	10B-70B	16-48GB	本地部署、平衡性能
大模型	>70B	48GB+	服务器部署、最强能力

按应用场景

场景	推荐模型
日常对话	GPT-5.4、Claude Opus 4.6
编程开发	Claude Opus 4.6、GPT-5.4
长文档处理	Llama 4 Scout (10M上下文)、Gemini 2.5
本地部署	Llama 4、Qwen 3、DeepSeek V4
中文任务	Qwen 3、DeepSeek V4
成本敏感	DeepSeek V4、本地开源模型

下一步

了解了各家模型后，查看详细的模型对比分析。

主流模型介绍 ​

OpenAI ​

GPT-5.4 ​

GPT-4o ​

GPT-4o-mini ​

Anthropic ​

Claude Opus 4.6 ​

Claude Sonnet 4 ​

Google ​

Gemini 2.5 Pro ​

Gemini 2.5 Flash ​

Meta ​

Llama 4 ​

阿里巴巴 ​

Qwen 3 (通义千问 3) ​

DeepSeek ​

DeepSeek V4 ​

DeepSeek R1 ​

Mistral AI ​

Mistral Large 2 ​

Mistral 7B ​

模型分类总览 ​

按访问方式 ​

按参数规模 ​

按应用场景 ​

下一步 ​