AI起源与背景
了解人工智能的发展历史,帮助你更好地理解今天的AI技术。
什么是人工智能?
人工智能(Artificial Intelligence,AI)是指由机器展现的智能行为。目标是让计算机能够执行通常需要人类智能才能完成的任务,如:
- 理解语言
- 识别图像
- 做出决策
- 解决问题
- 学习新知识
AI发展简史
1950年代:诞生期
| 年份 | 事件 | 意义 |
|---|---|---|
| 1950 | 图灵发表《计算机器与智能》 | 提出"图灵测试"概念 |
| 1956 | 达特茅斯会议 | "人工智能"术语正式诞生 |
| 1958 | 感知机发明 | 早期神经网络雏形 |
1960-1980年代:起伏期
- 第一次AI寒冬(1974-1980):算力不足,理论局限,资金撤出
- 专家系统兴起(1980-1987):基于规则的决策系统
- 第二次AI寒冬(1987-1993):专家系统局限性暴露
1990-2010年代:复苏期
| 年份 | 事件 |
|---|---|
| 1997 | IBM深蓝击败国际象棋世界冠军 |
| 2006 | Hinton提出深度学习概念 |
| 2011 | IBM Watson赢得《危险边缘》 |
| 2012 | AlexNet在ImageNet大赛夺冠,深度学习爆发 |
| 2016 | AlphaGo击败李世石 |
2017年至今:大模型时代
2017 ─── Transformer架构诞生(Google《Attention Is All You Need》)
│
2018 ─── BERT、GPT-1 发布
│
2020 ─── GPT-3 发布(1750亿参数)
│
2022 ─── ChatGPT 发布,引爆全球
│
2023 ─── GPT-4、Claude 2、Llama 2 发布
│
2024 ─── Claude 3、GPT-4o、Llama 3、DeepSeek V3
│
2025 ─── DeepSeek R1、Claude 3.5 Sonnet、Claude 4
│
2026 ─── GPT-5.4、Claude Opus 4.6、DeepSeek V4...关键技术突破
1. Transformer架构
2017年Google发表的论文《Attention Is All You Need》提出了Transformer架构,彻底改变了NLP领域。
核心创新:
- 自注意力机制(Self-Attention)
- 并行计算能力
- 长距离依赖建模
2. 预训练+微调范式
预训练(Pre-training)
↓
在大规模无标注数据上学习通用知识
↓
微调(Fine-tuning)
↓
在特定任务数据上适配3. 涌现能力(Emergent Abilities)
当模型规模超过一定阈值时,会突然出现小模型不具备的能力:
- 上下文学习(In-context Learning)
- 链式推理(Chain-of-Thought)
- 指令遵循(Instruction Following)
4. RLHF技术
Reinforcement Learning from Human Feedback(人类反馈强化学习):
- 监督微调:用人类回答训练模型
- 奖励模型:训练一个判断回答质量的模型
- 强化学习:用奖励模型优化语言模型
为什么现在AI这么火?
技术因素
- ✅ 算力大幅提升(GPU/TPU)
- ✅ 数据规模爆炸
- ✅ 算法突破(Transformer、RLHF)
- ✅ 开源生态繁荣
应用因素
- ✅ ChatGPT展示惊人对话能力
- ✅ AI编程助手提升效率
- ✅ AI生成内容质量接近人类
- ✅ 企业级应用落地
学习AI需要什么基础?
编程基础
- Python(最常用)
- 基础数据结构
数学基础
- 线性代数(矩阵运算)
- 概率统计
- 微积分(理解优化)
机器学习基础
- 监督学习 vs 无监督学习
- 神经网络基本概念
- 损失函数和优化器
下一步
了解了AI的背景后,接下来学习常用术语和名词解释。