AI起源与背景

了解人工智能的发展历史，帮助你更好地理解今天的AI技术。

什么是人工智能？

人工智能（Artificial Intelligence，AI）是指由机器展现的智能行为。目标是让计算机能够执行通常需要人类智能才能完成的任务，如：

理解语言
识别图像
做出决策
解决问题
学习新知识

AI发展简史

1950年代：诞生期

年份	事件	意义
1950	图灵发表《计算机器与智能》	提出"图灵测试"概念
1956	达特茅斯会议	"人工智能"术语正式诞生
1958	感知机发明	早期神经网络雏形

1960-1980年代：起伏期

第一次AI寒冬（1974-1980）：算力不足，理论局限，资金撤出
专家系统兴起（1980-1987）：基于规则的决策系统
第二次AI寒冬（1987-1993）：专家系统局限性暴露

1990-2010年代：复苏期

年份	事件
1997	IBM深蓝击败国际象棋世界冠军
2006	Hinton提出深度学习概念
2011	IBM Watson赢得《危险边缘》
2012	AlexNet在ImageNet大赛夺冠，深度学习爆发
2016	AlphaGo击败李世石

2017年至今：大模型时代

2017 ─── Transformer架构诞生（Google《Attention Is All You Need》）
  │
2018 ─── BERT、GPT-1 发布
  │
2020 ─── GPT-3 发布（1750亿参数）
  │
2022 ─── ChatGPT 发布，引爆全球
  │
2023 ─── GPT-4、Claude 2、Llama 2 发布
  │
2024 ─── Claude 3、GPT-4o、Llama 3、DeepSeek V3
  │
2025 ─── DeepSeek R1、Claude 3.5 Sonnet、Claude 4
  │
2026 ─── GPT-5.4、Claude Opus 4.6、DeepSeek V4...

关键技术突破

1. Transformer架构

2017年Google发表的论文《Attention Is All You Need》提出了Transformer架构，彻底改变了NLP领域。

核心创新：

自注意力机制（Self-Attention）
并行计算能力
长距离依赖建模

2. 预训练+微调范式

预训练（Pre-training）
    ↓
在大规模无标注数据上学习通用知识
    ↓
微调（Fine-tuning）
    ↓
在特定任务数据上适配

3. 涌现能力（Emergent Abilities）

当模型规模超过一定阈值时，会突然出现小模型不具备的能力：

上下文学习（In-context Learning）
链式推理（Chain-of-Thought）
指令遵循（Instruction Following）

4. RLHF技术

Reinforcement Learning from Human Feedback（人类反馈强化学习）：

监督微调：用人类回答训练模型
奖励模型：训练一个判断回答质量的模型
强化学习：用奖励模型优化语言模型

为什么现在AI这么火？

技术因素

✅ 算力大幅提升（GPU/TPU）
✅ 数据规模爆炸
✅ 算法突破（Transformer、RLHF）
✅ 开源生态繁荣

应用因素

✅ ChatGPT展示惊人对话能力
✅ AI编程助手提升效率
✅ AI生成内容质量接近人类
✅ 企业级应用落地

学习AI需要什么基础？

编程基础

Python（最常用）
基础数据结构

数学基础

线性代数（矩阵运算）
概率统计
微积分（理解优化）

机器学习基础

监督学习 vs 无监督学习
神经网络基本概念
损失函数和优化器

下一步

了解了AI的背景后，接下来学习常用术语和名词解释。

AI起源与背景 ​

什么是人工智能？ ​

AI发展简史 ​

1950年代：诞生期 ​

1960-1980年代：起伏期 ​

1990-2010年代：复苏期 ​

2017年至今：大模型时代 ​

关键技术突破 ​

1. Transformer架构 ​

2. 预训练+微调范式 ​

3. 涌现能力（Emergent Abilities） ​

4. RLHF技术 ​

为什么现在AI这么火？ ​

技术因素 ​

应用因素 ​

学习AI需要什么基础？ ​

编程基础 ​

数学基础 ​

机器学习基础 ​

下一步 ​