Skip to content

AI起源与背景

了解人工智能的发展历史,帮助你更好地理解今天的AI技术。

什么是人工智能?

人工智能(Artificial Intelligence,AI)是指由机器展现的智能行为。目标是让计算机能够执行通常需要人类智能才能完成的任务,如:

  • 理解语言
  • 识别图像
  • 做出决策
  • 解决问题
  • 学习新知识

AI发展简史

1950年代:诞生期

年份事件意义
1950图灵发表《计算机器与智能》提出"图灵测试"概念
1956达特茅斯会议"人工智能"术语正式诞生
1958感知机发明早期神经网络雏形

1960-1980年代:起伏期

  • 第一次AI寒冬(1974-1980):算力不足,理论局限,资金撤出
  • 专家系统兴起(1980-1987):基于规则的决策系统
  • 第二次AI寒冬(1987-1993):专家系统局限性暴露

1990-2010年代:复苏期

年份事件
1997IBM深蓝击败国际象棋世界冠军
2006Hinton提出深度学习概念
2011IBM Watson赢得《危险边缘》
2012AlexNet在ImageNet大赛夺冠,深度学习爆发
2016AlphaGo击败李世石

2017年至今:大模型时代

2017 ─── Transformer架构诞生(Google《Attention Is All You Need》)

2018 ─── BERT、GPT-1 发布

2020 ─── GPT-3 发布(1750亿参数)

2022 ─── ChatGPT 发布,引爆全球

2023 ─── GPT-4、Claude 2、Llama 2 发布

2024 ─── Claude 3、GPT-4o、Llama 3、DeepSeek V3

2025 ─── DeepSeek R1、Claude 3.5 Sonnet、Claude 4

2026 ─── GPT-5.4、Claude Opus 4.6、DeepSeek V4...

关键技术突破

1. Transformer架构

2017年Google发表的论文《Attention Is All You Need》提出了Transformer架构,彻底改变了NLP领域。

核心创新

  • 自注意力机制(Self-Attention)
  • 并行计算能力
  • 长距离依赖建模

2. 预训练+微调范式

预训练(Pre-training)

在大规模无标注数据上学习通用知识

微调(Fine-tuning)

在特定任务数据上适配

3. 涌现能力(Emergent Abilities)

当模型规模超过一定阈值时,会突然出现小模型不具备的能力:

  • 上下文学习(In-context Learning)
  • 链式推理(Chain-of-Thought)
  • 指令遵循(Instruction Following)

4. RLHF技术

Reinforcement Learning from Human Feedback(人类反馈强化学习):

  1. 监督微调:用人类回答训练模型
  2. 奖励模型:训练一个判断回答质量的模型
  3. 强化学习:用奖励模型优化语言模型

为什么现在AI这么火?

技术因素

  • ✅ 算力大幅提升(GPU/TPU)
  • ✅ 数据规模爆炸
  • ✅ 算法突破(Transformer、RLHF)
  • ✅ 开源生态繁荣

应用因素

  • ✅ ChatGPT展示惊人对话能力
  • ✅ AI编程助手提升效率
  • ✅ AI生成内容质量接近人类
  • ✅ 企业级应用落地

学习AI需要什么基础?

编程基础

  • Python(最常用)
  • 基础数据结构

数学基础

  • 线性代数(矩阵运算)
  • 概率统计
  • 微积分(理解优化)

机器学习基础

  • 监督学习 vs 无监督学习
  • 神经网络基本概念
  • 损失函数和优化器

下一步

了解了AI的背景后,接下来学习常用术语和名词解释

基于 VitePress 构建