当代人工智能技术简介
这是一份面向工程师与产品同好的简明技术读物。它不追求覆盖所有概念,而是聚焦近几年支撑大模型应用的核心技术:从注意力机制到 Transformer,从大语言模型到检索增强生成,再到逐渐成形的 AI 智能体范式。
从这里开始
-
大语言模型 LLM 概览
什么是大语言模型,它能做什么、不能做什么,以及预训练、微调与对齐之间的关系。
LLM预训练对齐 -
Transformer 架构 30 分钟入门
用最少的数学讲清楚自注意力、多头机制、位置编码与残差结构,理解为什么 Transformer 几乎一统江湖。
架构Attention基础 -
检索增强生成 RAG:让模型"看资料再回答"
向量检索、Embedding、Chunking 与重排,搭一个最小可用 RAG 系统应该考虑哪些工程细节。
RAG检索向量库 -
AI 智能体 Agent:从工具调用到自主规划
Function Calling、ReAct、规划与记忆,智能体不是魔法,是一组可工程化的循环。
Agent工具调用规划