2.2 大模型简介

所谓大模型,是指那些参数量巨大,能够处理复杂任务的模型。目前主流的大模型是基于Transformer架构的模型,采用Transformer结构堆叠的方式,构建了庞大的网络结构,不但能够处理自然语言,还能拓展到图像、视频、音频等其他模态,几乎统治了人工智能的技术架构。

本节介绍最基本的模型概念,介绍模型与算法的关系,进而拓展到大模型。