
会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
更新时间:2024-04-25 18:20:57 最新章节:封底
书籍简介
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
程戈
最新上架
- 会员本书分为23章,从基础的演讲知识入手,到演讲稿的写作技巧,再到指导读者如何有效地利用ChatGPT进行演讲稿写作和演讲练习,最后通过实际的行业案例进行深入的学习和实战应用。使读者不仅可以学习演讲的相关知识,还能对如何利用ChatGPT进行有效的演讲有所理解。计算机19.1万字
- 会员本书全面、系统地探讨科学计算的背景、机器学习的重要性以及昇思MindSpore框架在科学计算中的广泛应用。科学计算作为一门交叉学科,融合了数学、计算机科学与技术等领域的专业知识,在现代科学研究和工程实践中起着关键作用。本书以MindSpore为平台,深入研究这一全场景AI框架在科学计算中的探索与实践,通过对基础理论、行业应用和实际案例的详细介绍,为读者提供全方位的学习和参考资料。全书共8章,首先详计算机15.7万字
- 会员本书将带你深入探索AI“神器”——DeepSeek的无限潜能,带你从零开始,轻松掌握AI的核心应用。通过学习本书,你将轻松上手DeepSeek,开启智能生活新篇章;通过学习本书,你将学会用DeepSeek大幅提升工作效率;通过学习本书,你将学会如何让DeepSeek成为你的职场超级助手;通过学习本书,你将学会如何利用DeepSeek激发自己的创作灵感,打造爆款内容和个人品牌;通过学习本书,你将学会计算机7.2万字
- 会员本书通过对10款人工智能应用的介绍及调试,帮助读者快速掌握人工智能辅助文案变现的方式。本书共10章,分别讲解AI智能创作,AI爆款文案写作工具,人工智能辅助泛流量文案、泛商业文案、私域文案创作,利用人工智能实现文案变现的底层逻辑,以及在今日头条、百家号、小红书、知乎等平台及不同展示形式下进行文案创作的实战案例等。计算机12.2万字
- 会员本书讲解如何利用AI工具来高效制作和设计PPT,全书共分为8章,前面7章分别介绍了PPT不同制作内容的相关知识和技巧,包括软件操作层面、设计思维层面、素材应用层面的内容,第8章模拟了两个真实工作场景下的PPT使用需求,逐步讲解设计的关键环节,旨在帮助读者解决工作中的实际问题。计算机601字
- 会员本书通过实践案例操作,讲述AI绘画的生成步骤,展现了AI绘画的魔法魅力。从历史到未来,跨越百年时空;从理论到实践,讲述案例操作;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。AI绘画的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及Prompt、风格、技术细节、多模态交互、AIGC等一系列讲解。计算机5.5万字