
会员
大语言模型:原理、应用与优化
更新时间:2024-12-18 17:07:10 最新章节:封底
书籍简介
这是一本从工程化角度讲解大语言模型的核心技术、构建方法与前沿应用的著作。首先从语言模型的原理和大模型的基础构件入手,详细梳理了大模型技术的发展脉络,深入探讨了大模型预训练与对齐的方法;然后阐明了大模型训练中的算法设计、数据处理和分布式训练的核心原理,展示了这一系统性工程的复杂性与实现路径。除了基座模型的训练方案,本书还涵盖了大模型在各领域的落地应用方法,包括低参数量微调、知识融合、工具使用和自主智能体等,展示了大模型在提高生产力和创造性任务中的卓越性能和创新潜力。此外,书中进一步介绍了大模型优化的高级话题和前沿技术,如模型小型化、推理能力和多模态大模型等。最后,本书讨论了大模型的局限性与安全性问题,展望了未来的发展方向,为读者提供了全面的理解与前瞻性的视角。无论是人工智能领域的研究员、工程师,还是对前沿技术充满好奇的读者,本书都将是您了解和掌握大模型技术的必备指南。
品牌:机械工业出版社
上架时间:2024-10-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
同类热门书
最新上架
- 会员AI的本质是什么?自然语言和人工语言的区别在哪里?ChatGPT究竟是人工智能发展道路上的里程碑,还是某种误入歧途的“假AI”?我们不许诺美丽空洞的AI前景,而是告诉读者,未来的AI之路到底有多少激流险滩——对于统计学工具与硬件升级的片面崇拜,对于智能科学基本原理的蔑视,是目前AI研究的大危机。在我们看来,万众期待的ChatGPT,只是新时代的“牛顿炼金术”。计算机17.8万字
- 会员我们在运用AI的时候,有时得不到自己想要的回答,于是责怪AI不够智能。我们容易忽略的是,AI的回答质量往往取决于提问的质量。《秒懂AI提问:让人工智能成为你的效率神器》系统地介绍了20种向AI提问的有效方法,用这些方法可以让AI给出高质量的回答。在介绍提问方法时,本书紧扣日常工作和生活,并通过对比让读者直观感受不同提问方法的效果,最后引出更多场景下的应用,让读者真正学以致用。《秒懂AI提问:让人工计算机5.4万字
- 会员本书立足于AIGC技术前沿与发展趋势,全面阐述了AIGC的概念内涵、底层技术与应用场景,详细梳理全球科技巨头在AIGC领域的战略布局,并辅之以大量生动有趣的案例,深度剖析AIGC在各行业领域的应用场景,旨在引导读者真切感受AIGC革命浪潮蕴含的商业创造力。全书分为五个部分,共18章。第一部分主要厘清AIGC技术的起源与演变,阐述席卷全球的AIGC背后的技术架构以及AIGC的应用场景;第二部分重点剖计算机11.4万字
- 会员DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合计算机17.1万字
- 会员本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型计算机12.2万字
- 会员本书共分为8章,涵盖了从数据分析基础知识、常见的统计学方法到使用ChatGPT进行数据准备、数据清洗、数据特征提取、数据可视化、回归分析与预测建模、分类与聚类分析,以及深度学习和大数据分析等全面的内容。计算机10.7万字