大语言模型:原理、应用与优化在线阅读
会员

大语言模型:原理、应用与优化

苏之阳 王锦鹏 姜迪 宋元峰
开会员,本书免费读 >

计算机网络人工智能12.1万字

更新时间:2024-12-18 17:07:10 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

这是一本从工程化角度讲解大语言模型的核心技术、构建方法与前沿应用的著作。首先从语言模型的原理和大模型的基础构件入手,详细梳理了大模型技术的发展脉络,深入探讨了大模型预训练与对齐的方法;然后阐明了大模型训练中的算法设计、数据处理和分布式训练的核心原理,展示了这一系统性工程的复杂性与实现路径。除了基座模型的训练方案,本书还涵盖了大模型在各领域的落地应用方法,包括低参数量微调、知识融合、工具使用和自主智能体等,展示了大模型在提高生产力和创造性任务中的卓越性能和创新潜力。此外,书中进一步介绍了大模型优化的高级话题和前沿技术,如模型小型化、推理能力和多模态大模型等。最后,本书讨论了大模型的局限性与安全性问题,展望了未来的发展方向,为读者提供了全面的理解与前瞻性的视角。无论是人工智能领域的研究员、工程师,还是对前沿技术充满好奇的读者,本书都将是您了解和掌握大模型技术的必备指南。
品牌:机械工业出版社
上架时间:2024-10-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

同类热门书

最新上架

  • 会员
    AI的本质是什么?自然语言和人工语言的区别在哪里?ChatGPT究竟是人工智能发展道路上的里程碑,还是某种误入歧途的“假AI”?我们不许诺美丽空洞的AI前景,而是告诉读者,未来的AI之路到底有多少激流险滩——对于统计学工具与硬件升级的片面崇拜,对于智能科学基本原理的蔑视,是目前AI研究的大危机。在我们看来,万众期待的ChatGPT,只是新时代的“牛顿炼金术”。
    徐英瑾计算机17.8万字
  • 会员
    本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。
    (美)塞巴斯蒂安·拉施卡计算机13.8万字
  • 会员
    本书围绕“公平、隐私与保障、可靠与安全、包容、负责、透明”六个人工智能需要遵循的原则,诠释当代青少年对负责任的人工智能的认识和思考。
    王岭主编计算机7.1万字
  • 会员
    我们在运用AI的时候,有时得不到自己想要的回答,于是责怪AI不够智能。我们容易忽略的是,AI的回答质量往往取决于提问的质量。《秒懂AI提问:让人工智能成为你的效率神器》系统地介绍了20种向AI提问的有效方法,用这些方法可以让AI给出高质量的回答。在介绍提问方法时,本书紧扣日常工作和生活,并通过对比让读者直观感受不同提问方法的效果,最后引出更多场景下的应用,让读者真正学以致用。《秒懂AI提问:让人工
    秋叶 刘进新 姜梅 定秋枫计算机5.4万字
  • 会员
    本书立足于AIGC技术前沿与发展趋势,全面阐述了AIGC的概念内涵、底层技术与应用场景,详细梳理全球科技巨头在AIGC领域的战略布局,并辅之以大量生动有趣的案例,深度剖析AIGC在各行业领域的应用场景,旨在引导读者真切感受AIGC革命浪潮蕴含的商业创造力。全书分为五个部分,共18章。第一部分主要厘清AIGC技术的起源与演变,阐述席卷全球的AIGC背后的技术架构以及AIGC的应用场景;第二部分重点剖
    杨爱喜 胡松钰 陈金飞计算机11.4万字
  • 会员
    DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合
    未来智能实验室 代晶编著计算机17.1万字
  • 会员
    本书共八章,从高校资源配置的教育、科研、社会、经济规律视角,以建设卓越世界一流大学为导向,对高校科学仪器设备配置中的问题进行研究。
    王士国 翟宇 虞振飞 方良华计算机17.5万字
  • 会员
    本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型
    文亮 江维计算机12.2万字
  • 会员
    本书共分为8章,涵盖了从数据分析基础知识、常见的统计学方法到使用ChatGPT进行数据准备、数据清洗、数据特征提取、数据可视化、回归分析与预测建模、分类与聚类分析,以及深度学习和大数据分析等全面的内容。
    朱宁计算机10.7万字