强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

最新上架

  • 会员
    这是一本全方位讲解如何利用AI工具为HR赋能的著作,是AI时代HR提升职场竞争力的实战指南。作者基于深厚的HR管理经验和AI实战经验,通过科学的方法、高效的提示词、丰富的案例、清晰的步骤,细致地讲解了如何利用AI工具提高工作效率、优化管理流程、提升人才管理水平。从AIGC的基础知识到AI工具的使用,从AI在人力资源全生命周期所有场景中的应用到使用AI的风险防控,本书全面系统地讲解了HR需要掌握的全
    田政 谷燕燕 唐琨计算机20.6万字
  • 会员
    《AIGC:让生成式AI成为自己的外脑》针对近期较为火热的AIGC技术及其相关话题,介绍AIGC的技术原理、专业知识和应用。全书共分为九章。第一章介绍AIGC技术的基本概念和发展历程;第二、三章介绍AIGC的基础技术栈和拓展技术栈;第四、五章分别讨论了AIGC技术在文本生成和图像生成两个领域的现状和前景;第六章列举了目前较为热门的AIGC技术应用;第七章描述了AIGC的上、中、下游产业链及未来前景
    成生辉计算机12.8万字
  • 会员
    本书以人工智能为核心,上篇讲述了人工智能理论知识及发展蓝图规划,目的是帮助读者认识人工智能,找到入局人工智能领域的途径和方法;中篇罗列了可以为人工智能赋能的前沿技术,包括NLP、机器学习、大数据、物联网、区块链等;下篇总结了人工智能对交通、农业、医疗、制造、教育、金融、文娱等行业的影响和作用,旨在让读者了解人工智能是如何在这些行业实现商业化落地的。本书从多个角度出发,描绘了一幅完整的人工智能发展蓝
    郭哲滔 任宇翔计算机15.8万字
  • 会员
    本书结合作者10多年写作经验,基于AI应用ChatGPT、文心一言、智谱清言、讯飞星火、通义千问、Kimi等,详细介绍了使用AI写作的流程、方法和技巧,旨在帮助想要通过内容输出加速个人发展的读者,快速掌握AI自媒体写作的方法和技巧。本书分为11章,涵盖AI自媒体写作概述、AI提示词、AI起标题、AI做选题、AI角色化写作、AI套路化写作、AI仿写、AI模块化写作、AI改写、AI润色、AI智能体写作
    安晓辉计算机9.2万字
  • 会员
    本书主要介绍了人工智能的基础知识和实用技术。本书共8章,包括“人工智能:开启智慧新时代”“Python:人工智能开发语言”“线性回归:预测未来趋势”“分门别类:帮你‘分而治之’”“物以类聚:发现新簇群”“个性化推荐:主动满足你的需求”“语音识别:让机器对你言听计从”“人脸识别:机器也认识你”。本书以培养学生人工智能素养、人工智能思维和人工智能基本应用能力为设计理念,在内容的选取和安排上符合学生的学
    宋楚平 陈正东主编计算机12.9万字
  • 会员
    人工智能(AI),尤其是生成式语言模型和生成式人工智能(AIGC)模型,正以惊人的速度改变着我们的世界。驾驭这股潮流的关键,莫过于探究自然语言处理(NLP)技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅,让其亲身感受,并动手搭建语言模型。本书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络(RNN),Seq2Seq(S2
    黄佳计算机14万字
  • 会员
    本书从空间信息处理角度出发,将人工智能领域的理论研究与专业实践相结合,完整介绍人工智能方法及其在空间信息处理中的应用,不仅涵盖人工智能领域的基础概念与基本方法,而且探讨知识图谱、计算智能、新兴机器学习、深度学习等前沿技术,同时介绍人工智能在地理文本大数据、遥感影像、激光点云等空间信息处理中的应用实例,具有较强的代表性和启发性。本书可以作为高等院校空间信息与数字技术、遥感科学与技术等专业高年级本科生
    罗欣 侯卫民 许文波编著计算机23.8万字
  • 会员
    青少年人工智能编程水平测试涵盖从数学逻辑到计算思维、从拖曳程序模块到程序编写、从数学建模到算法设计等多学科知识,能够对学生的多学科知识综合运用能力做出评价;能够通过设计的具体解决方案,对学生的计算思维、创造性思维等能力做出评价;在具体的解决方案中,能够通过设计算法模型和实现算法,对学生掌握和运用编程的能力做出评价。本书结合生活中的实例,系统地介绍了不同进制之间的转换、函数参数的作用域、枚举算法、二
    陈杰编著计算机2万字
  • 自人工智能(AI)的概念诞生之日起,科学家们就热衷于探讨它的发展路径。第一阶段毫无疑问是计算智能,经过半个多世纪,AI在运算能力和记忆方面早已超越人类。第二阶段,是感知智能,让机器可以看得懂听得懂这个世界。科学界认为,尚未到来的第三阶段,是认知智能,甚至提到一个词:认知时代。我们来到大模型时代或者是生成式人工智能时代了吗?如果我们此时此刻正身处这个时代,那上一个是什么时代?有人说,大规模预训练已经
    刘云浩计算机11.3万字