
会员
强化学习:原理与Python实战
更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
强化学习:原理与Python实战最新章节
查看全部- 封底
- 作者简介
- 16.8 练习与模拟面试
- 16.7 本章小结
- 16.6 案例:老虎
- 16.5 部分可观测Markov决策过程
- 16.4 半Markov决策过程
- 16.3 非齐次Markov决策过程
- 16.2 连续时间Markov决策过程
- 16.1 平均奖励离散时间Markov决策过程
最新上架
- 会员
社交网络信息传播模型、算法及应用
本书系统地阐述信息传播问题中所涉及的各种传播模型、数学优化方法以及计算方法等,并通过对大量信息传播的实际问题进行了建模与分析。该著作将为人工智能、大数据、管理科学、运筹学、人文社会科学等领域开展相关研究的本科生、研究生以及学者提供重要的参考。计算机16万字 - 会员
AI高手速成:DeepSeek让你工作变轻松
这是一本全面介绍AI应用的实用工具书,旨在为不同行业的专业人士提供实用的AI使用方法和策略。本书用简单易懂的语言解释了AI的基本工作原理,详细介绍了20多个通用AI指令,并通过案例展示如何运用这些指令解决工作问题;提供了AI在文案写作、数据处理、编程、教学和科研等场景中的实战应用案例,同时还提供了商业级解决方案和企业应用案例。本书既有AI应用的通用原则和方法,又有具体的流程步骤和样例演示,还提供了计算机5.5万字 - 会员
轻松玩转DeepSeek:入门 实操 精通 变现
本书系统解析AI工具DeepSeek的全场景应用,从基础操作(如注册登录、界面介绍、本地部署)到高阶技巧(如写作辅助、创意内容生成、生活场景应用),涉及教学、办公、科研、生活等领域,配合教案设计、PPT生成、健康管理等实操案例。本书还介绍了如何借助DeepSeek实现商业变现的路径,提供可套用的DeepSeek模板以及DeepSeek指令提示词,让读者轻松掌握DeepSeek在多领域的应用,实现从计算机9.7万字 - 会员
法律人AI指南:大模型10倍提升工作效率的方法与技巧
本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7计算机23.8万字 - 会员
高效用DeepSeek:职场逆袭的实战指南
本书以DeepSeek应用为基础,讲解了DeepSeek在自媒体、咨询、营销、教育、翻译、职场、编程等多个领域的应用。书中通过丰富的案例和详细的指导,展示了DeepSeek如何帮助自媒体人打造“爆款”内容,如何为咨询提供高效决策支持,如何在营销中实现流量裂变,如何重塑未来学习范式,以及如何助力职场人和企业实现业务增效等。本书内容通俗易懂,案例丰富,无论是AI(ArtificialIntellig计算机8.2万字 心与芯:我们与机器人的无限未来
我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作,从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活,如提高外科医生的手术精确度,清洁我们的家等等,我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业,也许正在AI机器人领域诞生。当下的机器人产业,远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发计算机13.5万字- 会员
构建可靠的机器学习系统
本书融合作者构建、运维和扩展大型机器学习系统的经验,通过丰富的示例,详细讲解如何运行高效、可靠的机器学习系统。本书首先概述机器学习相关概念和数据管理原则,涵盖数据管理、机器学习模型、评估质量、特征、公平性、隐私等主题;然后介绍机器学习模型及其生命周期;最后讲述如何将机器学习引入组织,以及引入后组织会发生什么等复杂问题。计算机26.5万字 - 会员
AIGC革命:Web 3.0时代的新一轮科技浪潮
本书立足于AIGC技术前沿与发展趋势,全面阐述了AIGC的概念内涵、底层技术与应用场景,详细梳理全球科技巨头在AIGC领域的战略布局,并辅之以大量生动有趣的案例,深度剖析AIGC在各行业领域的应用场景,旨在引导读者真切感受AIGC革命浪潮蕴含的商业创造力。全书分为五个部分,共18章。第一部分主要厘清AIGC技术的起源与演变,阐述席卷全球的AIGC背后的技术架构以及AIGC的应用场景;第二部分重点剖计算机11.4万字 - 会员
DeepSeek快速上手
DeepSeek是一种生成式人工智能(AI)大模型,擅长处理复杂任务,具有训练效率高、成本低、性能强、开源等优势,吸引了全世界的关注。本书是写给DeepSeek初学者的快速上手实践指南。本书通过项目实例进行讲解,手把手地教读者如何使用DeepSeek。本书共6章,首先对DeepSeek进行概述,包括其成长路线、优势、技术原理、应用场景、应用方式等;其次讲解如何为DeepSeek写提示词,包括结构化计算机3.6万字
同类书籍最近更新
为机器立心(通用人工智能的中国蓝图系列)
《为机器立心》的主题是迈向通用人工智能的中国路线,让AI不再缺“心”,点亮人工智能的“中国时刻”。在书中,朱松纯教授解答了什么是通用人工智能、如何认清智能的本质、如何为人工智能找到统一理论与认知架构,进而为机器立“心”等重要问题。全书共分为两大部分。第一部分“厘清通用人工智能的3大关键迷思”:ChatGPT等大模型无异于缸中之脑;要寻找“乌鸦智能”而不是“鹦鹉智能”;理(U体系)与心(V体系)并非人工智能11.7万字为人文赋理(通用人工智能的中国蓝图系列)
本书的主题是从通用人工智能的视角来诠释中国的思想。朱松纯教授致力于搭建人文社科与通用人工智能的双向连接,本书是为人文赋“理”,即以人工智能的数理与认知模型诠释中国思想,试图为中国优秀哲学思想构建严格的数理体系,以便中国思想可以在正在到来的智能时代指导社会治理与实践,从而转化成强大的生产力。为此,本书先从智能时代的文明与道路说起,基于文明起源与演化的历程指出演化的关键在于“心”的出现,探索“心”的构人工智能13.7万字心智的10大模型
如今,人工智能的迅速发展给人们的日常生活和工作带来了巨大的影响。要想让人工智能朝着人类智能的方向持续迈进,我们就应该让我们创造的硅基大脑像人类大脑一样有感知、有记忆、有决策、有行动。问题的难点在于,人类大脑由约1000亿个神经元构成,神经元间交流复杂,大脑掌管认知、意识,影响我们生活的方方面面。我们如何破解如此庞大的复杂系统的运行机制呢?在《心智的10大模型》中,计算神经科学家格蕾丝·林赛深入探讨人工智能19.9万字