
会员
强化学习:原理与Python实战
更新时间:2023-10-19 17:44:38 最新章节:封底
书籍简介
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
最新上架
- 会员本书以第一人称视角,讲述AI的来龙去脉,表达AI的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。计算机8.6万字
- 会员本书是一本专为企业管理者和办公人员打造的实用指南,旨在帮助企业通过人工智能技术实现数字化转型,提升运营效率与竞争力。结合丰富的企业AI解决方案设计与实施经验,深入剖析了DeepSeek这一领先的人工智能模型在企业中的广泛应用场景。全书共分为四大部分,涵盖了企业管理、市场营销、销售与客服等多个核心领域,详细介绍了近100个企业使用场景,展示了如何通过DeepSeek实现效率的百倍提升。无论是人力资源计算机8.7万字
- 会员本书以当下热门的人工智能工具DeepSeek为核心,通过丰富实用的内容,助力读者从对DeepSeek一无所知的新手,成长为能够灵活运用其功能解决各类问题的行家。书中选取了多个领域的典型应用场景,如学习辅助、职场办公、生活娱乐以及自媒体创作等,为读者全方位展示DeepSeek的强大功能。全书共7章,内容层层递进。第1~3章为读者介绍了DeepSeek的功能和技术特点、基础操作技巧和提问策略,帮助读者计算机9万字
- 会员本书是一本全面介绍Manus及其应用的实用指南,旨在帮助读者深入了解Manus的核心技术、独特优势及其在各个领域的广泛应用,为读者在智能化时代的学习、工作和生活提供有力支持。首先,本书深入剖析智能体的本质与技术基础,详细阐述AIAgent的核心架构、运作原理,及其与传统AI模型的区别,并从不同维度对比Manus与其他AI大模型(如DeepSeek、ChatGPT),让读者对Manus的技术优势有清计算机16.8万字
- 会员随着Web3.0时代的来临,我国教育领域迎来了一场全面而深刻的变革——AIGC、ChatGPT、大数据、云计算、物联网、数字孪生、元宇宙等新兴技术与教育行业的融合程度日益加深,AI驱动的教育新形态、新模式、新产品不断涌现,数字化、网络化、智能化逐渐成为引领我国教育变革与转型的重要方向。本书立足于全球范围内智慧教育领域的实践经验与前沿趋势,全面阐述AIGC、ChatGPT、元宇宙、数字孪生等新兴技计算机13.8万字
- 会员从电台、电视、互网联到人工智能,每一次技术迭代总能为营销带来广泛的机会,并促使营销自身产生翻天覆地的变化。作为新技术的代表,生成式AI正以其强大的功能和广泛的应用场景,塑造着人们对于未来的憧憬。其对于世界的影响越巨大,对于营销范式的重塑会越深刻。本书基于技术和营销的关系,阐述了生成式AI技术条件下营销演变的底层逻辑,并进一步明确了未来的营销新趋势。通过深入分析生成式AI的洞察、创意和媒介能力,本书计算机12.8万字
- 会员本书分为3个部分:第1章和第2章是人工智能的数学基础,主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识,以及线性代数和概率论的相关知识;第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论,以及如何使用sklearn具体实现相关算法模型的搭建;第13章介绍了Spark机器学习,笔者认为对于机器学习,不能只限于Python中的skle计算机0字