
会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
更新时间:2024-04-25 18:20:57 最新章节:封底
书籍简介
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
程戈
同类热门书
最新上架
- 会员本书聚焦通用人工智能的学科内涵与发展趋势,以一套基于“能力与价值双系统”的通用人工智能认知架构与测试模式为核心,梳理形成“一个定义、两个完备性、三个特征、八个关键问题”的理论框架。本书共6章,从人工智能的历史、内涵与哲学基础切入,依次介绍通用人工智能的定义与特征、测试与评级、训练与测试平台,以及TongAI理论框架,最后给出对发展通用人工智能的建议。本书既有助于科技领域的管理者和投资者提纲挈领,把计算机16.4万字
- 会员本书融合作者构建、运维和扩展大型机器学习系统的经验,通过丰富的示例,详细讲解如何运行高效、可靠的机器学习系统。本书首先概述机器学习相关概念和数据管理原则,涵盖数据管理、机器学习模型、评估质量、特征、公平性、隐私等主题;然后介绍机器学习模型及其生命周期;最后讲述如何将机器学习引入组织,以及引入后组织会发生什么等复杂问题。计算机26.5万字
- 会员本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第计算机16.4万字
- 会员(1)AI与AIGC基础知识:从基础入手,深入讲解AI技术的基本概念和原理。通过通俗易懂的讲解和示例,帮助读者建立坚实的理论基础,为后续章节的深入学习打下良好基础。(2)智能设备上的AIGC系统设计:详细介绍AIGC技术在实际应用过程中的各种功能设计和实现方法。内容涵盖算法选择、模型训练、系统集成等各个环节,通过丰富的技术细节和设计策略,帮助读者全面掌握AIGC技术的应用要点。(3)AIGC关键工计算机18万字
- 会员《Manus实用操作极简入门与指南》是一本为普通用户设计的AIAgent使用手册,旨在帮助读者快速掌握AIAgent的核心功能,提升工作效率。本书从AIAgent的基本概念入手,详细介绍了AIAgent的自主性、智能性和目标导向性,并通过丰富的实例展示了AIAgent在数据分析、自动化流程、决策支持等领域的强大能力。书中重点介绍了Manus这一新一代通用AIAgent,它不仅能理解用户计算机8.9万字