
会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
程戈更新时间:2024-04-25 18:20:57
最新章节:封底开会员,本书免费读 >
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程最新章节
查看全部- 封底
- 作者简介
- 11.5 小结
- 11.4.3 ChatGPT for Robotics
- 11.4.2 PaLM-E
- 11.4.1 具身智能的挑战
- 11.4 具身智能
- 11.3 自回归模型的局限性
- 11.2 数据资源枯竭
- 11.1 强人工智能之路
程戈
主页
同类热门书
最新上架
- 会员
基于信息增强的图神经网络学习方法研究
本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用计算机8.1万字 - 会员
ChatGPT时代:ChatGPT全能应用一本通
本书共16章,内容包括人工智能、OpenAI、ChatGPT的概述及其操作技巧。生动展示了ChatGPT在教育与学术、商业管理、新媒体、办公、求职等12个领域的实际运用,同时探讨了ChatGPT当前面临的挑战以及大模型的未来发展方向。计算机12万字 智能涌现:AI时代的思考与探索
当前世界正处于百年变局,人类社会已经进入数字经济3.0时代:数字内容迭代,从1.0时代逐步迈入3.0时代;人工智能技术飞跃,从符号推理、深度学习走向知识+数据驱动的3.0时代;产业拓展更深更广,走向智能+3.0时代。随着大模型、ChatGPT、DeepSeek等智能涌现,我们该如何触发AI时代其他的突破性技术涌现?这些技术又该怎样反哺产业升级?本书阐述了人工智能技术演变的大趋势、算力驱动计算体系的计算机13.1万字- 会员
AI时代程序员开发之道:ChatGPT让程序员插上翅膀
本书从介绍“ChatGPT第一次接触”开始,分析如何使用该工具来提高开发效率和质量。书中每一章都涵盖了ChatGPT的不同应用场景,从编写各种文档,到辅助进行需求分析和系统设计,以及数据库设计和开发高质量代码等均有讲解。还介绍了如何使用ChatGPT辅助进行系统测试以及任务管理,并对源代码底层逻辑进行了分析。计算机8.8万字 - 会员
AI原生应用开发:提示工程原理与实战
本书结合AI原生应用落地的大量实践,系统讲解提示工程的核心原理、相关案例分析和实战应用,涵盖提示工程概述、结构化提示设计、NLP任务提示、内容创作提示、生成可控性提示、提示安全设计、形式语言风格提示、推理提示和智能体提示等内容。本书的初衷不是告诉读者如何套用各种预设的提示模板,而是帮助读者深入理解和应用提示设计技巧,以找到决定大语言模型输出的关键因子,进而将提示工程的理论知识应用到产品设计中。本书计算机18.2万字 - 会员
巧用ChatGPT轻松学演讲
本书分为23章,从基础的演讲知识入手,到演讲稿的写作技巧,再到指导读者如何有效地利用ChatGPT进行演讲稿写作和演讲练习,最后通过实际的行业案例进行深入的学习和实战应用。使读者不仅可以学习演讲的相关知识,还能对如何利用ChatGPT进行有效的演讲有所理解。计算机19.1万字 - 会员
人工智能技术
本书介绍了人工智能概览、机器学习、深度学习、人工智能主流开发框架、华为全栈全场景AI战略—EI、HiAI、昇腾,以及人工智能综合实验等内容?这是一本华为ICT学院人工智能课程培训的教材。本书是作者和华为的工作人员共同完成的,其间参阅了国内外现有教材和相关文献后编写的?全书注重理论与实践的结合,注重算法与框架的实际应用与实现方法,注重创新思维的训练与培养?本书既可作为高等院校人工智能课程的培训教材,计算机13.6万字 - 会员
硅基物语·AI大爆炸:ChatGPT→AIGC→GPT-X→AGI进化→魔法时代→人类未来
本书以第一人称视角,讲述AI的来龙去脉,表达AI的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。计算机8.6万字 - 会员
设计深度学习系统
本书主要从软件开发者的角度探讨如何构建和设计深度学习系统。作者首先描述一个典型的深度学习系统的整体,包括其主要组件以及它们之间的连接方式,然后在各个单独的章节中深入探讨这些主要组件。对于具体介绍的章节,会在开始时讨论需求,接着介绍设计原则和示例服务/代码,并评估开源解决方案。通过阅读本书,读者将能够了解深度学习系统的工作原理,以及如何开发每个组件。本书的主要读者对象是想要从事深度学习平台工作或将一计算机18.1万字