
会员
从零开始大模型开发与微调:基于PyTorch与ChatGLM
更新时间:2024-12-31 17:38:36
最新章节:18.5 本章小结开会员,本书免费读 >
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
从零开始大模型开发与微调:基于PyTorch与ChatGLM最新章节
查看全部- 18.5 本章小结
- 18.4.3 Huggingface专用PEFT的使用
- 18.4.2 PEFT的使用与参数设计
- 18.4.1 PEFT技术详解
- 18.4 高级微调方法3——基于Huggingface的PEFT模型微调
- 18.3.5 基于基本原理的LoRA实现
- 18.3.4 基于自定义LoRA的模型推断
- 18.3.3 基于自定义LoRA的模型训练
- 18.3.2 自定义LoRA的使用方法
- 18.3.1 对ChatGLM进行微调的方法——LoRA
最新上架
- 会员
DeepSeek操作应用大全:从入门到精通
本书是全面介绍DeepSeek人工智能平台及其应用的实用指南,旨在帮助读者从零基础开始,逐步掌握DeepSeek的各项功能,并最终达到精通水平,能够在各种实际场景中灵活运用DeepSeek解决复杂问题。无论你是人工智能的初学者,还是希望进一步提升技能的专业人士,本书都将为你提供详尽的操作指导和丰富的实战案例。本书共三篇25章,涵盖了DeepSeek的各个方面,从基础入门到高级应用,再到私有化部署,计算机15.6万字 - 会员
Sora AI视频生成、案例解析与场景应用
本书通过81个官方案例解析、120个知识点梳理,深入浅出介绍了Sora的技术原理、特色功能、创新之处、优势特点、文案工具、脚本创作、提示词技巧、绘画工具、创意应用、变现方式等,帮助读者一本书全面精通Sora的AI视频生成技术。10大专题内容、108分钟视频,手机扫码可看精华内容,同时赠送了9大超值资源:74组AI绘画提示词、104个效果文件、165页PPT课件、31集《AI摄影》教学视频、40集《计算机6.8万字 - 会员
揭秘大模型:从原理到实战
本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型计算机12.2万字 - 会员
AIGC驱动工业智能设备:系统设计与行业实践
(1)AI与AIGC基础知识:从基础入手,深入讲解AI技术的基本概念和原理。通过通俗易懂的讲解和示例,帮助读者建立坚实的理论基础,为后续章节的深入学习打下良好基础。(2)智能设备上的AIGC系统设计:详细介绍AIGC技术在实际应用过程中的各种功能设计和实现方法。内容涵盖算法选择、模型训练、系统集成等各个环节,通过丰富的技术细节和设计策略,帮助读者全面掌握AIGC技术的应用要点。(3)AIGC关键工计算机18万字 未来之地
在技术进步和经济不断发展的当下,越来越多的人开始思考这些问题:当机器人能够顺畅地处理大部分工作时,是否会导致人类大量失业?在大量失业的情况下,人们该如何获得收入,是否会因此感到人生毫无意义,丧失获得快乐的能力?假设人类安全地开发出了超级智能,对它进行了良好的管理,并很好地利用了这项技术所能释放的巨大经济潜力和神奇的变革力量。在这个世界中,人工智能可以做我们能做的一切,而且可以做得更好、更快,成本更计算机29.6万字- 会员
通用人工智能标准、评级、测试与架构
本书聚焦通用人工智能的学科内涵与发展趋势,以一套基于“能力与价值双系统”的通用人工智能认知架构与测试模式为核心,梳理形成“一个定义、两个完备性、三个特征、八个关键问题”的理论框架。本书共6章,从人工智能的历史、内涵与哲学基础切入,依次介绍通用人工智能的定义与特征、测试与评级、训练与测试平台,以及TongAI理论框架,最后给出对发展通用人工智能的建议。本书既有助于科技领域的管理者和投资者提纲挈领,把计算机16.4万字 - 会员
Joy RL:强化学习实践教程
本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“Joy计算机7.8万字 - 会员
图解大模型:生成式AI原理与实战
本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第计算机16.4万字 - 会员
AI新个体:用DeepSeek重塑一人公司
这是一本写给普通人的个人成长和财富增长指南。两位作者从自身经验出发,讲述如何在AI工具的帮助下,实现“一个人活成一家公司”的梦想。从用AI语音写作完成日更文章,到用AI设计海报、制作课程,再到将AI融入营销和推广,作者以DeepSeek等AI工具为例,总结了如何在各类工作和学习场景中,借助AI来完成认知升级和个人能力的提升。本书适合职场人、学生、自由职业者等各类读者阅读,致力于帮助读者借助AI的力计算机6.4万字