AI大模型微调训练营(彭靖田)

从LoRA到RLHF:5大AI大模型微调技术实战精讲


从LoRA到RLHF:5大AI大模型微调技术实战精讲

1. 为什么大模型微调技术成为开发者必修课

大语言模型微调是解决行业场景落地的关键技术,能显著降低模型训练成本并提升任务适配性。本课程系统讲解从基础PEFT到进阶RLHF的全套方法论,覆盖ChatGLM3、LLaMA等主流模型的实战调优技巧,帮助开发者掌握工业级微调方案。课程包含15个模块,通过大厂案例解析与代码实操,突破模型定制化开发的核心难点。

2. 课程核心内容拆解:从理论到企业级实践

- LoRA低秩适配技术:详解参数高效微调原理与代码实现

- QLoRA量化微调:4-bit量化技术压缩ChatGLM3-6B模型

- RLHF人类反馈强化学习:复现ChatGPT训练流程的关键步骤

- DeepSpeed分布式训练:微软框架实现万亿参数并行训练

- 私有数据微调实战:结合LangChain构建企业专属AI助手

课程提供360、百度、腾讯等一线大厂技术文档,包含特征交互建模、Kubernetes部署等扩展知识。

3. 特色模块深度解析:MoEs与私有化部署

混合专家模型(MoEs)章节突破传统单模型限制,讲解动态路由与多专家协同机制。在LangChain应用开发中,学员将通过私有化部署聊天机器人项目,掌握向量数据库集成、对话逻辑编排等实用技能。所有案例均提供完整GitHub代码库与GLM、LLaMA等论文合集。

4. 讲师彭靖田的技术背景与教学优势

作为极客时间特邀讲师,彭靖田长期深耕大模型分布式训练领域,主导过多个亿级参数项目的调优工作。其课程特色在于:

- 技术栈全覆盖:从LoRA、QLoRA到RLHF形成完整知识闭环

- 工业级工具链:HF Transformers、PEFT等框架深度整合

- 实时答疑体系:每节课配备直播评论区问题追踪文档

5. 适合哪些人群学习

- 希望将通用大模型适配到金融、医疗等垂直领域的算法工程师

- 需要掌握模型量化压缩技术的嵌入式开发人员

- 计划构建企业级AI应用的全栈开发者

课程通过12个实战Lab,帮助学员建立从微调策略选择到效果评估的全流程能力。

本课程构建了大模型微调技术体系化学习路径,既包含底层理论推导,又提供可直接复用的工程模板。通过深度结合学术界前沿论文与工业界最佳实践,助力开发者快速实现技术转化。

资源下载通道

夸克网盘分享
文件大小:68.18 GB

资源目录列表:

├─极客时间《彭靖田AI大模型微调训练营》
│  ├─0-开营直播1019
│  │  ├─大厂案例PPT
│  │  │  ├─360 大数据平台定制开发之道.pdf
│  │  │  ├─DDD 在京东物流的落地效果.pdf
│  │  │  ├─Go 并发数据结构和算法实践.pdf
│  │  │  ├─Go 语言基础原理深度解析.pdf
│  │  │  ├─阿里工程效能微创新.pdf
│  │  │  ├─百度文心 (ERNIE) 语义理解技术详解.pdf
│  │  │  ├─大疆 Kubernetes 探索与实践之路.pdf
│  │  │  ├─构建批流一体化 AI 数据平台的深度探索.pdf
│  │  │  ├─技术管理路上的那些事儿.pdf
│  │  │  ├─快手 AI 生成式技术实践.pdf
│  │  │  ├─类秒杀场景下的瞬时大流量高并发实践.pdf
│  │  │  ├─如何建设一支能打硬仗的技术团队.pdf
│  │  │  ├─腾讯万亿级 Elasticsearch 架构实践.pdf
│  │  │  ├─推荐系统特征交互建模:浅层模型、深度模型与 AutoML.pdf
│  │  │  ├─微保 Service Mesh 研发实践中的取舍-龙武_compressed.pdf
│  │  │  ├─研发效能建设的“灵魂拷问”与落地实践.pdf.pdf
│  │  ├─10.19直播答疑部分.mp4
│  │  ├─RAG、微调、预训练,如何选择适合的大模型优化方式?.mp4
│  ├─10-实战QLoRA微调ChatGLM3-6B
│  │  ├─代码
│  │  │  ├─github.txt
│  │  ├─课件
│  │  │  ├─9-实战QLoRA 微调 ChatGLM3-6B.pdf
│  │  ├─视频
│  │  │  ├─1月3日.mp4
│  │  ├─直播评论
│  │  │  ├─20240103评论区记录.xlsx
│  │  ├─资料
│  │  │  ├─GLM论文.exe
│  ├─11-快速入门 LangChain
│  │  ├─课件
│  │  │  ├─10-快速入门 LangChain 大模型应用开发框架.pdf
│  │  ├─视频
│  │  │  ├─1月7日.mp4
│  │  │  ├─1月7日-2.mp4
│  ├─12-实战基于LangChain和ChatGLM私有化部署聊天机器人
│  │  ├─课件
│  │  │  ├─11-实战基于LangChain和ChatGLM私有化部署聊天机器人.pdf
│  │  ├─视频
│  │  │  ├─1月10日.mp4
│  │  ├─直播评论
│  │  │  ├─20240110评论区记录.xlsx
│  ├─13-实战私有数据微调ChatGLM3
│  │  ├─代码
│  │  │  ├─代码.txt
│  │  ├─课件
│  │  │  ├─12-实战私有数据微调ChatGLM3.pdf
│  │  ├─视频
│  │  │  ├─1月18日.mp4
│  │  ├─直播评论
│  │  │  ├─20240118评论区记录.xlsx
│  ├─14-ChatGPT大模型训川练技术RLHF
│  │  ├─代码
│  │  │  ├─代码.txt
│  │  ├─课件
│  │  │  ├─13-ChatGPT大模型训练技术RLHF.pdf
│  │  ├─视频
│  │  │  ├─1月21日.mp4
│  │  ├─直播评论
│  │  │  ├─20240121评论区记录.xlsx
│  ├─15-混合专家模型(MoEs)技术揭秘
│  │  ├─课件
│  │  │  ├─14-混合专家模型(MoEs)技术揭秘.pdf
│  │  ├─视频
│  │  │  ├─1月25日.mp4
│  │  ├─直播评论
│  │  │  ├─20240124评论区记录.xlsx
│  │  ├─资料
│  │  │  ├─MoEs.exe
│  ├─16-大模型分布式训练框架 Microsoft DeepSpeed
│  │  ├─代码
│  │  │  ├─代码.txt
│  │  ├─课件
│  │  │  ├─15-大模型分布式训练框架Microsoft DeepSpeed(1).pdf
│  │  ├─视频
│  │  │  ├─1月28日.mp4
│  │  ├─直播评论
│  │  │  ├─20240128评论区记录.xlsx
│  │  ├─资料
│  │  │  ├─ZeRO.exe
│  ├─17-Meta AI 大模型家族 LLaMA
│  │  ├─课件
│  │  │  ├─16-Meta AI 大模型家族 LLaMA.pdf
│  │  ├─视频
│  │  │  ├─1月31日.mp4
│  │  ├─直播评论
│  │  │  ├─20240131评论区记录.xlsx
│  │  ├─资料
│  │  │  ├─LLaMA.exe
│  ├─1-开营直播:大语言模型微调的前沿技术与应用
│  │  ├─课件
│  │  │  ├─开营直播:大语言模型微调的前沿技术与应用.pdf
│  │  ├─视频
│  │  │  ├─01-大模型微调的前沿技术与应用.mp4
│  │  ├─直播评论
│  │  │  ├─20231129评论区记录.xlsx
│  ├─2-大模型四阶技术总览
│  │  ├─课件
│  │  │  ├─1-AI大模型四阶技术总览.pdf
│  │  │  ├─1-AI大模型四阶技术总览-新.pdf
│  │  ├─视频
│  │  │  ├─AI大模型四阶技术总览.mp4
│  │  ├─直播评论
│  │  │  ├─20231203评论区记录.xlsx
│  ├─3-大语言模型技术发展与演进
│  │  ├─课件
│  │  │  ├─2-大语言模型技术发展与演进.pdf
│  │  ├─视频
│  │  │  ├─大模型演进.mp4
│  │  ├─直播评论
│  │  │  ├─20231203评论区记录.xlsx
│  │  ├─资料
│  │  │  ├─论文.exe
│  ├─4-大语言模型微调技术揭秘-PEFT
│  │  ├─课件
│  │  │  ├─2-大语言模型技术发展与演进.pdf
│  │  │  ├─3-大模型微调技术揭秘-PEFT.pdf
│  │  ├─视频
│  │  │  ├─大模型微调技术揭秘-PEFT.mp4
│  │  │  ├─新录制1月14日.mp4
│  │  ├─直播评论
│  │  │  ├─20231206评论区记录.xlsx
│  │  ├─资料
│  │  │  ├─Fine-tuning论文.exe
│  ├─5-大语言模型微调技术揭秘-LoRA
│  │  ├─课件
│  │  │  ├─3-大模型微调技术揭秘.pdf
│  │  │  ├─4-大模型微调技术揭秘-LoRA.pdf
│  │  ├─视频
│  │  │  ├─大模型低秩适配(LoRA)技术.mp4
│  │  ├─直播评论
│  │  │  ├─20231210评论区记录.xlsx
│  │  ├─资料
│  │  │  ├─UniPELT A Unified Framework for Parameter-Efficient Language Model Tuning.pdf
│  ├─6-大模型开发工具库
│  │  ├─课件
│  │  │  ├─5-大模型开发工具库 HF Transformers.pdf
│  │  ├─视频
│  │  │  ├─大模型开发工具.mp4
│  ├─7-实战 Transformers 模型微调
│  │  ├─代码
│  │  │  ├─github.txt
│  │  ├─课件
│  │  │  ├─6-实战Transformers模型微调.pdf
│  │  ├─视频
│  │  │  ├─12月13日.mp4
│  │  ├─直播评论
│  │  │  ├─20231220评论区记录.xlsx
│  ├─8-实战Transformers模型量化
│  │  ├─代码
│  │  │  ├─github.txt
│  │  ├─课件
│  │  │  ├─7-实战Transformers模型量化.pdf
│  │  ├─视频
│  │  │  ├─12月24日.mp4
│  │  ├─直播评论
│  │  │  ├─20231224评论区记录.xlsx
│  │  ├─资料
│  │  │  ├─Quantization论文
│  ├─9-大模型高效微调工具HF PEFT
│  │  ├─代码
│  │  │  ├─github.txt
│  │  ├─课件
│  │  │  ├─8-大模型高效微调工具HF PEFT.pdf
│  │  ├─视频
│  │  │  ├─12月27日.mp4
│  │  ├─直播评论
│  │  │  ├─20231227评论区记录.xlsx
│  ├─课程大纲.jpg
立 即 下 载

相关资源

发表评论

点 击 提 交