关注B站可以观看更多实战教学视频:hallo128的个人空间

面向开发者的LLM入门教程(学习笔记01)

吴恩达老师的《Prompt Engineering for Developer》课程

一、简介

1.LLM的定义

大语言模型(LLM) 的更强大功能是能通过 API 接口调用,从而快速构建软件应用程序

2.分类

(1)基础LLM:是基于文本训练数据,训练出预测下一个单词能力的模型。
(2)指令微调 LLM :通过专门的训练,可以更好地理解并遵循指令。

3.如何训练

指令微调 LLM 的训练通常基于预训练语言模型,先在大规模文本数据上进行预训练,掌握语言的基本规律。在此基础上进行进一步的训练与微调(finetune),输入是指令,输出是对这些指令的正确回复。有时还会采用RLHF(reinforcement learning from human feedback,人类反馈强化学习)技术,根据人类对模型输出的反馈进一步增强模型遵循指令的能力。通过这种受控的训练过程。

指令微调 LLM 可以生成对指令高度敏感、更安全可靠的输出,较少无关和损害性内容。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部