LLMs之IT:大模型核心技术—指令微调的简介、Self Instruction思想(一种生成指令数据集的方法论—主要用在指令微调阶段)的简介、AlpacaBELLE应用、实战案例代码实现之详细攻略

LLMs之IT:大模型核心技术—指令微调的简介、Self Instruction思想(一种生成指令数据集的方法论—主要用在指令微调阶段)的简介、AlpacaBELLE应用、实战案例代码实现之详细攻略 目录 相关文章 LLMs之Data

LLMs之IT:大模型核心技术—指令微调的简介、Self Instruction思想(一种生成指令数据集的方法论—主要用在指令微调阶段)的简介、Alpaca/BELLE应用、实战案例代码实现之详细攻略

目录

相关文章

LLMs之Data:指令微调的简介、Self Instruction思想(一种生成指令数据集的方法论—主要用在指令微调阶段)的简介、Alpaca/BELLE应用、实战案例代码实现之详细攻略

2023年8月21日—Paper:《Instruction Tuning for Large Language Models: A Survey—大型语言模型的指令调优的综述》翻译与解读

2022年12月20日—Self-Instruct框架

《Self-Instruct: Aligning Language Model with Self Generated Instructions》翻译与解读

2022年3月4日—InstructGPT:RLHF指令微调

LLMs之InstructGPT:《Training language models to follow instructions with human feedback》翻译与解读

指令微调的简介

指令微调的概述

1.1、理解指令微调—GPT-3对比InstructGPT:GPT-3 只是在做续写任务,InstructGPT 则能够回答正确内容

1.2、指令数据集、基于指标调优的相关LLMs

Paper:《Instruction Tuning for Large Language Models: A Survey—大型语言模型的指令调优的综述》翻译与解读

Self Instruction思想的简介

1、Self Instruction思想(一一种生成指令数据集的方法论—主要用在指令微调阶段)的概述:

2、基于Self Instruction思想的Alpaca应用

(1)、基于Self Instruction思想的Alpaca数据构造的概述

(2)、alpaca_data.json(实际为Alpaca利用ChatGPT生成52K条指令)、alpaca_data_cleaned_archive.json或alpaca_data_gpt4.json

alpaca_data.json文件

alpaca_data_cleaned_archive.json文件

alpaca_data_gpt4.json文件

3、基于Self Instruction思想的BELLE应用

(1)、基于Self Instruction思想的BELLE数据构造的概述

(2)、核心测试集 eval_set.json

Self Instruction的实战案例

1、基于人为指定指令要求+列举部分指令样例+利用 ChatGPT续写功能→实现举一反来三构造大批指令训练数据集【指令+输入+输出】

生成结果


相关文章

LLMs之Data:指令微调的简介、Self Instruction思想(一种生成指令数据集的方法论—主要用在指令微调阶段)的简介、Alpaca/BELLE应用、实战案例代码实现之详细攻略

发布者:admin,转转请注明出处:http://www.yc00.com/web/1733554957a3694608.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信