原创学习笔记大模型论文笔记微调

【论文笔记】Parameter-Efficient Transfer Learning for NLP

发表于2024-11-10更新于2025-08-13

字数总计:425阅读时长:1分钟阅读量:7 成都评论数:0

AI-摘要

小嗷犬 GPT

本文是一篇关于“Parameter-Efficient Transfer Learning for NLP”的研究论文笔记，由Neil Houlsby等人撰写，并在ICML 2019上发表。

介绍自己 🙈

生成本文简介 👋

推荐相关文章 📖

前往主页 🏠

前往爱发电购买

学习笔记大模型论文笔记微调

【论文笔记】Parameter-Efficient Transfer Learning for NLP

小嗷犬2024-11-102025-08-13

基本信息

标题: Parameter-Efficient Transfer Learning for NLP
作者: Neil Houlsby, Andrei Giurgiu, Stanislaw Jastrzebski, Bruna Morrone, Quentin de Laroussilhe, Andrea Gesmundo, Mona Attariyan, Sylvain Gelly
发表: ICML 2019
arXiv: https://arxiv.org/abs/1902.00751

摘要

参数高效的NLP迁移学习对NLP中的大型预训练模型微调是一种有效的迁移机制。

然而，在存在许多下游任务的情况下，微调在参数上效率低下：每个任务都需要一个全新的模型。

作为替代方案，我们提出了带有适配器模块的迁移。

适配器模块产生一个紧凑且可扩展的模型；它们为每个任务仅添加少量可训练参数，并且可以添加新任务而无需重新访问之前的任务。

原始网络的参数保持不变，从而实现了高度的参数共享。

为了证明适配器的有效性，我们将最近提出的BERT Transformer模型迁移到26个不同的文本分类任务中，包括GLUE基准。

适配器达到了接近最先进的性能，而每个任务仅添加少量参数。

在GLUE上，我们的性能与完全微调相差0.4%，每个任务仅添加3.6%的参数。

相比之下，微调为每个任务训练了100%的参数。

Adapter tuning与全量微调两种微调方法微调效果随可训练参数量变化的比较。

Adapter tuning

在Transformer Layer的各个模块之间加入Adapter Layer。

Adapter Layer将特征由高维降至低维，经过非线性函数再从低维恢复到高维，并带有残差连接。

微调时冻结其他参数，只微调Adapter Layer。

实验

小嗷犬

分享技术，记录生活

原创【论文笔记】Parameter-Efficient Transfer Learning for NLP

打赏作者

感谢你赐予我前进的力量

WeChat Pay
Alipay

赞赏者名单

因为你们的支持让我意识到写文章的价值🙏

运营模式与责任

本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自小嗷犬！

大模型44 论文笔记66 微调11

喜欢这篇文章的人也看了

【论文笔记】Direct Preference Optimization: Your Language Model is Secretly a Reward Model

【论文笔记】LoRA: Low-Rank Adaptation of Large Language Models

【论文笔记】LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models

【论文笔记】NEFTune: Noisy Embeddings Improve Instruction Finetuning

【论文笔记】P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks

【论文笔记】PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large Language Models

评论

✅ 你无需删除空行，直接评论以获取最佳展示效果

Nickname

Email

Website

0/10000

OωO
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
（╯‵□′）╯︵┴─┴
￣﹃￣
(/ω＼)
∠( ᐛ 」∠)＿
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ｀)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ(￣∇￣o)
ヾ(´･･｀｡)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò｡)
Σ(っ °Д °;)っ
( ,,´･ω･)ﾉ"(´っω･｀｡)
╮(╯▽╰)╭
o(*////▽////*)q
＞﹏＜
( ๑´•ω•) "(ㆆᴗㆆ)

颜文字
Emoji
Bilibili

0 comments

No comment

Mice on Venus - C418

00:00 / 00:00

1 Dry Hands C418
2 Clark C418
3 Moog City C418
4 Danny C418
5 Living Mice C418
6 Mice on Venus C418
7 Subwoofer Lullaby C418
8 Wet Hands C418
9 Sweden C418
10 Haggstrom C418
11 Minecraft C418