做旅游的网站优帮云建设网站企业公司-巴中市网站建设公司-Seo优化

做旅游的网站优帮云建设网站企业公司

2026/5/24 10:22:42 网站建设项目流程

做旅游的网站优帮云,建设网站企业公司,微信网站特征,外贸通网站建设1. LoRA (Low-Rank Adaptation) 核心思想: 不修改原始权重#xff0c;旁路添加低秩矩阵 ┌─────────────────────────────────┐ │ 原始Linear层 (W: 40964096) │ │ ❄️ 冻结不训练 │ │ ↓ x …1.LoRA(Low-Rank Adaptation)核心思想: 不修改原始权重旁路添加低秩矩阵┌─────────────────────────────────┐│ 原始Linear层 (W: 4096×4096) ││ ❄️ 冻结不训练 ││ ↓ x ││ W·x (输出) │└─────────────────────────────────┘ (相加)┌─────────────────────────────────┐│ LoRA旁路 ││ x → A(8×4096) → B(4096×8) ││ 只训练这两个矩阵 ││ ↓ ││ B·A·x (输出) │└─────────────────────────────────┘2.Prompt Tuning核心思想: 在输入序列前添加可学习的软提示词原始输入:[The, movie, is, great] → Encoder → 输出Prompt Tuning:[P1, P2, P3, ..., Pk, The, movie, is, great] → Encoder → 输出↑____________↑可学习的soft prompts(只训练这些)具体做法:模型权重全部冻结只在输入前添加 k 个可学习的embedding向量 (比如20个)只训练这20个向量参数量: 极少 (20 × 768维 ≈ 15K参数)输入层:┌──────────────────────────────────────┐│ [P₁] [P₂] [P₃] ... [Pₖ] │ ← 可训练的prompt embeddings│ [❄️The] [❄️movie] [❄️is] [❄️great] │ ← 真实输入(正常处理)└──────────────────────────────────────┘↓❄️ Transformer层 (冻结)↓输出3.Adapter核心思想: 在Transformer层之间插入小型瓶颈网络原始Transformer块: Input → Self-Attention → AddNorm → FFN → AddNorm → Output 加入Adapter后: Input → Self-Attention → AddNorm → [Adapter] → FFN → AddNorm → [Adapter] → Output ↑ ↑ 新插入的模块新插入的模块具体做法:Transformer层冻结在每层后插入Adapter模块只训练Adapter参数参数量: 1-3% (取决于bottleneck大小)4.IA3(Infused Adapter by Inhibiting and Amplifying Inner Activations)【基本不用】核心思想: 用可学习的缩放向量调整激活值原始: h W·x IA3: h (W · diag(l)) · x W · (l ⊙ x) ↑ ↑ 可学习的缩放向量逐元素相乘具体做法:权重矩阵W冻结只学习一个缩放向量l(长度等于输入维度)将输入x逐元素乘以l然后再乘以W参数量: 极少 (每层只有一个向量, 比如768个参数)可视化:对于 K、V、FFN 的投影: 输入 x (768维) ↓ x ⊙ l_k (逐元素相乘) ← l_k是768维可训练向量 ↓ ❄️ W_k · (缩放后的x) ← W_k冻结 ↓ 输出5.Full FT(Full Fine-Tuning / 全量微调)核心思想: 所有参数都训练预训练模型的所有参数 → 全部解冻 → 在下游任务上训练具体做法:加载预训练权重所有层的所有参数都设为可训练在目标数据集上重新训练参数量: 100%6.固定Encoder(Feature Extraction)核心思想: 把预训练模型当特征提取器只训练新加的分类头输入 → ❄️Encoder(冻结) → 特征 → 分类头(新建训练) → 输出具体做法:Encoder所有层冻结去掉原来的输出层加一个新的比如线性层只训练这个新的分类头参数量: 1% (只有分类头)https://mp.weixin.qq.com/s/aAIuZ8LH3flnxNLtlP6d0w

标签：网站建设企业官网项目流程 UI设计前端开发

您可能感兴趣的其他内容

企业官网建设流程全解析

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

热门文章

贵州网站设计户外平台设计

python网站开发框架wordpress翻译

网站建设制作视频教程深圳网站建设公司招聘电话销售

莆田网站制作设计做一电影网站的apk

网站空间买卖wordpress极简中文主题

设计师做单页的网站wordpress注册页模板

文章分类

标签云

相关文章

好网站欣赏搜索引擎优化的内容

东莞手机网站建设qq邮箱做网站

黄页88网站推广效果建站平台免代码

需要专业的网站建设服务？