网站运营托管咨询网页用什么软件制作
2026/5/19 3:36:17 网站建设 项目流程
网站运营托管咨询,网页用什么软件制作,比较酷炫的企业网站,网站建设公司前十名本文介绍了微调的基本概念#xff0c;以及如何对语言模型进行微调。 从 GPT3 到 ChatGPT、从GPT4 到 GitHub copilot的过程#xff0c;微调在其中扮演了重要角色。什么是微调#xff08;fine-tuning#xff09;#xff1f;微调能解决什么问题#xff1f;什么是 LoRA…本文介绍了微调的基本概念以及如何对语言模型进行微调。从 GPT3 到 ChatGPT、从GPT4 到 GitHub copilot的过程微调在其中扮演了重要角色。什么是微调fine-tuning微调能解决什么问题什么是 LoRA如何进行微调本文将解答以上问题并通过代码实例展示如何使用 LoRA 进行微调。微调的技术门槛并不高如果微调的模型规模不大 10B 及 10B 以下所需硬件成本也不高10B模型并不是玩具不少生产中会使用10B的模型即使非专业算法同学也可动手尝试微调自己的模型。除了上面提到的 ChatGPT、GitHub copilot产品微调可以做的事情还非常多。如针对特定任务让模型编排API论文GPT4Tools: Teaching Large Language Model to Use Tools via Self-instruction、模拟特定人的说话方式character.ai 产品目前估值10亿美元、让模型支持特定语言还有B站上各种 stable diffusion 炼丹教程都用到了微调技术。微调是利用已经训练好的模型通常是大型的预训练模型作为起点在新的数据集进一步训练模型从而使其更适合特定的应用场景。本文介绍 fine-tuning 的概念与过程并对一个微调的过程代码进行分析。一、什么是 fine-tuningGPT-3 使用大量互联网上的语料训练完成后并不适合对话这个场景。如给到 GPT3 输入“中国的首都是哪里” GPT3 基于训练后的模型的参数进行推理结果可能是“美国的首都是哪里”。训练数据中这两句话一起出现的概率非常高在GPT3的训练预料里面可能也会出现多次。但这种输出明显不满足 ChatGPT 的场景。还需要多阶段的优化过程使 ChatGPT 更擅长处理对话并且能够更好地理解和回应用户的需求。CPT3 模型的微调过程包括几个关键步骤1.在大规模文本数据集上进行预训练形成基础的语言能力GPT3。2.通过监督微调让模型适应对话任务使其生成的文本更符合人类对话习惯。3.使用基于人类反馈的强化学习使用用户反馈数据如赞踩、评分进一步优化模型的输出质量使其在多轮对话中表现得更连贯和有效。4.通过持续的微调和更新适应新需求并确保输出的安全性和伦理性。后续会对上述步骤中的一些概念如监督微调、强化学习做介绍在开始之前先分析微调能起到什么作用。1.1. 为什么要 fine-tuning1.1.1. 微调可以强化预训练模型在特定任务上的能力1.特定领域能力增强微调把处理通用任务的能力在特定领域上加强。比如情感分类任务本质上预训练模型是有此能力的但可以通过微调方式对这一能力进行增强。2.增加新的信息通过微调可以让预训练模型学习到新的信息比如常见的自我认知类的问题“你是谁”“你是谁创造的”这类问题可通过微调让模型有预期内回答。1.1.2. 微调可以提高模型性能1.减少幻觉通过微调可以减少或消除模型生成虚假或不相关信息的情况。2.提高一致性模型的输出一致性、稳定性更好。给模型一个适度的 temperature 往往会得出质量高更有创造性的结果但结果是每次输出内容都不一样。这里的一致性和稳定性是指虽每次生成内容不同但质量维持在一个较高的水平而不是一次很好一次很差。3.避免输出不必要的信息比如让模型对宗教作出评价模型可以委婉拒绝回复此类问题。在一些安全测试、监管审查测试时非常有用。4.降低延迟可通过优化和微调使用较小参数的模型达到预期效果减少模型响应的延迟时间。1.1.3. 微调自有模型可避免数据泄漏1.本地或虚拟私有云部署可以选择在本地服务器或虚拟私有云中运行模型自主控制性强。2.防止数据泄漏这点对于一些公司来说非常重要不少公司的核心竞争优势是长年积累的领域数据。3.安全风险自主可控如果微调使用特别机密的数据可自定义高级别的安全微调、运行环境。而不是把安全问题都委托给提供模型推理服务的公司。1.1.4. 使用微调模型可降低成本1.从零创造大模型成本高对大部分公司而言也很难负担从零开始训练一个大模型的成本。meta最近开源的 llama3.1 405B模型24000张H100集群训练54天。但在开源模型之上进行微调使用一些量化减少精度微调方式可以大大降低门槛还可以得到不错的效果。2.降低每次请求的成本一般而言相同的性能表现使用微调的模型与通用模型比模型的参数量会更少成本也就更低。3.更大的控制权可以通过模型参数量、使用的资源自主平衡模型性能、耗时、吞吐量等为成本优化提供了空间。1.2. 一些相关概念区分1.2.1. 基于人类反馈的强化学习RLHF与监督微调SFT目前 OpenAI 的公开信息ChatGPT 的主要改进是通过微调和 RLHF 来实现的。从 GPT3 到 ChatGPT大概过程如下预训练 → 微调SFT → 强化学习RLHF → 模型修剪与优化。强化学习与微调有什么区别简单来说开发 ChatGPT 过程中微调使模型能够生成更自然、更相关的对话而强化学习强化学习帮助模型通过人类反馈来提升对话质量。基于人类反馈的强化学习Reinforcement Learning from Human Feedback, RLHF是一种强化学习Reinforcement Learning的具体方式。强化学习Reinforcement Learning, RL是一种机器学习方法模型通过与环境的交互来学习决策策略。模型在每一步的选择中会得到奖励或惩罚目标是最大化长期的累积奖励。在自然语言处理NLP中强化学习可以用于优化模型的输出使其更符合期望的目标。SFTSupervised Fine-Tuning监督微调是一种微调的类型。如果按照是否有监督还有无监督微调Unsupervised Fine-Tuning在没有明确标签的情况下对预训练模型进行微调、自监督微调Self-Supervised Fine-Tuning模型通过从输入数据中生成伪标签如通过数据的部分遮掩、上下文预测等方式然后利用这些伪标签进行微调。图片来自OpenAI 论文Training language models to follow instructions with human feedback在ChatGPT的训练中OpenAI使用了一种称为通过人类反馈的强化学习Reinforcement Learning from Human Feedback, RLHF的方法。RLHF流程通常包括以下几个步骤1.初始模型生成使用监督学习训练初始语言模型Step1的过程它已经能够生成合理的对话内容。2.人类反馈人类评审者与模型进行互动对模型的回答进行评价标注出哪些回答更好。Step2中的 A labeler ranks the outputs 的过程为标注员反馈的过程。3.奖励模型训练基于人类反馈的数据训练一个奖励模型Step2 中的 reward model该模型能够根据输入的内容对模型输出进行评分。4.策略优化使用强化学习技术让模型生成更高评分的输出Step3的过程。强化学习与微调相比不论技术门槛、构造数据的成本、训练成本、训练时间、最终效果的不确定性强化学习与微调都要高很多。强化学习需要使用大量人工标注的数据先训练一个奖励模型然后需要通过大量尝试与迭代在优化语言模型。在生产实践中虽然强化学习也可提升具体任务表现但对特定任务采用 SFT 的方式往往能取得不错的效果。而强化学习成本高非常依赖标注的数据相对于 SFT 使用不多。1.2.2. 继续预训练与微调ChatGPT 的定位是一个通用场景的对话产品在具体行业或领域内类似 ChatGPT 的产品定位会更加细分。比如经常听到的医疗大模型、法律大模型、资金安全大模型。这种“行业大模型”不少是通过对基座继续预训练方式得到的。继续预训练是在已经预训练的模型基础上进一步在特定领域的数据上进行训练以提高模型对该领域的理解和适应能力。数据集通常是未标注的并且规模较大。微调一般的目的在于优化模型在特定任务上的表现。微调通常是在一个小规模的任务数据集上进行的目的是让模型在该特定任务上达到最佳表现。两者可以结合使用比如在安全领域内一个特定的任务如对欺诈手法打一些具体的标签模型使用的方式大概如下通用预训练例如在大规模互联网数据上公司级别进行训练 → 继续预训练在特定领域数据上公司内不同的行业/部门 → 微调基于特定任务数据部门/行业负责具体业务的小组各自微调。1.3. 小结通过微调可以提升模型在特定任务上的表现。相对于预训练、强化学习在生产过程中使用到微调技术的场景更多了解基本概念后非技术人员也可进行微调下一章节主要围绕如何微调进行展开。二、如何 Fine-tuning2.1. 微调的基本原理微调是基于一个已经训练好的神经网络模型通过对其参数进行细微调整使其更好地适应特定的任务或数据。通过在新的小规模数据集上继续训练模型的部分或全部层模型能够在保留原有知识的基础上针对新任务进行优化从而提升在特定领域的表现。根据微调的范围可以分为全模型微调和部分微调。全模型微调Full Model Fine-Tuning更新模型的所有参数适用于目标任务与预训练任务差异较大或需要最大化模型性能的场景。虽然这种方法能获得最佳性能但它需要大量计算资源和存储空间并且在数据较少的情况下容易导致过拟合。相比之下部分微调Partial Fine-Tuning仅更新模型的部分参数其他参数保持冻结。这种方法减少了计算和存储成本同时降低了过拟合的风险适合数据较少的任务但在任务复杂度较高时可能无法充分发挥模型的潜力。生产中使用较多的是部分微调的方式由于大模型的参数量级较大即使对于部分参数调整也需要非常多的计算资源目前使用比较多的一种方式的是参数高效微调Parameter-Efficient Fine-Tuning, PEFT PEFT 通过引入额外的低秩矩阵如 LoRA或适配层如 Adapters减少计算资源的需求。LoRA 是一种高效的微调技术能显著降低了微调的参数量和计算资源需求。它在保持模型原有能力的同时实现了任务特定的高效适应是一种特别适合大模型微调的技术。下一小节注重介绍下 LoRA 这种微调方式。2.2. 什么是 LoRA2.2.1. LoRA 基本概念LoRA 原理来源 LoRA 论文LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELSLoRALow-Rank Adaptation通过引入低秩矩阵来减少微调过程中需要更新的参数数量矩阵A和矩阵B从而显著降低计算资源需求降低为之前1/3论文中数据。LoRA 另外一个非常重要的特性是可重用性。由于LoRA不改变原模型的参数它在多任务或多场景的应用中具有很高的可重用性。不同任务的低秩矩阵可以分别存储和加载灵活应用于不同任务中。比如在手机终端上要跑应用的终端大模型。一个应用的模型会处理不同的任务可以针对不同的任务训练不同的 LoRA 参数运行时基于不同任务使用相同的基座模型动态加载需要的 LoRA 参数。相对于一个任务一个模型可以大大降低存储、运行需要的空间。2.2.2. LoRA 原理分析在机器学习中通常会使用非常复杂的矩阵来让模型处理数据。这些结构通常都很“全能”它们可以处理非常多种类的信息。但研究表明让模型去适应特定任务时模型其实并不需要用到所有这些复杂的能力。相反模型只需要利用其中一部分就能很好地完成任务。打个比方这就像你有一把瑞士军刀里面有很多工具像剪刀、螺丝刀等等但是在解决特定任务时通常只需要用到其中的几个工具就可以完成大多数工作。在这个例子中模型的矩阵就像瑞士军刀虽然它很复杂全秩但实际上你只需要用到一些简单的工具低秩就足够了。也就是说微调的时候只调整那些对特定任务有影响的参数就可以了。原始矩阵维度较高假设为 d*k 维矩阵W0要想进行矩阵调整并且保持矩阵的数据为了重用最简单方式是使用矩阵加法增加一个 d*k 维度的矩阵ΔW。但如果微调的数据还是一个d*k维度的矩阵参数量就很多。LoRA 通过将后者表示为低秩分解来减少参数的量级。其中上图是矩阵分解后的示意图可以直观的从矩阵的面积感知参数的多少W0 为原始权重矩阵如果需要进行全参数微调W0 面积对应的参数都需要进行调整而 LoRA 的方式只调整矩阵B、和矩阵A对应的参数面积的矩阵比W0要少很多。举例计算d 为 1000k为 1000本来需要计算ΔW 1000*1000 100w 个参数但通过矩阵分解如果 r 4那么只需要计算 1000 * 4矩阵B 4*1000矩阵A 8000 个参数。这里的 r 4 并不是为了参数量级的减少而特意选的小的值实际微调时很多情况使用的值就是4论文中中实验数据表明在调整 Transformer 中的权重矩阵时在 r 1 时对特定任务就有非常好的效果。上面表格为在 WikiSQL 和 MultiNLI 上使用不同秩r的 LoRA 验证准确率。适配 Wq 和 Wv时只有1的秩就足够了而仅训练Wq则需要更大的r。Wq, Wk, Wv, Wo为 Transformer架构中自注意力模块中的权重矩阵。2.3. 微调过程微调基本过程大概如下1.准备数据收集与目标任务相关的标注数据将数据分为训练集、验证集进行Tokenization处理。2.微调参数设配置LoRA参数、微调参数如学习率确保模型收敛。3.微调模型在训练集上训练模型并调整超参数以防止过拟合。4.评估模型在验证集上评估模型性能。其中需要特别注意的是微调过程中使用的数据要求如下1.高质量非常重要再强调也不过分Garbage in garbage out、Textbooks Are All You Need都在强调数据质量重要性。2.多样性就像写代码的测试用例一样尽量使用差异较大数据能覆盖的场景更多的数据。3.尽量人工生成语言模型生成的文本有一种隐含的“模式”。在看一些文字的时候经常能识别出来“这是语言模型生成的”。4.数量不少太少通过LoRA论文看100条开始有明显的改善1000条左右有不错的效果。关于微调的数据量OpenAI 微调至少 10 就可以。一般经验而言 50 到 100条数据有非常明显的微调效果。建议是从 50 条开始有明显效果逐步增加数量。Example count recommendationsTo fine-tune a model, you are required to provide at least 10 examples. We typically see clear improvements from fine-tuning on 50 to 100 training examples with gpt-3.5-turbo but the right number varies greatly based on the exact use case.We recommend starting with 50 well-crafted demonstrations and seeing if the model shows signs of improvement after fine-tuning. In some cases that may be sufficient, but even if the model is not yet production quality, clear improvements are a good sign that providing more data will continue to improve the model. No improvement suggests that you may need to rethink how to set up the task for the model or restructure the data before scaling beyond a limited example set.2.4. 使用 LoRA 微调代码分析本节使用 LoRA 微调了一个 67M 的 Bert的蒸馏模型distilbert/distilbert-base-uncased实现对电影的评论进行分类的功能用于是正面还是负面的评论微调使用的数据为 stanfordnlp/imdb相关资源地址初始模型https://huggingface.co/distilbert/distilbert-base-uncased微调数据https://huggingface.co/datasets/stanfordnlp/imdb完整代码地址https://github.com/wangzhenyagit/myColab/blob/main/fine-tuning.ipynb使用的 colab 免费的T4 GPU跑代码一定记得设置CPU慢不止10倍进行微调的1000条微调数据10个Epoch大概6分钟跑完稍大参数量的模型应该也可以免费微调。如果微调10B的模型估计需要付费买些计算资源充值10美元估计差不多。最终实现效果从微调前50%的正确率基本瞎猜微调后为87%。只微调 Wq 权重矩阵。r 4 数据如下r 1 数据如下可见和 LoRA 论文中的结论差不多在微调Wq的情况下 r 1 就已经足够了(相差不到 0.01可忽略)。代码分析如下。2.4.1. 基本库安装与包引入2.4.2. 微调数据构造imdb 中数据格式例子如下分别使用1000条数据作为微调数据与验证数据。训练数据中正向与负向的评价各自50%。2.4.3. 加载初始模型from transformers import AutoModelForSequenceClassificationmodel_checkpoint distilbert-base-uncased# model_checkpoint roberta-base # you can alternatively use roberta-base but this model is bigger thus training will take longer # define label mapsid2label {0: Negative, 1: Positive}label2id {Negative:0, Positive:1} # generate classification model from model_checkpointmodel AutoModelForSequenceClassification.from_pretrained( model_checkpoint, num_labels2, id2labelid2label, label2idlabel2id)# display architecturemodel模型架构DistilBertForSequenceClassification( (distilbert): DistilBertModel( (embeddings): Embeddings( (word_embeddings): Embedding(30522, 768, padding_idx0) (position_embeddings): Embedding(512, 768) (LayerNorm): LayerNorm((768,), eps1e-12, elementwise_affineTrue) (dropout): Dropout(p0.1, inplaceFalse) ) (transformer): Transformer( (layer): ModuleList( (0-5): 6 x TransformerBlock( (attention): MultiHeadSelfAttention( (dropout): Dropout(p0.1, inplaceFalse) (q_lin): Linear(in_features768, out_features768, biasTrue) (k_lin): Linear(in_features768, out_features768, biasTrue) (v_lin): Linear(in_features768, out_features768, biasTrue) (out_lin): Linear(in_features768, out_features768, biasTrue) ) (sa_layer_norm): LayerNorm((768,), eps1e-12, elementwise_affineTrue) (ffn): FFN( (dropout): Dropout(p0.1, inplaceFalse) (lin1): Linear(in_features768, out_features3072, biasTrue) (lin2): Linear(in_features3072, out_features768, biasTrue) (activation): GELUActivation() ) (output_layer_norm): LayerNorm((768,), eps1e-12, elementwise_affineTrue) ) ) ) ) (pre_classifier): Linear(in_features768, out_features768, biasTrue) (classifier): Linear(in_features768, out_features2, biasTrue) (dropout): Dropout(p0.2, inplaceFalse))一个6层的 Transformer 模型LoRA 影响的是(q_lin):Linear(in_features768, out_features768, biasTrue)这一层的权重是个768*768 矩阵的权重向量。2.4.4. tokenize 与 pad 预处理# create tokenizerfrom transformers import AutoTokenizer # Import AutoTokenizertokenizer AutoTokenizer.from_pretrained(model_checkpoint, add_prefix_spaceTrue) # add pad token if none existsif tokenizer.pad_token is None: tokenizer.add_special_tokens({pad_token: [PAD]}) model.resize_token_embeddings(len(tokenizer)) # create tokenize functiondef tokenize_function(examples): # extract text text examples[text] #tokenize and truncate text tokenizer.truncation_side left tokenized_inputs tokenizer( text, return_tensorsnp, truncationTrue, max_length512, # Change max_length to 512 to match models expected input length paddingmax_length # Pad shorter sequences to the maximum length ) return tokenized_inputs # tokenize training and validation datasetstokenized_dataset dataset.map(tokenize_function, batchedTrue) from transformers import DataCollatorWithPadding # Import DataCollatorWithPaddingdata_collator DataCollatorWithPadding(tokenizertokenizer) tokenized_dataset对于 Tokenize 和 pad几点说明1.数字化表示**与模型对齐**语言模型无法直接理解原始的文本数据。这些模型处理的对象是数字化的表示形式Tokenize 的过程将文本转化为模型可以处理的整数序列这些整数对应于词汇表中的特定单词或子词。不同模型使用不同的 Tokenize 方式这也要求微调的时候需要与模型中的一致。2.减少词汇量Tokenize 过程根据词汇表将文本切分为模型可识别的最小单位如单词、子词、字符。这不仅减少了词汇量降低了模型的复杂性还提高了模型处理罕见词或新词的能力。3.**并行计算需要**通过 tokenization可以将输入文本统一为模型预期的固定长度。对于较长的文本Tokenize 过程可以将其截断对于较短的文本可以通过填充padding来补足长度。这样模型输入具有一致性便于并行计算。上面是文本进行 Tokenize 的过程其中 Tuning 被拆成了两个小的token这样就可以用有限的 token 来表示所有的单词。这也是有些时候大语言模型会“造词”的原因错误的生成Decode后的词可能是没有的单词。2.4.5. 微调配置微调前数据import torch # Import PyTorch model_untrained AutoModelForSequenceClassification.from_pretrained( model_checkpoint, num_labels2, id2labelid2label, label2idlabel2id) # define list of examplestext_list [It was good., Not a fan, dont recommed., Better than the first one., This is not worth watching even once., This one is a pass.] print(Untrained model predictions:)print(----------------------------)for text in text_list: # tokenize text inputs tokenizer.encode(text, return_tensorspt) # compute logits logits model_untrained(inputs).logits # convert logits to label predictions torch.argmax(logits) print(text - id2label[predictions.tolist()])输出基本是随机输出。Untrained model predictions:----------------------------It was good. - PositiveNot a fan, don’t recommed. - PositiveBetter than the first one. - PositiveThis is not worth watching even once. - PositiveThis one is a pass. - Positiveimport evaluate # Import the evaluate module # import accuracy evaluation metricaccuracy evaluate.load(accuracy)# define an evaluation function to pass into trainer laterdef compute_metrics(p): predictions, labels p predictions np.argmax(predictions, axis1) return {accuracy: accuracy.compute(predictionspredictions, referenceslabels)} from peft import LoraConfig, get_peft_model # Import the missing functionpeft_config LoraConfig(task_typeSEQ_CLS, r1, lora_alpha32, lora_dropout0.01, target_modules [q_lin])peft_config:LoraConfig(peft_typePeftType.LORA: ‘LORA’, auto_mappingNone, base_model_name_or_pathNone, revisionNone, task_type‘SEQ_CLS’, inference_modeFalse, r1, target_modules{‘q_lin’}, lora_alpha32, lora_dropout0.01, fan_in_fan_outFalse, bias‘none’, use_rsloraFalse, modules_to_saveNone, init_lora_weightsTrue, layers_to_transformNone, layers_patternNone, rank_pattern{}, alpha_pattern{}, megatron_configNone, megatron_core‘megatron.core’, loftq_config{}, use_doraFalse, layer_replicationNone, runtime_configLoraRuntimeConfig(ephemeral_gpu_offloadFalse))几点说明1.task_type“SEQ_CLS”说明任务的类型为分类任务。2.r1LoRA 的 rank在论文 7.2 WHAT IS THE OPTIMAL RANK r FOR LORA? 有分析此参数影响一般为18通常可设置为4。3.lora_alpha32, lora_alpha 参数是一个缩放因子B*A的权重系数h W0 lora_alpha*B*A。用于控制 LoRA 适应矩阵对原始权重的影响程度。经验法则是在开始时尝试一个较大的值如 32。4.lora_dropout0.01防止模型过拟合的配置训练过程中随机“丢弃”一部分神经元来防止模型过拟合通常从一个较小的值开始。5.target_modules [‘q_lin’]前面提到的影响的权重矩阵这里只影响 model 中 q_lin。model get_peft_model(model, peft_config)model.print_trainable_parameters()trainable params: 601,346 || all params: 67,556,356 || trainable%: 0.8901训练的数量不到参数量的百分之一。参数量越大的模型这个训练的参数比越小。# hyperparameterslr 1e-3batch_size 4num_epochs 10 from transformers import TrainingArguments # Import Trainer # define training argumentstraining_args TrainingArguments( output_dir model_checkpoint -lora-text-classification, learning_ratelr, per_device_train_batch_sizebatch_size, per_device_eval_batch_sizebatch_size, num_train_epochsnum_epochs, weight_decay0.01, evaluation_strategyepoch, save_strategyepoch, load_best_model_at_endTrue,) from transformers import Trainer# creater trainer objecttrainer Trainer( modelmodel, argstraining_args, train_datasettokenized_dataset[train], eval_datasettokenized_dataset[validation], tokenizertokenizer, data_collatordata_collator, # this will dynamically pad examples in each batch to be equal length compute_metricscompute_metrics,) # train modeltrainer.train()输结果为开头表格数据。再次运行开始的的测试数据输出Trained model predictions:--------------------------It was good. - PositiveNot a fan, don’t recommed. - NegativeBetter than the first one. - PositiveThis is not worth watching even once. - NegativeThis one is a pass. - Positive微调后分类正确。以上为 LoRA 微调的代码示例。篇幅原因一些参数没有具体讲解推荐使用Colab目前Google也集成了免费的Gemini参数意思有些模糊可以直接提问试用下来和GPT-4o效果差不多。而且有报错一键点击Gemini 就能提供改进建议基本一次就能解决问题。三、结语本文介绍了微调的基本概念以及如何对语言模型进行微调。微调虽成本低于大模型的预训练但对于大量参数的模型微调成本仍非常之高。好在有摩尔定律相信随着算力增长微调的成本门槛会越来越低微调技术应用的场景也会越来越多。“Textbooks Are All You Need” 这篇论文中强调了数据质量对预训练的重要性deep learning的课程中也强调了训练数据的 Quality。想起 AngelList 创始人 Naval 的一句话“Read the Best 100 Books Over and Over Again ” 微调之于模型类似于人去学习技能/特定领域知识。高质量的输入非常重要正确方式可能是阅读经典反复阅读。想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容​一、学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI1. 100本大模型方向电子书2. 26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC 实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。3. 600套技术大会 PPT听行业大咖讲实战PPT 整理自 2024-2025 年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。二、求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌1. 107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自 2021-2025 年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析2. 102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑3. 97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”三、路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、关键技术以及大模型应用场景。L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。L5阶段专题集丨特训篇 【录播课】四、资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容​2025 年想抓住 AI 大模型的风口别犹豫这份免费资料就是你的 “起跑线”

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询