2026/4/18 17:21:52
网站建设
项目流程
什么网站可以做饼图,漫画驿站网页设计图纸尺寸图,制作网站代码吗,安徽网站建本文作者分享了从国企跳槽至大模型算法领域社招的完整经历。详细介绍了职业规划考量、简历准备技巧#xff0c;以及大模型相关技术面试要点#xff0c;包括SFT、RAG、Agent等热门技术方向。同时提供了常见代码题考察情况和业务方向分析#xff0c;为想进入大模型领域的求职者…本文作者分享了从国企跳槽至大模型算法领域社招的完整经历。详细介绍了职业规划考量、简历准备技巧以及大模型相关技术面试要点包括SFT、RAG、Agent等热门技术方向。同时提供了常见代码题考察情况和业务方向分析为想进入大模型领域的求职者提供全面指导是一份实用的求职攻略。一、职业道路规划在国企工作即将六年的我终于下定决心走出来。每当HR面问到我跳槽的原因我总是机械地回答两个点一是平台、技术、项目深度没有发展空间二是薪资。但当我扪心自问时离开国企我会失去什么我会失去工作的相对稳定性也会失去这悠闲一些的工作节奏近些年的一些降薪、工作时长改变和业绩指标改革也让我觉得国企并不一定是铁饭碗变革时刻在进行身如孤船在国企这片大海只能随波逐流不受个人意志所改变。性格使然太过闲散的工作对我是种折磨在无聊中寻找乐趣简直太难受了。国企也如温水煮青蛙不进行自我驱动的学习和改变心气都将被消磨殆尽。这些年也尝试过一些副业的想法只收获了一些编程能力的锻炼随着市场的不景气收入也逐渐归零。投身股市自认没有这个本领和抗风险能力。所以我还是选择出来看看。既希望进去大模型的风口一搏也有中年危机的步步紧逼。二、面经总结一堆废话感想略过直接上干货。相对于去年看机会的浅尝辄止拿了几个中厂offer今年目标更新为互联网大厂。1、简历关今年大模型的行情还不错凭借本硕学历国企背景除了预训练的岗位约不到面试外各个大中厂过简历毫无问题。简历内容说实话没什么发挥空间保证写上去的所有内容都如数家珍即可我也没有针对不同厂修改过不同简历。但是可以随着面试节奏和问题热点补充你的简历内容比如一开始agent我做的比较浅就没写但是问的很多热门后续我把这块也进行了补充这样agent的一些岗位也都可以有面试。2、面试问题基本以项目细节拷打穿插大模型八股代码考察为主我总结了不同项目遇到的一些常见考察点和自己浅薄的思考供大家参考。1SFT各种微调技术原理高频基本以LoRA考察为主包括作用原理、初始化方法、参数、其他变种等。原理可以从增量权重矩阵的本征维度出发解析解SVD的不可行性从而引出秩r作为超参模型学习的方法初始化方法是AB之一全0初始化并可以介绍LoRA-GA和LoRA-Pro的方法一般面试官对初始化的变种了解不深参数有alpha和r其他变种问的频率较低。 如何评估微调效果通用能力生成能力人工通用能力是否下降通用数据集测评解决方法训练集加入通用数据集更换不同size基模全参微调幻觉从欠拟合和过拟合的角度分析有尝试过自动化识别幻觉的方法吗RAGLLM评估2RAGRetrival 检索源数据的收集、清洗可说的内容不多索引优化 分块策略固定、overlap、递归分割、small2big等方法从句子和语义截断的思路分析优缺点chunk的原数据附加源文档提取人工构造反向HyDE上下文编码查询优化HyDE等方法向量数据库选型如何更新数据问的很少Embedding BM25Embedding混合检索BM25的原理为什么有效果统计词频TF-IDF角度使用的Embedding model原理M3EXiaoBuBGE等三类任务的InfoNCECoSENT混合损失训练其他对比损失介绍 MRL混合动态维度问的很少Generation Reranker ModelmMARCO/MiniCPM/Jina等原理为什么需要重排从原始语义空间的信息完整性出发和Embedding区别效果有提升吗LLM SFT 评估指标Embedding modelRecallReRanker modellMRR、NDCGEnd-to-EndAccuracyLLM基于query、ground truth和生成answer评估3AgentReAct prompt的构造方法prompt构造CoT我做的比较早并写在简历上了所以会问Function call怎么训练的Function call数据集SFT强化学习MCP比较新可以体现对前沿技术的追踪和理解Agent一些成熟框架我做的比较浅没怎么用过4DeepseekQwen3RL这块单独拿出来说问的太多了考察对新技术的追踪和掌握。R1/Qwen3预训练和后训练方法参考相关技术报告三/四阶段训练由于我不做pretraining方向所以基本能回答上各阶段方法和目标即可。MLA、MoE、PPO/DPO/GRPO原理公式GRPO的改进点和如何实现大部分面试官的关注点到这结束个别的会问到critic model损失和训练方法如何理解未来收益5大模型基础Transformer及其进化Encoder-Decoder架构介绍Positional EncodingTokenizerWordPiece、BPE问的不多Attention高频还是常规问题公式、除以 \sqrt{d_{k}} 原因方差一致梯度消失MHA动机不同语义子空间和不同位置提取信息MQA、GQA、MLA变种参考上文NormalizationLayerNorm和BatchNorm区别维度意义分布假设具体实现为什么需要gamma和beta参数FFN为什么需要Attention捕捉序列内部FFN增强单个位置的特征表达Activation Function介绍几种ReLU、GELU、GLU、Swish、SwiGLU等掌握几种即可Optimizer基本没人问BERT预训练任务MLMNSP变种基本没人问了Decoder-only泛化性注意力退化KV cache轨迹依赖多轮对话训练损失如何计算只计算最后一轮回答梯度消失链式法则和激活函数特性更换激活函数、归一化、残差、权重初始化怎么处理长文本RoPEbias长上下文预训练二分类、多分类的损失函数和评估指标交叉熵查准、召回、F1计网基础点击url到网页渲染过程发生了什么get post区别和其他HTTP方法只有抖音二面问到了一脸懵给我搞成web开发了6代码题统计看来动态规划考察最多绝大多数集中在Leetcode中等难度。美团编辑距离、层次遍历、删除倒数第n个节点、平方根快手最长递增子序列、旋转数组最小值有无重复滴滴最少平方数、最长无重复子串拼多多最长特殊子序列携程最长无重复子串阿里云分词最大概率乘积、层次遍历变种抖音跳跃一次的最大连续子数组和作业帮最长fib子序列腾讯中序后序重建二叉树百度旋转数组查找两个栈实现队列最长公共子数组蚂蚁ip寻址三、业务方向安全合规智能客服/助手传统搜推如何学习AI大模型我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】第一阶段从大模型系统设计入手讲解大模型的主要方法第二阶段在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段以SD多模态大模型为主搭建了文生图小程序案例第七阶段以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。1.AI大模型学习路线图2.100套AI大模型商业化落地方案3.100集大模型视频教程4.200本大模型PDF书籍5.LLM面试题合集6.AI产品经理资源合集获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】