2026/5/23 16:18:26
网站建设
项目流程
公司后台网站怎么做,做电影网站需要的服务器配置,wordpress ftp 端口,费县网站建设scaling law 开始停滞不前#xff0c;大家逐渐意识到真正重要的是强化学习。
过去一年中#xff0c;绝大多数进展正是由这一方法推动的。然而事实证明#xff0c;这种判断是错的。就连OpenAI这样的顶尖实验室也被打了个措手不及#xff0c;并为此付出了代价。
下面我将解释…scaling law 开始停滞不前大家逐渐意识到真正重要的是强化学习。过去一年中绝大多数进展正是由这一方法推动的。然而事实证明这种判断是错的。就连OpenAI这样的顶尖实验室也被打了个措手不及并为此付出了代价。下面我将解释为何预训练pre-training即通过模仿学习这种经典AI训练的方法不仅远未消亡反而正蓄势待发将在2026年迎来一场“复兴”。耐心看完下面的内容无论是做AI产品还是投资相关标的都会有帮助。两条AI扩展定律我们现在都知道要让AI变得更好主要有两种路径“更大”bigger与“思考更久”thinking for longer。但要理解二者我们先需简要地回顾ChatGPT类模型的构建原理。“世事变迁愈烈本质却愈恒常。”从外部看AI行业生机勃勃、喧嚣纷呈技术突破、炒作浪潮、迅猛迭代堪称人类史上最具活力的产业。但事实上当前AI模型与近十年前的模型惊人地相似。早年发现的基本原理不仅依然有效更仍是当今进步的支柱。算法层面的实质性改进多年以来几乎停滞不前。因此当前最前沿的模型仍高度趋同决定谁领先的关键变量主要仍是训练数据规模与算力。归根结底一切都取决于算力不仅在于你拥有多少更关键的是你如何高效地使用它。第一条扩展定律预训练“更大”第一条扩展定律围绕模仿学习imitation learning展开向模型喂入海量数据要求其模仿。通过机械式重复模型从中提炼数据底层规律。这是一种归纳式过程当模型反复看到“I”后接“am”下次再遇到“I”就更可能预测出“am”。如何优化这一方法是扩大训练预算具体体现为1扩大数据集规模2扩大模型参数规模。但这些数据究竟有多大其规模近乎难以想象。Transformer的训练预算以FLOPs——浮点运算次数衡量可近似用公式 6 × D × N 计算。6代表一次前向传播2×FLOPs与一次反向传播4×FLOPs。D为训练词元token总数N是模型参数量。对当前主流的MOE模型“N”实为“A”即激活参数量暂不深究。如今的前沿预训练预算已达约 10²⁷ FLOPs即100亿亿亿次浮点运算1 octillion FLOPs。依上述公式假设模型参数为5万亿实际尚不及最前沿水平则对应训练数据量约为 3.33 × 10¹³ tokens。按平均每词0.75词元估算相当于24万亿单词的训练数据。而这仅是一次训练运行的规模2025年已出现多次同级甚至更大规模的训练可见“大数据”之“大”名副其实。过去十年间我们曾笃信只需将此流程“卷”到极致甚至一度认为仅靠扩大模型规模便能抵达通用人工智能AGI。然而当著名的GPT-4.5训练失败原计划为GPT-5后人们猛然醒悟这不仅不是实现AGI的充分条件技术实已陷入停滞。随后ChatGPT之父 Ilya Sutskever公开宣称我们熟知的扩展定律已死。第二条扩展定律后训练“思考更久”约两年前正值预训练狂热高峰之际包括IIya本人在内的OpenAI少数研究员提出一问“如果我们给模型时间思考呢”逻辑很简单人类面对复杂任务时并非立即作答而是先在脑内反复推演我们常将问题拆解为更简单的步骤这本质上是向任务投入更多‘思考’。于是他们开始测试此构想。方法极其简单基于一个已完成预训练的LLM用小型“冷启动”带思维链的数据然后就可以向其提出中等难度问题但不直接提供答案供模仿而是让其通过试错自行推导。这种试错训练法即强化学习RL一项已有三十年历史、如今终被规模化应用的技术—效果惊人由此诞生了第二条扩展定律当模型被赋予思考时间其表现将大幅提升。“推理模型”reasoning models应运而生以OpenAI的o1为先驱。这种额外训练阶段称为“后训练”post-training因发生在预训练之后。它使GPT-4o蜕变为o1在所有“思考时间越长表现越好”的基准测试中全面跃升。如今我们还有“中期训练”mid-training即预训练与后训练间的补充训练。虽概念略显拗口却支持灵活操作如DeepSeek v3.2在不重训的前提下改良注意力机制。更关键在于此扩展定律不仅能提升“聪明模型”的智商还可让小模型凭借inference-time compute媲美大模型。过去一年间扩大后训练算力成了各家AI实验室的执念。潜在推理Latent Reasoning的重要性评判智能无论对象是模型还是人类我们既可以看结果“观其行”也可以看过程“察其思”。多数人倾向前者但我坚信后者更优。原因如下前者可概括为著名“鸭子测试”duck test“若其行如鸭、鸣如鸭则必为鸭。”我反对的是聪明结果等于智能本身我们应关注过程。评估智能主要是看如何抵达结论无论结论是否正确。因为模型看似智能实则多为复述记忆数据。你能死记硬背一道极难的物理学博士考题答案但这绝不意味着你具备博士级物理智慧。更何况有大量证据表明记忆仍在模型能力中扮演重要角色。评估AI能解决的最复杂问题时我们常将算力调至极限观察其能力边界。赋予模型充裕推理算力测试其上限。METR基准即典型衡量AI在80%情况下能完成的最长软件工程任务。但此类基准设计允许模型自由生成token意味着结果未必具商业可行性。这里我们实质在问“如果忽略成本模型能力极限何在”因为单次任务可能涉及数十万乃至数百万次token消耗。这确实是衡量推理算力进步的绝佳方式。但过度聚焦于此会使人忽视基座模型本身也需要提升。我们应观察单次预测质量的净提升。因这点差异可能导致一模型需比另一模型多耗100倍算力生成更多词元仅因其单次预测质量更低被迫靠堆砌推理步数抵达答案。单次前向传播Single Forward Pass我们真正想评估的是单次前向传播forward pass的质量即模型仅凭当前输入预测下一个token的能力。这样我们就能回答LLM凭借单次预测在无“外显推理”时能力边界何在这里的思考是这样的人类被要求即兴作答时成败取决于是否“知道答案”。而对AI而言“外显推理”本就是记忆序列的一部分强制其跳过外显推理便切断其连接问题与答案的关键环节记忆在此失效。如果模型在无推理轨迹时仍能解决需推理的问题这便是评估其潜在推理能力latent reasoning即内在、非外显的推理智能的绝佳指标。那么模型在此项测试中表现如何好消息是预训练层面仍有进展。通俗地说模型的“单次预测智能”正在提升即每预测一次就更聪明一分。其中尤以Gemini与Claude为甚如下图线性/对数尺度所示其代际间呈现清晰净提升。反观OpenAI则已完全将进步押注于推理算力。其GPT-4到GPT-5代际间仅现中等性能提升进步主要源于第二条扩展定律单任务投入更多算力。这也解释了我个人体验ChatGPT在非推理任务上表现极度糟糕其非推理版GPT-5.2 Instant堪称对技术进步的侮辱迫使我永远开启‘Thinking’开关确保所有答复均经推理生成。OpenAI首席研究官Mark Chen已公开承认过去一年其后训练投入“过头”现已转回重拾“预训练”。DeepMind高管Oriol Vinyals更直言预训练是Gemini 3 Pro惊艳表现的关键。可见预训练不仅尚在并且正深刻影响普通用户的体验。2026年其研究关注度必将远超2025年“已死”论调。而这对你我意味着什么推理决定服务器规模训练决定数据中心规模。如果预训练仍是进步核心驱动力则数据中心扩建压力必将重燃且证据确凿。原因在于预训练数据规模如前所述其体量已极庞大且只会更大。这意味着训练需集成更多加速器如GPU。同时随着训练预算增长我们也将更倾向采用“专家稀疏化”expert sparsity。此技术由DeepSeek推广当前前沿模型已普遍采用细粒度专家混合MoE将模型“分割”为更小子模型以降低单次预测运算量。MoE并非真将模型物理切分而是划分MLP层其占FLOPs大头从而按激活专家数均摊算力需求。鉴于GPU集群扩展难度极高算法优化将成为容纳更大训练的必要手段。模型将依第一条扩展定律继续增大但内部结构将趋向“精瘦”。关键的问题来了英伟达等硬件厂商是否过度押注“推理”训练算力占比是否真会被推理完全吞噬它们已宣布下一代GPU平台Rubin将首推纯推理GPURubin CPX。如果这种趋势叠加“推理向边缘设备迁移”的压力AI硬件路线图恐怕会过度倾向于推理。当前“纵向扩展”scaling-up即单服务器内增配加速器因其提升推理性能的主因是当前的主流在重推理的RL训练中试错需反复运行推理直至成功所以同样关键。但随着大规模非RL训练重获重视“横向扩展”scaling-out增服务器数与“跨域扩展”scaling-across数据中心互联将再度成为进步关键而纵向扩展重要性显著下降这显然与硬件演进方向相悖。微妙差异对投资者意味深长。最后我在一线科技企业深耕十二载见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我整理出这套 AI 大模型突围资料包✅AI大模型学习路线图✅Agent行业报告✅100集大模型视频教程✅大模型书籍PDF✅DeepSeek教程✅AI产品经理入门资料完整的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】为什么说现在普通人就业/升职加薪的首选是AI大模型人工智能技术的爆发式增长正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议到全国两会关于AI产业发展的政策聚焦再到招聘会上排起的长队AI的热度已从技术领域渗透到就业市场的每一个角落。智联招聘的最新数据给出了最直观的印证2025年2月AI领域求职人数同比增幅突破200%远超其他行业平均水平整个人工智能行业的求职增速达到33.4%位居各行业榜首其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张也让人才供需矛盾愈发突出。麦肯锡报告明确预测到2030年中国AI专业人才需求将达600万人人才缺口可能高达400万人这一缺口不仅存在于核心技术领域更蔓延至产业应用的各个环节。资料包有什么①从入门到精通的全套视频教程⑤⑥包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图还有视频解说全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤ 这些资料真的有用吗?这份资料由我和鲁为民博士共同整理鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。所有的视频教程由智泊AI老师录制且资料与智泊AI共享相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念通过动态追踪大模型开发、数据标注伦理等前沿技术趋势构建起前沿课程智能实训精准就业的高效培养体系。课堂上不光教理论还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事如果说你是以下人群中的其中一类都可以来智泊AI学习人工智能找到高薪工作一次小小的“投资”换来的是终身受益应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能 突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】**