2026/5/14 5:10:50
网站建设
项目流程
济南网站定制,国外源码网站,电子外贸网站建设,展览网站建设文章回顾了大模型技术发展的四个阶段#xff0c;指出技术重点正从预训练向后训练转移。通过分析Cursor、Claude Code等现象级产品#xff0c;揭示了AI应用的创新范式。提出Vibe Coding概念#xff0c;预示编程将民主化#xff0c;程序员需转向技术审美#xf…文章回顾了大模型技术发展的四个阶段指出技术重点正从预训练向后训练转移。通过分析Cursor、Claude Code等现象级产品揭示了AI应用的创新范式。提出Vibe Coding概念预示编程将民主化程序员需转向技术审美非程序员可借助AI实现创意。未来AI将拥有图形界面人机交互将更加自然。这是一个充满机遇的时代个体应积极拥抱AI大潮。2026 年的第一篇文章想从 AI 大神 Andrej Karpathy(AK)在 12 月底发的一篇博文开始聊一聊一些收获以及对未来的一些想法。博文的原文在这里2025 LLM Year in Review[1]感兴趣的朋友可以阅读原文。大模型技术发展的几个阶段第一个阶段是预训练阶段(Pretraining)时间点大概在 2020 年左右。这个阶段的技术核心是通过不断提升大模型的参数量来提升模型的智能。典型的模型是 GPT-2/3。第二个阶段是监督微调阶段(SFT)时间点大概在 2022 年左右。这个阶段的技术核心是通过人类专家标注的高质量数据来提升模型在特定方面的智能。典型的模型是 Instruct-GPT。第三个阶段是根据人类反馈进行强化学习阶段(RLHF)时间点也大概在 2022 年左右。这个阶段的技术核心是通过人类的反馈来使大模型的行为向人类的偏好对齐。各家的 Chatbot 类应用都有尝试做 RLHF。第四个阶段是根据可验证的奖励进行强化学习阶段(RLVR)时间点大概在 2025 年左右。这个阶段的技术核心是通过可验证的奖励比如解数学题、编程等这些有确定性正确结果的事情来提升模型的推理能力。从 OpenAI O3 开始到后来的 DeepSeek R1都是典型的代表。看完这个发展过程的总结我的一个强烈感受是大模型的智能的提升技术的重点越来越从预训练向后训练转移了。这也特别符合一般事务发展的规律刚刚兴起的时候有技术红利通过堆资源扩参数、堆 GPU就可以实现增长越到了后期技术红利褪去就需要精耕细作通过技术创新当下是RLVR未来是什么来寻求突破。如何理解大模型的智能AK 给了一个很好的角度来理解大模型的智能。他说大模型的智能不像是我们人类和其它动物这样的智能而是像幽灵一样。这个怎么来理解呢人类和其它动物的智能是可以通过培养、训练来提升的。比如一个小孩子我们从小教他学习各种各样的知识他的智力水平智能就会提升就会越来越聪明越来越能够解决更加复杂的问题。而对于大模型而言以它们现在的参数量来说它们几乎是压缩了能够公开获取的所有人类知识。所以大模型们不缺知识再去教他们更多的知识这条路线的边际收益会很低。用好大模型的关键在于给它提供合适的上下文(Context简单理解也可以是 Prompt)所以 AK 说用好大模型的关键就像是在“召唤幽灵(Summoning Ghosts)”而不是在“培育动物(Growing Animals)”。这是一个非常直观(Intuitive)的比喻让我们一下子感知到了大模型的智能和人类智能之间有着本质的不同。我们在用大模型的过程中不能再简单地通过类比人类来进行而要从大模型自身的智能的特点出发。对个人的启发是提示词工程(Prompt Engineering) 、上下文工程(Context Engineering)就是在大模型时代“召唤幽灵”的“巫术”要用好大模型发挥好 AI 的威力这是每个人都应该去学习的基本技能。Cursor 带来的启示Cursor 是 2025 年上半年最火的 AI 编程领域的明星产品。它的火爆在一定程度上助力了 AI 编程领域在 2025 年下半年百花齐放的蓬勃发展的局面。Cursor 带来的一个现象是很多产品在介绍自己的时候都就是某某领域的 Cursor(Cursor for X)。因为 Cursor 带来的体验足够创新也足够为很多人所知所以这样说大众一下子就能 Get 到产品的重点。Cursor 所带来的是一种应用创新的范式。应用可以通过上下文工程(Context Engineering)把要完成的任务(在 Cursor 里是编程的相关信息传给精心编排好的大模型调用然后在产品中提供让人机进行交互的友好图形界面而且在过程中人还可以自主控制 AI 的参与度。顺着上面的思路Cursor for X确实是AI 时代做应用的一个基本的模式在这个基础上再去创新也算是站在“巨人”的肩膀上了。Claude Code带来的启示Claude Code 是 2025 年下半年最火的 AI 编程领域的明星产品它的光芒甚至盖过了 Cursor大有后来居上的势头。Claude Code 带来的是一种全新的使用 AI 的范式具体体现在以下几个方面第一个方面Claude Code 让大众体会了什么是真正的 AI 智能体(Agent)它让大众对智能体有了具象的认知。智能体的核心就是通过循环的推理(Reasoning)和工具使用(Tool Use)来自主解决问题的一种机制。这里的推理需要依赖大模型由它来决定解决问题具体有哪些步骤每一步要调用什么样的工具工具是大模型之外的每个工具可以用来解决一类具体的问题大模型决定调用哪个工具具体的工具调用由 Agent 来驱动工具调用的结果再反馈给大模型让大模型做进一步的推理决策直至最终解决问题。第二个方面Claude Code 带来了一种全新的本地化(Localhost)的体验。在 Claude Code 中除了调用大模型 API 进行推理这一步在云端其它所有的操作都在用户本地。这样带来好处是在用户自己本地的环境中访问用户自己电脑上的私有数据、调用系统提供的工具就是一个很自然的事情。也只有这样Agent 才能真正为用户解决好自己环境中所遇到的特定问题。AK 说Claude Code 就像一个住在我们每个人电脑上的小精灵(A little spirit)一样他足够了解我们也能时刻为我们提供一些“魔法”让我们个体都拥有了一些超能力。我个人是 Claude Code 的深度用户从一开始出来一直用到现在切身体会过 Claude Code 的威力。AK 点出的 Localhost 这个点我觉得是非常关键的这对我们做 AI Agent 类的应用是非常不错的一个思路。关于Vibe CodingVibe Coding 这个词是 AK 原创的现下已经成了一种现象。以前的程序员是一个很“神秘”的职业外行人看着一堆堆的字母、符号组合在一起就能成为这样、那样的软件运行起来非常神奇。AI 时代大模型把这层神秘的面纱一点点给揭去了普通人也能编程成为了一种现实。从语言的角度来讲我们人类有自己的语言即我们平时所说的自然语言汉语、英语等。计算机也有自己的语言就是程序员们所用的语言Java、Python 等。以前需要专业的程序员才能跟计算机进行交流、沟通未来人人都可以跟计算机交流、沟通。Vibe Coding 就是对这种现象的一种描述人类可以通过自然语言描述自己的需求计算机通过大模型把人类的需求转成自己能理解的程序然后就可以去执行、去完成特定的任务了。在这样一个大的背景下Vibe Coding 带给我们的启示是对于程序员来说要意识到基础的编程工作越来越会没有竞争力。未来几乎所有的编码工作都可以由 AI 来完成人类程序员的核心是我之前在《[AI 时代程序员路在何方]》这里提过的技术审美构建在扎实的专业能力之上的感知力和判断力。对于非程序员来说这是最好的时代。以前有个想法要实现要依赖程序员未来有想法自己就可以开干了。对写程序这件事要去魅不要再惧怕。AI 时代做这样的尝试的试错成本已经非常低了大胆地尝试起来。这真的是最好的时代专业的程序员的能力边界被极大的拓展可以去写很多以前自己写不了的程序了普通大众也有了可以通过编程来实现自己想法的可能性。重要的是要开放心态纵身一跃积极地跳入这波 AI 大潮中去去学习、去创造。Nano Banana 带来的启示Nano Banana 也是 2025 年一个现象级的 AI 产品它是由传统互联网大厂 Google 推出的。AK 把大模型LLM比作是未来的“电脑”。现在我们通过对话的方式跟大模型进行沟通就很像 80 年代的人们使用命令行跟电脑进行沟通。但是文字交互其实对人类来说是不友好的我们人类其实更喜欢看图形、图像的东西。所以后来电脑发展出了今天我们每个人都在用的图形用户界面(GUI)。顺着这个思路往下延伸未来的电脑也需要有一个图形用户界面才能够更好地跟人类进行交互。Nano Banana 的出现让 AK 觉得看到了这个事情的曙光。Nano Banana 的出现的意义不单是通过文字来生成图片更是让人们看到了一种未来的可能性文本生成、图像生成、世界知识它们可以结合到一起成为一个统一的模型。未来AI 时代的电脑的 GUI可能离我们不太远了。如何学习AI大模型如果你对AI大模型入门感兴趣那么你需要的话可以点击这里大模型重磅福利入门进阶全套104G学习资源包免费分享这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】这是一份大模型从零基础到进阶的学习路线大纲全览小伙伴们记得点个收藏第一阶段从大模型系统设计入手讲解大模型的主要方法第二阶段在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段以SD多模态大模型为主搭建了文生图小程序案例第七阶段以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。100套AI大模型商业化落地方案大模型全套视频教程200本大模型PDF书籍学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。LLM面试题合集大模型产品经理资源合集大模型项目实战合集获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】