2026/5/14 0:53:29
网站建设
项目流程
电子商务网站建设与设计,北京互联网营销,seo关键字优化技巧,传奇高爆网页游戏现在#xff0c;大部分AI创业公司都是调用大厂的API来做产品。这样做目前没问题#xff0c;但是按照历史规律#xff0c;每家有野心的AI公司最后都会训练自己的模型——哪怕一开始只是做个简单封装的公司也不例外。为什么#xff1f;因为训练模型的门槛正在快速下降。模型蒸…现在大部分AI创业公司都是调用大厂的API来做产品。这样做目前没问题但是按照历史规律每家有野心的AI公司最后都会训练自己的模型——哪怕一开始只是做个简单封装的公司也不例外。为什么因为训练模型的门槛正在快速下降。模型蒸馏、微调、后训练这些技术每个月都在变简单。等到超级AI公司把所有资金和人才都吸走的时候想要保持竞争力唯一的办法就是拥有自己的模型。我们是怎么走到今天的一开始只有研究实验室在训练大语言模型。后来基于扩散模型的研究出现了Midjourney和Stable Diffusion。接着整个AI行业爆发各大实验室在2022年底到2023年初开始认真做商业化。到了2024年只要有几台GPU服务器任何人都能开始训练模型。到2025年DeepSeek花了600万美元就做出了一个前沿模型推理能力达到了OpenAI的o1水平——这距离OpenAI发布o1才4个月距离正式上线才2个月。重点是API背后的技术已经不再是什么秘密了。复制模型没那么神秘训练模型需要的东西很简单数据、算力、架构。Transformer架构已经证明了自己比LSTM更强。现在预训练、后训练、推理这些知识都是公开的基本没什么不能复制的或者不能用Claude和Codex这些工具照着感觉写代码搞出来的。算力问题说白了就是找钱的问题。获取数据也可以通过蒸馏技术解决最近有论文显示蒸馏出来的10亿参数模型能达到从头训练的70亿参数模型的效果Phi-4和Gemma就是这种数据高效利用的例子。蒸馏和数据效率还记得2000年代做软件有多难吗需要服务器、版本管理、光盘还得有厉害的工程师。但一旦有人找到新玩法就能称霸一个领域比如亚马逊搞定了电商谷歌搞定了搜索。现在训练模型的感觉跟那时候一样。难但不是不可能。突破点不在于发明新架构而在于提高数据利用效率和强化学习。扩散模型也许还有潜力但考虑到算力和数据都有限效率是关键。强化学习效率经济账那应用公司为什么要费劲去训练模型呢因为等到今年底30分钟以内能完成的编程任务基本都会被自动化。到时候软件本身就更像是一个直接卖给用户的品牌。渠道分发才是一直都是最重要的。费用分布Cursor一开始就是VSCode和GPT-4的包装。现在它也在跑自己的专属模型。官方说是为了快速应用这样的功能。但有了数十亿条用户操作记录Cursor完全可以训练出一个能处理几小时软件开发工作的模型。到那时候具体用哪个底层模型就不重要了。重要的是Cursor能控制它。这个套路是固定的先用API包装找到产品和市场的契合点同时收集数据为特定功能微调小的专业模型用自己的数据护城河训练自己的模型提高每个Token的生产效率也就是给用户提供更多价值留住用户你的应用实际上就变成了一个强化学习的环境。或者你把这些宝贵的用户行为数据卖给大厂。数据是瓶颈OpenAI收购Statsig就是为了获取他们会话重放产品里记录的数十亿条用户屏幕操作。萨顿和西尔弗把这叫做经验时代——下个阶段的关键是智能体和环境互动产生的数据。这就是为什么我认为电脑操作是通向AGI的重要路径。每个软件界面都变成了环境每次操作都变成了经验数据。专业人士大部分时间都在电脑前工作。想想我们错过了多少没标记、没记录的数据。一旦模型成为产品积累的输入就是经验。谁能收集到这些重放数据谁就有了优势。Token生产效率我每月花200美元买Claude Pro。但我从中得到的价值每年值五六位数。也就是说我花1美元大概能得到42美元的价值。这么高的回报率下理智的选择就是训练自己的模型。Claude这么做了Cursor可能也得这么做。我们应该开始衡量生产力指标而不只是使用量每单位工作需要多少Token每个Token的经济价值Token生产效率(TFP)TFP指标最简单的算法TFP (产出的经济价值) / (消耗的Token数量)其中产出的经济价值 模型完成的工作值多少钱消耗的Token数量 过程中用掉的Token数(输入输出或者你定义的范围)就像经济学里的全要素生产率一样TFP衡量每个Token能产生多少价值。以我自己为例我生成的Token里只有不到1%-10%的代码最后真正用到了生产环境。所以按API定价我每月花大约2000美元用了17亿个TokenOpus和Sonnet混用大量缓存。其中大约200美元的部分对我真正有用理论上我愿意为此每年付10万美元。所以实际上我每花1美元Token就得到42美元价值。假设推理零成本Claude给我创造了42倍的TFP如果我只是做个Claude代码包装服务除非我也做推理否则长期看这根本不可能。我更愿意处在Devin的位置。随着AI在经济中普及这个指标会越来越受欢迎。考虑到输入Token的成本和用户愿意为最终产品付的钱一个凭感觉编程的强化学习环境值多少钱为了培训医生、住院医师、学生而付费值多少让整个组织符合SOX法规你愿意花多少钱总结模型不再是智能的衡量标准而是生产力的要素。我们应该用TFP来衡量同时考虑产出率、推理定价等因素。我们正在看软件吃掉世界模型开始蚕食劳动力市场。能活下来的公司将是那些能以最高ROI把Token高效转化成劳动力的公司。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】