2026/2/10 7:10:21
网站建设
项目流程
如何做收费影视资源网站,网站制作app开发,建设电子商务网站论文,网站建设有什么工作主题从 20 实战案例看 AI Agent#xff1a;企业如何跨越“落地”鸿沟#xff1f;时间北京时间 周六 2026.1.24 10:00美东时间 周五 2026.1.23 21:00美西时间 周五 2026.1.23 18:00请注意~ 本次分享为全英文预约视频号b站内容尽管 AI智能体 已在各行各业的生产环境中活跃运行 实战案例看 AI Agent企业如何跨越“落地”鸿沟时间北京时间 周六 2026.1.24 10:00美东时间 周五 2026.1.23 21:00美西时间 周五 2026.1.23 18:00请注意~ 本次分享为全英文预约视频号b站内容尽管 AI智能体 已在各行各业的生产环境中活跃运行但外界对于究竟是哪些技术方案促成了这些成功的实际落地仍知之甚少。对此我们发布了首个针对生产环境 AI 智能体的大规模系统性研究。我们调研了 306 位从业者并通过访谈形式跨越 26 个领域进行了 20 个深度的案例研究。我们深入探讨了组织构建智能体的动因、构建方式、评估手段以及开发过程中面临的首要挑战。研究发现生产级智能体通常采用简单且可控的技术路径构建68% 的智能体在需要人工干预前执行步骤不超过 10 步70% 依赖于对现成模型Off-the-shelf models进行提示工程而非进行权重微调74% 主要依赖人工评估。可靠性依然是开发面临的首要挑战这主要源于难以确保和评估智能体行为的正确性。尽管挑战重重但那些简单而有效的方法已足以让智能体在各行各业中发挥实质性作用。我们的研究记录了当前的行业实践现状不仅让研究人员得以洞察生产环境中的真实挑战也为从业者提供了源自成功案例的成熟范式从而弥合了学术研究与实际落地之间的鸿沟。论文Measuring Agents in Production链接https://arxiv.org/pdf/2512.04123嘉宾Melissa Z. Pan是UC Berkeley计算机科学系的博士生师从 Matei Zaharia 教授。她的研究兴趣集中于为新兴的机器学习及数据密集型任务例如智能体系统构建大规模、高效且可持续的计算系统同时也研究如何构建可靠的智能体来辅助系统领域的研究。目前她正致力于通过资源调度和跨栈优化探究高能效且可靠的智能体及复合 AI 系统。此外她也是 Amazon AI Fellow 和 Laude AI Resident。Negar Arabzadeh是UC Berkeley计算机科学系的博士后研究员目前与 Matei Zaharia 教授合作开展研究。她在滑铁卢大学获得博士学位师从 Charles L. A. Clarke 博士。她的研究聚焦于信息检索与大语言模型的交叉领域。她致力于探讨如何在基于大模型的信息获取系统中设计、评估及整合检索机制同时也深入研究在现代信息检索流程中如何利用大模型兼任“被评估对象”与“评估者”的双重角色。主持人吴昊伦Mila McGill 的五年级博士生在 Stanford 从事访问学者研究。其主要研究方向包括可信 AI / 大模型、信息检索、个性化、AI 对齐以及 AI教育等。他曾在 Microsoft Research、Google、DeepMind 多次实习其研究成果被应用于 MSR Alexandria 知识库构建和 Google Shopping 推荐系统。他在多个领域的顶级会议和期刊如 NeurIPS, ICML, ICLR, EMNLP, SIGIR, WWW, CHI, CSCW, TMLR, TKDE 等发表工作并担任评审。入群欢迎加入NICE每周分享交流群可与NICEer唠嗑以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证群内无广告。备注【昵称-单位-方向-NICE入群】NICE介绍NICENexus forIntelligenCE是一个由全球60位一线青年学者共同发起的顶尖AI前沿交流平台。 成立以来我们汇聚海内外300嘉宾通过百余场线上深度分享与线下高规格活动北京/上海/苏州等全网积累超13万关注。目前NICE已构建起覆盖中、美、欧的国际化团队正加速在硅谷、纽约、香港等地落地致力于打造连接学术、产业与未来的全球化AI前沿社区。NICE主页https://nice-nlp.github.ioNICE海外https://nice-intl.github.iob站https://space.bilibili.com/507524288Youtubehttps://www.youtube.com/niceaitalk