2026/2/19 7:21:02
网站建设
项目流程
网站数据库空间增大,知名设计网站公司,广州科技公司有哪些,自己做的网站怎么挂网上“ 一个好的大模型数据分析智能体#xff0c;需要的是让模型更好的理解你的数据结构#xff0c;而这应该怎么做呢#xff1f;。”
数据分析是大模型的一个重点应用方向#xff0c;但怎么使用大模型进行数据分析#xff0c;以及怎么才能让大模型完整强大的可靠的数据分析需要的是让模型更好的理解你的数据结构而这应该怎么做呢。”数据分析是大模型的一个重点应用方向但怎么使用大模型进行数据分析以及怎么才能让大模型完整强大的可靠的数据分析毕竟如果数据分析的结果不可靠那将毫无意义。使用大模型做数据分析的本质是让大模型扮演一个数据分析员的角色它会编写SQL脚本代码等具备基本的数据分析员的能力。怎么让大模型更好地进行数据分析怎么让大模型更好地进行分析我们都知道与大模型的交互都是通过提示词实现的因此这个问题可以换个问法怎么让大模型更好的编写数据分析代码(包括SQLshellpython等脚本代码)并且可以根据执行结果进行下一步的处理。我们先以SQL为例从一个实际案例出来让模型对一张表进行数据分析。既然大模型做数据分析就是要写好提示词那什么样的提示词才算是一个好的数据分析师的提示词呢最近两年大家都可以看到AI的发展有多快我国超10亿参数的大模型在短短一年之内已经超过了100个现在还在不断的发掘中时代在瞬息万变我们又为何不给自己多一个选择多一个出路多一个可能呢与其在传统行业里停滞不前不如尝试一下新兴行业而AI大模型恰恰是这两年的大风口整体AI领域2025年预计缺口1000万人其中算法、工程应用类人才需求最为紧迫学习AI大模型是一项系统工程需要时间和持续的努力。但随着技术的发展和在线资源的丰富零基础的小白也有很好的机会逐步学习和掌握。【点击蓝字获取】【2025最新】AI大模型全套学习籽料可白嫖LLM面试题AI大模型学习路线大模型PDF书籍640套AI大模型报告等等从入门到进阶再到精通超全面存下吧首先除了要指定模型的角色和基础功能之外还要告诉模型我们的要求比如说需要做什么不能做什么有什么规则需要输出什么样的格式等。如下是一个简单的数据分析师提示词其中dialect是我们需要传入的参数用来告诉模型我们使用的是什么数据如mysqlpgsqloracle等这样模型才能更好理解我们的需求。你是一个专门与SQL数据库交互的智能代理。 根据用户输入的问题生成符合{dialect}语法的正确查询语句。 注意事项 - 只能使用表结构描述中可见的列名 - 确保不查询不存在的列 - 注意列所属的表 - 严格按照表字段备注的含义理解每个参数的作用 - 理解用户问题并根据表字段的含义生成SQL语句但其中还有很重要的一步就是把数据库信息告诉模型而这些我们可以通过获取数据库元数据的方式得到。如下查询数据表元数据如果需要查多张表也可以把table_name的条件给去掉。sql text(f SELECT column_name as 字段名, data_type as 数据类型, character_maximum_length as 字符长度, is_nullable as 是否可为空, column_default as 默认值, ( SELECT description FROM pg_catalog.pg_description WHERE pg_description.objsubid information_schema.columns.ordinal_position AND pg_description.objoid ( SELECT oid FROM pg_catalog.pg_class WHERE relname information_schema.columns.table_name AND relnamespace ( SELECT oid FROM pg_catalog.pg_namespace WHERE nspname information_schema.columns.table_schema ) ) ) as 字段注释 FROM information_schema.columns WHERE table_schema public AND table_name {table_name} ORDER BY ordinal_position; )在查询到表结构之后我们需要解析出表中的字段类型等属性。result await db_session.execute(sql, {table_name: table_name, schema: schema}) columns result.fetchall() if not columns: return No tables found in the database. output_lines [] comment_suffix f\nTable comment: *表备注* # --- Schema Table --- output_lines.append(f### Table name: {table_name}{comment_suffix}\n) output_lines.append(| column_name | data_type | is_nullable | column_default | column_comment |) output_lines.append(|---|---|---|---|---|) for i, column in enumerate(columns): col_name, data_type, is_nullable, col_default, col_comment column[0], column[1], column[3], column[4], column[5] col_default str(col_default) if col_default is not None else col_comment str(col_comment) if col_comment is not None else is_nullable is_nullable if is_nullable in (YES, NO) else NO output_lines.append( f| {col_name} | {data_type} | {is_nullable} | {col_default} | {col_comment} | ) output_lines.append()当然作者这里使用的是pgsql数据库读者可以根据自己的数据库类型进行适当的调整。但还有一个关键的步骤是我们可以从数据表中随机查询一些示例数据出来比如三到五条并拼接到数据表结构后面这样就可以让模型更好地理解我们的表结构和表数据。如下所示quoted_cols [f{c[0]} for c in columns] sample_sql text(fSELECT {, .join(quoted_cols)} FROM {table_name} ORDER BY random() LIMIT 10;) print(fsample sql: {sample_sql}) result await db_session.execute(sample_sql) sample_rows result.fetchall()这样大模型就可以很好的根据我们的需求生成相应的SQL语句但从安全性的角度考虑我们最好是对生成的SQL进行基本的安全验证如drop databasedrop table namedelete等语句否则可能会造成严重的生成事故。最近两年大家都可以看到AI的发展有多快我国超10亿参数的大模型在短短一年之内已经超过了100个现在还在不断的发掘中时代在瞬息万变我们又为何不给自己多一个选择多一个出路多一个可能呢与其在传统行业里停滞不前不如尝试一下新兴行业而AI大模型恰恰是这两年的大风口整体AI领域2025年预计缺口1000万人其中算法、工程应用类人才需求最为紧迫学习AI大模型是一项系统工程需要时间和持续的努力。但随着技术的发展和在线资源的丰富零基础的小白也有很好的机会逐步学习和掌握。【点击蓝字获取】【2025最新】AI大模型全套学习籽料可白嫖LLM面试题AI大模型学习路线大模型PDF书籍640套AI大模型报告等等从入门到进阶再到精通超全面存下吧