网站链接锚点怎么做北京网络报警平台官网
2026/5/13 22:45:18 网站建设 项目流程
网站链接锚点怎么做,北京网络报警平台官网,遵义网页制作招聘,如何做一个购物网站页面混淆矩阵从入门到精通教程 本教程面向机器学习初学者#xff0c;从核心概念、公式推导到实战案例#xff0c;循序渐进讲解混淆矩阵的使用方法#xff0c;结合工业场景#xff08;石油、燃气#xff09;和通用场景#xff0c;每个案例都完整计算准确率、精确率、召回率、F…混淆矩阵从入门到精通教程本教程面向机器学习初学者从核心概念、公式推导到实战案例循序渐进讲解混淆矩阵的使用方法结合工业场景石油、燃气和通用场景每个案例都完整计算准确率、精确率、召回率、F1分数等核心指标帮助你快速掌握并应用到实际项目中。一、 入门篇混淆矩阵核心概念与公式1. 什么是混淆矩阵混淆矩阵是评估分类模型性能的表格工具行代表真实标签列代表模型预测标签单元格数值表示“真实为A、预测为B”的样本数量。它的核心价值是超越单一的准确率精准定位模型的错误类型误检/漏检。2. 二分类混淆矩阵的4个核心元素二分类是混淆矩阵的基础标签只有两类正例/负例4个元素是所有指标计算的核心真实\预测正例Positive负例Negative正例TP真正例真实正例预测正例FN假负例真实正例预测负例漏检负例FP假正例真实负例预测正例误检TN真负例真实负例预测负例3. 核心评估指标公式必背所有指标的取值范围都是[0,1]越接近1表示模型性能越好。指标名称公式含义准确率Accuracy(TPTN)/(TPTNFPFN)(TPTN)/(TPTNFPFN)(TPTN)/(TPTNFPFN)模型预测正确的样本占总样本的比例精确率PrecisionTP/(TPFP)TP/(TPFP)TP/(TPFP)预测为正例的样本中真实为正例的比例降低误检率召回率RecallTP/(TPFN)TP/(TPFN)TP/(TPFN)真实为正例的样本中被预测为正例的比例降低漏检率F1分数F1-Score2×(Precision×Recall)/(PrecisionRecall)2\times (Precision\times Recall)/(PrecisionRecall)2×(Precision×Recall)/(PrecisionRecall)精确率和召回率的调和平均平衡两者的矛盾4. 多分类混淆矩阵的指标计算逻辑当类别数n≥3n\ge3n≥3时混淆矩阵为n×nn\times nn×n方阵指标计算需先算每个类别的精确率/召回率再计算宏观平均或微观平均宏观平均Macro-average先计算每个类别的指标再取算术平均平等对待每个类别适合样本均衡场景。微观平均Micro-average先汇总所有类别的TP/FP/FN再计算整体指标适合样本不均衡场景。二、 实战篇4个经典案例指标全计算结果分析例1二分类 - 石油钻井井下工具故障检测场景模型判断钻具是否“故障”正例故障负例正常测试集共100个样本。混淆矩阵真实\预测故障正例正常负例行合计真实样本数故障TP18FN220正常FP5TN7580列合计预测样本数2377总样本100指标计算准确率 (1875)/1000.93(1875)/100 0.93(1875)/1000.93精确率 18/(185)≈0.782618/(185) \approx 0.782618/(185)≈0.7826召回率 18/(182)0.918/(182) 0.918/(182)0.9F1分数 2×(0.7826×0.9)/(0.78260.9)≈0.83722\times(0.7826\times0.9)/(0.78260.9) \approx 0.83722×(0.7826×0.9)/(0.78260.9)≈0.8372结果分析召回率高达0.9说明90%的故障钻具被识别漏检率低工业场景优先保障召回率避免故障漏检引发事故。精确率0.7826说明有5个正常钻具被误判为故障会增加检修成本后续可优化特征降低误检。例2二分类 - 邮件垃圾分类场景模型判断邮件是否为“垃圾邮件”正例垃圾邮件负例正常邮件测试集共200个样本。混淆矩阵真实\预测垃圾邮件正例正常邮件负例行合计垃圾邮件TP60FN1070正常邮件FP5TN125130列合计65135总样本200指标计算准确率 (60125)/2000.925(60125)/200 0.925(60125)/2000.925精确率 60/(605)≈0.923160/(605) \approx 0.923160/(605)≈0.9231召回率 60/(6010)≈0.857160/(6010) \approx 0.857160/(6010)≈0.8571F1分数 2×(0.9231×0.8571)/(0.92310.8571)≈0.8892\times(0.9231\times0.8571)/(0.92310.8571) \approx 0.8892×(0.9231×0.8571)/(0.92310.8571)≈0.889结果分析精确率高0.9231说明预测为垃圾邮件的样本中真实垃圾邮件占比高避免正常邮件被误删。召回率略低说明有10封垃圾邮件被漏判可调整模型阈值提升召回率。例3三分类 - 手写数字识别0/1/2场景模型识别0、1、2三类数字测试集共90个样本每类30个。混淆矩阵真实\预测012行合计028203011290302032730列合计293427总样本90指标计算步骤步骤1计算每个类别的精确率、召回率、F1分数类别TP对角线值FP列和-TPFN行和-TP精确率召回率F1分数02829-28130-28228/(281)≈0.965528/(282)0.93332*(0.9655*0.9333)/(0.96550.9333)≈0.94912934-29530-29129/(295)≈0.852929/(291)0.96672*(0.8529*0.9667)/(0.85290.9667)≈0.90622727-27030-27327/(270)127/(273)0.92*(1*0.9)/(10.9)≈0.947步骤2计算宏观平均指标宏观精确率 (0.96550.85291)/3≈0.9395(0.96550.85291)/3 ≈ 0.9395(0.96550.85291)/3≈0.9395宏观召回率 (0.93330.96670.9)/30.9333(0.93330.96670.9)/3 0.9333(0.93330.96670.9)/30.9333宏观F1分数 (0.9490.9060.947)/3≈0.934(0.9490.9060.947)/3 ≈ 0.934(0.9490.9060.947)/3≈0.934步骤3计算整体准确率准确率 (282927)/9084/900.9333(282927)/90 84/90 0.9333(282927)/9084/900.9333结果分析数字2的精确率为1说明模型预测为2的样本全是真实2无错误但有3个真实2被误判为1需优化1和2的特征区分如笔画末端形态。数字1的精确率最低因有5个非1样本被误判为1需调整模型对1的识别阈值。例4四分类 - 燃气调压器故障诊断场景模型诊断调压器4种状态正常、堵塞、漏气、阀杆卡滞测试集共120个样本每类30个。混淆矩阵真实\预测正常堵塞漏气阀杆卡滞行合计正常2910030堵塞0272130漏气0326130阀杆卡滞0022830列合计29313030总样本120指标计算步骤步骤1计算每个类别的核心指标类别TPFPFN精确率召回率F1分数正常2929-29030-29129/(290)129/(291)0.9667≈0.9831堵塞2731-27430-27327/(274)≈0.87127/(273)0.9≈0.885漏气2630-26430-26426/(264)≈0.866726/(264)0.8667≈0.8667阀杆卡滞2830-28230-28228/(282)0.933328/(282)0.9333≈0.9333步骤2宏观平均指标宏观精确率 (10.8710.86670.9333)/4≈0.9178(10.8710.86670.9333)/4 ≈ 0.9178(10.8710.86670.9333)/4≈0.9178宏观召回率 (0.96670.90.86670.9333)/4≈0.9167(0.96670.90.86670.9333)/4 ≈ 0.9167(0.96670.90.86670.9333)/4≈0.9167宏观F1分数 ≈(0.98310.8850.86670.9333)/4≈0.917(0.98310.8850.86670.9333)/4 ≈ 0.917(0.98310.8850.86670.9333)/4≈0.917步骤3整体准确率准确率 (29272628)/120110/120≈0.9167(29272628)/120 110/120 ≈ 0.9167(29272628)/120110/120≈0.9167结果分析正常状态识别效果最好精确率100%堵塞和漏气的混淆最严重2个堵塞误判为漏气3个漏气误判为堵塞需增加压力波动曲线和气体流速等核心特征。阀杆卡滞的精确率和召回率均衡模型对该状态的识别能力稳定。三、 精通篇模型优化与常见误区1. 精确率与召回率的权衡核心技巧优先保召回率工业故障检测、疾病诊断等场景漏检代价 误检代价可降低模型预测阈值让更多样本被判定为正例。优先保精确率垃圾邮件分类、广告推荐等场景误检代价 漏检代价可提高模型预测阈值减少误判。2. 避免准确率陷阱初学者最易踩坑样本不均衡场景如1000个样本中990个正常、10个故障模型全部预测为“正常”准确率也能达到99%但毫无实用价值。解决方案用召回率、F1分数替代准确率评估模型或通过采样过采样正例/欠采样负例平衡数据。四、 总结从入门到精通的核心路径入门牢记二分类4个元素TP/TN/FP/FN和核心指标公式。进阶掌握多分类的“类别指标→宏观平均”计算逻辑。实战结合业务场景分析指标优先保精确率/召回率。精通避开准确率陷阱用工具辅助模型优化。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询