博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
评估一个预测模型性能通常都有那些指标
阅读量:5036 次
发布时间:2019-06-12

本文共 1036 字,大约阅读时间需要 3 分钟。

对于不同类型的模型,会有不同的评估指标,那么我们从最直接的回归和分类这两个类型,对于结果连续的回归问题,

一般使用的大致为:MSE(均方差),MAE(绝对平均差),RMSE(根均方差)这三种评估方法,这三种方式公式此处补贴出来。

对于离散的分类问题,我们一般看ROC曲线,以及AUC曲线,一般好的模型,ROC曲线,在一开始就直接上升到1,然后一直保持1,也就是使得AUC=1.0或者尽可能的让其

接近这个值,这是我们奋斗的目标.

摘个实际的例子:--出自《预测分析核心算法》这本书.

1 #-*-coding:utf-8-*- 2 __author__ ='gxjun' 3 import pandas as pd 4 import matplotlib.pyplot as plt 5 from pandas import DataFrame 6 from random import uniform 7 import math  8 import numpy as np 9 import random 10 import pylab as pl11 from sklearn import datasets,linear_model12 from sklearn.metrics import roc_curve ,auc13 14 15 ##计算RP值16 def confusionMatrix(predicted ,actual , threshold):17     if len(predicted) != len(actual):18         return -1;19     tp=0.0;20     fp=0.0;21     tn=0.0;22     fn=0.0;23     for i in range(len(actual)):24         if actual[i] >0.5:25             if predicted[i] > threshold:26                 tp+=1.0;27             else:28                 fn+=1.0;29         else:30             if predicted[i]

结果为:

 

转载于:https://www.cnblogs.com/gongxijun/p/7449561.html

你可能感兴趣的文章
3.2.3.1 匹配单个字符
查看>>
字符串逆序的方法
查看>>
该类型的 CollectionView 不支持从调度程序线程以外的线程对其 SourceCollection 进行的更改。...
查看>>
C50和机器学习
查看>>
Java中this用法总结
查看>>
Sharepoint学习笔记—习题系列--70-573习题解析 -(Q28-Q31)
查看>>
关于使用Timer定时监测网络是否ping通
查看>>
定时器setTimeout()的传参方法
查看>>
导出成WORD文档(转)
查看>>
MyCat 枚举分片设计思考,查询命中条件
查看>>
selenium 截图 java、python、ruby,
查看>>
Maven 的聚合
查看>>
sbt使用详解
查看>>
Mybatis初步
查看>>
vue+uwsgi+nginx部署luffty项目
查看>>
ios晋级之路-CALayer以及动画CABaseAnimation
查看>>
一、SQLite的介绍
查看>>
oo第四次总结感悟
查看>>
redis 数据类型详解 以及 redis适用场景场合
查看>>
【Cogs2187】帕秋莉的超级多项式(多项式运算)
查看>>