博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习基石 - Hazard of Overfitting
阅读量:4090 次
发布时间:2019-05-25

本文共 902 字,大约阅读时间需要 3 分钟。

(Machine Learning Foundations)—Mathematical Foundations

,副教授 (Associate Professor),资讯工程学系 (Computer Science and Information Engineering)

What is Overfitting?

  • bad generalization: low Ein E i n , high Eout E o u t

  • example

    这里写图片描述

  • Cause of Overfitting

    • excessive dVC d V C
    • noise
    • limited data size

The Role of Noise and Data Size

  • concession for advantage

  • Learning Curves Revisited

    这里写图片描述

  • ‘target complexity’ acts like noise

Deterministic Noise

  • A Detailed Experiment

    这里写图片描述

  • The Results

    这里写图片描述

    • impact of σ2 σ 2 versus N: stochastic noise
    • impact of Qf Q f versus N: deterministic noise
  • four reasons of serious overfitting

    这里写图片描述

    overfitting ‘easily’ happens

  • Deterministic Noise

    这里写图片描述

    pseudo-random generator 伪随机数发生器

Dealing with Overfitting

Driving Analogy Revisited

这里写图片描述

  • correct the label (data cleaning)
  • remove the example (data pruning)
  • add virtual examples by shifting/rotating the given digits (data hinting)

possibly helps, but effect varies (改变数据的分布)

你可能感兴趣的文章
Java 8新特性:Stream API
查看>>
管理用户状态——Cookie与Session
查看>>
最受欢迎的前端框架Bootstrap 入门
查看>>
JavaScript编程简介:DOM、AJAX与Chrome调试器
查看>>
通过Maven管理项目依赖
查看>>
通过Spring Boot三分钟创建Spring Web项目
查看>>
Spring的IoC(依赖注入)原理
查看>>
Guava快速入门
查看>>
Java编程基础:static的用法
查看>>
Java编程基础:抽象类和接口
查看>>
Java编程基础:异常处理
查看>>
Java编程基础:了解面向对象
查看>>
新一代Java模板引擎Thymeleaf
查看>>
Spring MVC中使用Thymeleaf模板引擎
查看>>
Spring Boot构建简单的微博应用
查看>>
Spring处理表单提交
查看>>
Spring MVC异常处理
查看>>
Leetcode 1180. Count Substrings with Only One Distinct Letter [Python]
查看>>
PHP 7 的五大新特性
查看>>
php使用 memcache 来存储 session
查看>>