数据处理不等式:Data Processing Inequality

我是在差分隐私下看到的,新解决方案的可用性肯定小于原有解决方案的可用性,也就是说信息的后续处理只会降低所拥有的信息量。

那么如果这么说的话为什么还要做特征工程呢,这是因为该不等式有一个巨大的前提就是数据处理方法无比的强大,比如很多的样本要分类,我们做特征提取后,SVM效果很好 ,但是如果用DNN之类的CNN、AuToEncoder,那么效果反而不如原来特征。这样就能理解了,DNN提取能力更强,那么原始就要有更多的信息,在新特征下无论怎么提取,信息就那么多。

信息量越多越好么?肯定不是,否则为什么PCA要做降噪和去冗余呢?我们的目的是有效的信息最大化。

另外一种理解就是从互信息不为0(信息损失)来解释。

那么如何在处理过程中不丢失有效信息呢?这时候就需要数学上的充分统计量,也就是g是y的充分统计量。

Original: https://www.cnblogs.com/hxsyl/p/7771486.html
Author: 加拿大小哥哥
Title: 数据处理不等式:Data Processing Inequality

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/547811/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 初识 @Configuration

    @Configuration这个注解是一个类注解,加在类上,标识该类是一个 配置类,让这个类的功能等同于一个bean xml配置文件。 @Configuration public …

    技术杂谈 2023年6月21日
    063
  • Makedown学习与使用

    +标题名字 +标题名字 …… +标题名字 6级标题,从1-6级为1-6个# 字体 Hello,worldHello,worldHello,worldHell…

    技术杂谈 2023年6月21日
    093
  • Mysql整体介绍(适用于5.X版本)(下)(标贝科技)

    Mysql整体介绍(适用于5.X版本)(下)(标贝科技) 二、InnoDB介绍[9-11] InnoDB是Mysql取得成功的最关键的引擎,其重要性不言而喻,下面将单独对该引擎的核…

    技术杂谈 2023年7月25日
    069
  • 数据库多表查询 联合查询 增删改查

    插入 方式一 语法: insert into 表名 (字段名,…) values (值,…); 特点: 1、要求值的类型和字段的类型要一致或兼容 2、字段的个数和顺序不一定…

    技术杂谈 2023年6月21日
    083
  • webrtc:信令服务器的另一种实现方式-无需掌握全部的socket.io

    我们知道,基于WEBRTC实现的多对多实时音视频互动通信就必须需要搭建信令服务器作为信令转发操作。那么我首先了解一下,什么是webrtc信令服务器? 在webrtc的规范中,其实是…

    技术杂谈 2023年5月31日
    090
  • vue路由守卫用于登录验证权限拦截

    vue路由守卫用于登录验证权限拦截 to:进入到哪个路由去 from:从哪个路由离开 next:路由的控制参数,常用的有next(true)和next(false) home需要判…

    技术杂谈 2023年7月11日
    086
  • 领域驱动设计DDD和CQRS架构模式落地实践

    在领域驱动架构中,通常会将查询和命令操作分开,我们称之为CQRS(命令查询职责分离Command Query Responsibility Segregation)。这张图是来自M…

    技术杂谈 2023年6月1日
    078
  • Vue 网站首页加载优化

    Vue 网站首页加载优化 本篇主要讲解 Vue项目打包后 vendor.js 文件很大 如何对它进行优化 以及开启Vue的压缩 和 nginx gzip 压缩的使用,其他就是对接口…

    技术杂谈 2023年7月11日
    089
  • 14. 构造二叉树

    title: 构造二叉树 , 看这一篇就足够! 思想:构造整棵树 = 根节点 + 构造左子树 + 构造右子树 📃 题目一描述 题目链接:从中序与后序遍历构造二叉树 🔔 解题思路 必…

    技术杂谈 2023年7月24日
    082
  • ConstraintLayout的用法

    <span class=”typ”>ConstraintLayout</span> 相对于 <span class=”typ”>Relative…

    技术杂谈 2023年5月31日
    090
  • 响应式布局

    1 什么是媒体查询 ¶ 媒体查询指的是获取设备屏幕、浏览器尺寸(width,height),进而为不同尺寸设定不同的CSS样式。一般而言,可以通过@media来获取屏幕或浏览器尺寸…

    技术杂谈 2023年7月23日
    069
  • 如何在Oracle中复制表结构和表数据

    复制表结构及其数据: 只复制表结构: 或者: 只复制表数据: 如果两个表结构一样: 如果两个表结构不一样: Original: https://www.cnblogs.com/lc…

    技术杂谈 2023年5月31日
    072
  • 猜数字小游戏

    python猜数字游戏 要求: 输入指定范围,在该范围内进行猜数,可多次猜数,直到猜中 如果猜错,给出下次猜数的范围继续猜 思路: 导入random包,生成随机数 利用while循…

    技术杂谈 2023年7月23日
    085
  • 数据库基础,看完这篇就够了!

    转载请注明出处❤️ 作者:测试蔡坨坨 原文链接:caituotuo.top/747a74ea.html 你好,我是测试蔡坨坨。 对于测试同学来说,除了知道测试基础知识外,还需要掌握…

    技术杂谈 2023年7月11日
    072
  • 三次握手四次挥手

    什么是三次握手? 1.&#x8FDB;&#x884C;&#x4E09;&#x6B21;&#x63E1;&#x624B;&#x…

    技术杂谈 2023年7月23日
    069
  • Colorimetry

    【 Colorimetry】 1、Example of Spectral Power Distribution Application An example of the spec…

    技术杂谈 2023年5月31日
    086
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球