MySQL范式

为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中,这种规则就是范式。范式是符合某一种级别的关系模式的集合。关系型数据库中的关系必须满足一定的要求,即满足不同的范式。

目前关系型数据库有六种范式,分别为:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)、第五范式(5NF)和第六范式(6NF)。要求最低的范式是第一范式。第二范式在第一范式的基础上又进一步的添加了要求,其余范式依次类推。

一般说来,数据库只需满足第三范式就行了,而通常我们用的最多的就是第一范式、第二范式、第三范式,也就是接下来要讲的”三大范式”。

1)第一范式

第一范式(1NF)用来确保每列的原子性,要求每列(或者每个属性值)都是不可再分的最小数据单元(也称为最小的原子单元)。

例如,客人住宿信息表 (姓名, 客人编号, 地址, 客房号, 客房描述, 客房类型, 客房状态, 床位数, 入住人数, 价格)。

其中,”地址”列还可以细分为国家、省、市、区等,甚至有的程序还把”姓名”列也拆分为”姓”和”名”等。如果业务需求中不需要拆分”地址”和”姓名”列,则该数据表符合第一范式,如果需要将”地址”列拆分,则下列写法符合第一范式:

客人住宿信息表(姓名, 客人编号, 国家, 省, 市, 区, 门牌号, 客房号, 客房描述, 客房类型, 客房状态, 床位数, 入住人数, 价格)。

2)第二范式

第二范式(2NF)在第一范式的基础上更进一层,要求表中的每列都和主键相关,即要求实体的唯一性。如果一个表满足第一范式,并且除了主键以外的其他列全部都依赖于该主键,那么该表满足第二范式。

客人住宿信息表中的数据主要用来描述客人住宿信息,所以该表主键为(客人编号,客房号):

  • “姓名”列、”地址”列➡”客人编号”列。
  • “客房描述”列、 “客房类型”列、”客房状态”列、”床位数”列、”入住人数”列、”价格”列➡”客房号”列。

其中,”➡”符号代表依赖。以上各列没有全部依赖于主键(客人编号,客房号),只是部分依赖于主键,不符合第二范式。

使用第二范式后,客人住宿信息表可以分解成以下两个表:

  • 客人信息表(客人编号,姓名,地址,客房号,入住时间,结账日期,押金,总金额),主键为”客人编号”列,其他列都全部依赖于主键列。
  • 客房信息表(客房号,客房描述,客房类型,客房状态,床位数,入住人数,价格),主键为”客房号”列,其他列都全部依赖于主键列。

3)第三范式

第三范式(3NF)在第二范式的基础上更进一层,第三范式是确保每列都和主键列直接相关,而不是间接相关,即限制列的冗余性。如果一个关系满足第二范式,并且除了主键以外的其他列都依赖于主键列,列和列之间不存在相互依赖关系,则满足第三范式。

为了更好的理解第三范式,这里我们需要了解传递依赖。假设A、B 和 C 是关系 R 的三个属性,如果 A➡B 且 B➡C,则从这些函数依赖中,可以得出 A➡C。如上所述,依赖 A➡C 称之为传递依赖。

以第二范式中的客房信息表为例,初看该表时没有问题,满足第三范式,每列都和主键列”客房号”相关,再细看会发现:

  • “床位数” 列、”价格”列➡”客房类型”列。
  • “客房类型”列➡”客房号”列。
  • “床位数”列、”价格”列➡”客房号”列

为了满足第三范式,应该去掉”床位数”列,”价格”列和”客房类型”列,将客房信息表分解为如下两个表。

  • 客房表(客房号,客房描述,客房类型编号,客房状态,入住人数)
  • 客房类型表(客房类型编号,客房类型名称,床位数,价格)

主键与外键在多表中的重复出现不属于数据冗余,非键字段的重复出现才是数据冗余。在客房表中客房状态存在冗余,需要进行规范化,规范化以后的表如下:

  • 客房表(客房号,客房描述,客房类型编号,客房状态编号,入住人数)。
  • 客房状态表(客房状态编号,客房状态名称)

最后,满足三大范式的 E-R 图如下所示:

满足三大范式的数据库模型图如下所示:

MySQL范式

4)反范式化

不满足范式的数据库设计,就是反范式化。

我们需要知道对于项目的最终用户来说,用户关心的是方便,清晰的数据结果。所以在设计数据库时,设计人员和客户在数据库的设计规范化和性能之间会有一定的矛盾。

上面我们通过三大范式将客房表分解出两个表,为了满足客户的需求,最终可能需要通过三个或四个表之间的连接查询,来得到客户需要的数据结果,插入数据同样如此,对于客户输入的数据,我们需要分开插入到三个或四个不同的表中。

由此可以看出,为了满足三大范式,我们的数据操作性能会受到相应的影响。

所以,在实际的数据库设计中,既要考虑三大范式,避免数据的冗余和各种数据操作异常,又要考虑数据访问性能。为了减少表连接,提高数据库的访问性能,也可以允许适当的数据冗余列,这也许就是最合适的数据库设计方案。

比如,有一张存放商品的基本表,数据表中包括”单价”、”数量””金额”等字段。”金额”这个字段就说明该表的设计不满足第三范式,因为”金额”可以由”单价”乘以”数量”得到,说明”金额”是冗余字段。

与第三范式中介绍的冗余相比,前面介绍的冗余属于低级冗余,我们反对低级冗余,但这里的冗余为高级冗余,目的是提高数据的处理速度,增加”金额”列后,可以提高查询统计的速度,这是以空间换取时间的做法。

注意:不要轻易违反数据库设计的规范化原则,如果处理不好,可能会适得其反,使应用程序运行速度更慢。

优缺点

最后我们来总结一下范式化和反范式化的优缺点。

1)范式化

优点如下:

  • 减少数据冗余
  • 范式化后的表中只有很少的重复数据,更新时只需要更新较少的数据,所以范式化的更新操作比反范式化更快
  • 范式化的表通常比反范式化更小

缺点如下:

  • 范式化的表在查询时经常需要很多的关联,这回导致性能降低
  • 增加了索引优化的难度

2)反范式化

优点如下:

  • 可以减少表的关联
  • 可以更好的进行索引优化

缺点如下:

  • 数据表存在数据冗余及数据维护异常
  • 对数据的修改需要更多的成本

源地址;

Original: https://www.cnblogs.com/wojiuyishui/p/16494276.html
Author: 我就一水
Title: MySQL范式

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/578670/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 绝了!起个好标题的9大技巧

    许多自媒体经常发一些标题雷人的文章,内容却非常空洞甚至低俗,技术创作领域也未能幸免,这个搞法被大家笑称为”标题党”。互联网是眼球经济,靠标题骗点击量的恶习将…

    Linux 2023年6月6日
    0105
  • 搭建docker镜像仓库(二):使用harbor搭建本地镜像仓库

    一.系统环境 二.前言 三.Harbor 四.使用harbor搭建私有镜像仓库 4.1 环境介绍 4.2 k8smaster节点安装配置harbor 4.2.1 安装harbor离…

    Linux 2023年6月7日
    0142
  • Docker最常用的镜像命令和容器命令

    一、镜像相关命令 官方文档:https://docs.docker.com/referenc 1.1查看镜像 [root@localhost ~]# docker images R…

    Linux 2023年5月27日
    0102
  • oracle 删除表空间与用户

    以system用户登录,查找需要删除的用户: –查找用户 select * from dba_users; –查找工作空间的路径select * from …

    Linux 2023年6月8日
    071
  • MySQL提权 通过UDF

    UDF是什么 命令执行 文本写入 Example: 远程写入 反弹Shell 提权 UDF是什么 参考:https://www.cnblogs.com/litlife/p/9030…

    Linux 2023年6月6日
    0106
  • Linux服务器文件打包

    1,一般打包:: 文件路径是相对路径,打包后文件也是相对路径,无论是否添加P参数. 文件目录是绝对路径,但不加P参数打包可能会报错[删除/之类的错误],.加P参数打包正确无错误.打…

    Linux 2023年5月27日
    0116
  • 文件夹图标修改软件 FolderIco

    本来文件夹图标是可以自定义的,只要找好图片,在软件中把图片格式转换成ico,再在文件夹属性中设置图标就可以了。 但是我发现转换出来的ico不够清晰,只有256*256,在大图标模式…

    Linux 2023年6月6日
    0117
  • Nginx 平滑升级(不需要关闭Nginx升级)

    Nginx 平滑升级 对Nginx的版本进行更新,或者要增添新的模块,最简单的方法就是停止当前的Nginx服务,重新编译安装nginx,然后开启新的Nginx服务。但是这样会导致在…

    Linux 2023年6月13日
    089
  • 最新超详细的VMware虚拟机的下载与安装

    一、了解VMware VMware虚拟机软件是一个”虚拟PC”软件,它使你可以在一台机器上同时运行二个或更多Windows、DOS、LINUX系统。与&#8…

    Linux 2023年6月15日
    0134
  • node热加载

    node可以通过require热加载文件,这里先提一下require的加载方式:当我们第一次使用require加载模块时require会把被加载文件的绝对路径作为key存放在req…

    Linux 2023年6月14日
    0102
  • haproxy

    haproxy 一.haproxy简介 二.负载均衡 三.haproxy安装 1.yum安装 2.源码安装 2.1 配置文件解析 2.2时间格式 2.3 全局global 2.4 …

    Linux 2023年6月7日
    0113
  • Nginx $remote_addr和$proxy_add_x_forwarded_for变量详解

    $remote_addr 代表客户端IP。注意,这里的客户端指的是直接请求Nginx的客户端,非间接请求的客户端。假设用户请求过程如下: 用&#x62…

    Linux 2023年5月27日
    090
  • Linux 下统计文件夹下文件的数量

    1、查看当前目录下的文件数量(不包含子目录中的文件) 2、查看当前目录下的文件数量(包含子目录中的文件) 3、 查看当前目录下的文件夹目录个数(不包含子目录中的目录),同上述理,如…

    Linux 2023年6月13日
    0109
  • Xshell小技巧

    鼠标右键粘贴 工具->选项->鼠标->向右按钮->(paste the clipboard contents.) 选定文本自动复制到剪贴板 工具->选…

    Linux 2023年5月28日
    0115
  • 云主机实现校园网使用网络

    下载SoftEther 虚拟专用网络 Server 管理工具和 Open虚拟专用网络 GUI工具 配置云主机 tar -zxvf softether-vpnserver-v4.28…

    Linux 2023年6月8日
    0103
  • Linux内核模块管理(命令)

    1.什么是 Linux 内核模块? 内核模块是可以根据需要加载到内核中或从内核中卸载的代码块,因此无需重启就可以扩展内核的功能。事实上,除非用户使用类似lsmod这样的命令来查询模…

    Linux 2023年6月8日
    097
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球