从ChatGPT说起，AIGC生成模型如何演进

2023年11月4日下午2:04 • Python • 阅读 37

ChatGPT是继stable diffusion 之后，又一个火出圈的人工智能算法。这火爆程度不仅仅是科研圈子，包括投资圈都为之震惊，大家惊呼人工智能可能真的要取代人类了。网上关于ChatGPT的分析文章已经非常多了，小猿经过高强度的网络冲浪，整理出了AIGC算法演变。

生成模型：让AI也可以有灵魂

AI发展多年，过去解决的多是模态识别的问题，比如最成功的案例就是图像识别了。采用CNN算法，把信息与图能够通过AI训练的方式给训练出来，教会了AI去识别某个模态，在教科书里，被称为判别式模型 (Discriminant Model) 。抽象来看，就是训练一个巨大的神经网络（多层多参数）来实现输入和输出的映射关系。从数学来看，就是学习输入输出的条件概率分布，类似于因果关系。算法的本质是想更准确的控制映射关系。

然而，除此之外，还有一种叫生成式模型 (Generative Model)，是学习数据中的联合概率分布，类似于相关性，算法的本质并不是准确控制映射关系，而是在有相关性的基础上学习一个分布。

而生成模型的发展，使得AI变得更多多元，不仅仅可以用于图像识别声音识别这类模态识别问题，还可以实现更多创造性的工作。

Transformer 的横空出世，AIGC（文本）得以飞跃

事实上，在Transformer出来之前，文本也就是NLP的问题一般采用RNN（和语音类似），主要原因是文本有前后序列和语音是类比的。但是这种算法的效果并不好，也导致NLP过去一直是落后于图像语音的，拿图像来说，CNN算法已经多个变种，已经可以实现非常好的效果，根据Stanford大学的《2022AI Index Report》如下图。Imagenet的图像识别挑战中，图像识别的准确度在2016年就已经超过了人类的标准值了，而最近几年几乎已经达到了峰值。

然而，对于自然语言的推理识别的准确度虽然从Transformer之后，快速提升，但是直到2021年还没有达到人类标准值，当然预计2022年之后肯定是一个大飞跃了。

在2013年，AI研究人员倒腾了一个自然语言处理的处理模型 Word2Vec。顾名思义，”Word2Vec”就是 “word to vector，从词到向量”。研究人员的目标是把一个单词变成一个数学向量，这个数学量在NLP里有个专门的名词，叫做Word Embedding（词嵌入）。

为啥要变成一个向量，出发点也很简单，如果能将每个单词都能表示为数学空间里的一个向量，那理论上，在这个向量空间里比较接近的词，就是意义接近的单词

但问题是利用Word Embedding只能初始化第一层网络参数，和图像处理领域的预训练能有效初始化大多数网络层级不可同日而语。

Transformer: 改变了NLP发展困境

而2017年Google发表的著名文章attention is all you need，提出了transformer模型概念，使得NLP上升了巨大的台阶。Transformer架构的核心是Self-Attention机制，该机制使得Transformer能够有效提取长序列特征，相较于 CNN能够更好的还原全局。

因为抛弃了传统的RNN模型， 彻底规避了RNN不能很好并行计算的困扰，此外，每一步计算不依赖

Original: https://blog.csdn.net/m0_55535939/article/details/128520475
Author: 小猿@科技投资
Title: 从ChatGPT说起，AIGC生成模型如何演进

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/811487/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python每日一练（牛客数据分析篇新题库）——第36天：分组聚合

文章目录 1. 牛客用户刷题量的方差与提交次数的标准差 2. 大佬用户成就值比例 3. 牛客网用户最高的正确率 4. 统计牛客网用户的名字长度《100天精通Python》专栏推荐…

Python 2023年8月7日
0051
课程笔记2：Scrapy框架——Selector（选择器）的用法

Selector是基于lxml来构建的，支持XPath选择器、CSS选择器以及正则表达式。 1.直接使用 from scrapy import Selector body = …

Python 2023年10月1日
0038
【整理】爬取网页数据的方法汇总

网页爬取方法汇总：浏览器console 浏览器插件 * · Web Scraper 在线网页爬取工具八爪鱼软件 Python 案例：爬取豆瓣电影Top 250的列表（电影名称、…

Python 2023年8月1日
0072
在xshell上传文件时，报错

想要将Windows中的文件拖入我的master上，但是在打开文件传输时，出现了提示弹窗：这个问题与之前的虚拟机无法打开原理相同，也是因为防火墙的问题，电脑自动阻止了对它的访问：…

Python 2023年6月12日
0066
测试开发面试题（自用，遇到哪个记录哪个，持续更新~）

测试开发面试题（自用，遇到哪个记录哪个，持续更新~） 1.现在有个程序，发现在Windows上运行得很慢，怎么判别是程序存在问题还是软硬件系统存在问题？答： 2.测试活动中，如果…

Python 2023年9月14日
0050
IEMOCAP数据集分析

IEMOCAP数据集分析论文：IEMOCAP: Interactive emotional dyadic motion capture database 作者：Carlos Bu…

Python 2023年11月8日
0042
【conda 安装软件报错 ERROR conda.auxlib.logz:stringify(163): Expecting value: line 1 column 1 (char 0)】

conda install matplotlib反复报错，报错信息如下Collecting package metadata (current_repodata.json): \ …

Python 2023年8月2日
0033
MySQL DDL执行方式-Online DDL介绍

1 引言大家好，今天与大家一起分享一下 mysql DDL执行方式。一般来说MySQL分为DDL（定义）和DML（操作）。 DDL：Data Definition Langua…

Python 2023年10月21日
0042
FastAPI-Amis-Admin: 一个拥有高性能,高效率,易拓展的fastapi管理后台框架

项目介绍 FastAPI-Amis-Admin fastapi-amis-admin是一个拥有高性能,高效率,易拓展的fastapi管理后台框架启发自Django-Admin,并且…

Python 2023年8月6日
0076
世界杯已开赛，哪些看球设备让你觉得身临其境？

笔者在父亲的影响下，从1994年美国世界杯开始接触足球，因为当时 CCTV5 对拥有着小世界杯之称的意甲转播，成为了一名意大利足球队的忠实拥趸，一直到现在。四年一次的世界杯也成了…

Python 2023年10月24日
0035
制作pygame小窗口

先下载了pygame 在IDLE上可以看看版本然后输入代码： #-*-coding:utf-8 -*- import sys import pygame pygame.init(…

Python 2023年9月24日
0033
python pandas csv 写文件_Pandas读写CSV文件的方法介绍（附代码）

本篇文章给大家带来的内容是关于Pandas读写CSV文件的方法介绍(附代码)，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。读csv：使用pandas读取impo…

Python 2023年8月21日
0064
scrapy的安装及入门使用

每日分享：有一句安慰的话是比上不足，比下有余；但这句话其实安慰不了人，只要常常存着跟别人比较的心就永远不会快乐不用一味怨叹自己没朋友，有些人是你运气好，才没跟他们成为朋友目…

Python 2023年10月1日
0033
Python记录日志模块推荐-loguru！

python;gutter:true; 作者:小张学Python 本文链接: https://mp.weixin.qq.com/s/dkNkEohPl6H2VopUrpxxZg 转…

Python 2023年6月3日
0090
简单易上手小案例之——生命游戏

Original: https://www.cnblogs.com/xiaoxiongmao123/p/16364847.htmlAuthor: 小熊猫爱恰饭Title: 简单易上…

Python 2023年11月2日
0032
2022数学建模国赛C题思路分析

文章内容较多，大家仔细观看，所有内容仅供参考！大家不要直接照抄，切记，防止被查重！！一、问题的重述 1.1 研究背景玻璃的主要原料是石英砂，主要化学成分是二氧化硅（SiO2）。…

Python 2023年9月30日
0022

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

从ChatGPT说起，AIGC生成模型如何演进

生成模型：让AI也可以有灵魂

Transformer 的横空出世，AIGC（文本）得以飞跃

Transformer: 改变了NLP发展困境

大家都在看