我不谈ChatGPT

2023年11月3日下午8:31 • Python • 阅读 50

（1）数据

有两个未经证实的传闻：

1、客服问答：80%用户问的问题都是那20%常见问题，但是就是这样，占用了客服人员80%的工作量和工作时间
2、资讯搜索：谷歌一位员工说，在互联网上，60%的内容都是重复的，都是被人复制来复制去的

这就是我们现实世界的信息，以及现实世界的用户。所以人工智能代替人是不可能，但要对付这帮用户，应该还是比较有余的。

（2）框架

框架目前在开源界都是比较成熟的：

问答与会话框架
意图识别方法
情感分析框架
搜索引擎、推荐引擎
文本摘要方法、文本生成方法

这些年，这些技术都进展不大，大家搞来搞去都还是卡在了海量的有质量的数据采集-标注-训练-微调上了。一句话：有多少数据就有多少智能，有多少人工就有多少智能。现在的人工智能玩的就是简单粗暴的工程暴力美学：大数据-大算力。

想想也对啊。这一届（第三次）的人工智能热潮，原本就起源于图像：

2012年李飞飞在谷歌的资助下搞ImageNet图像大数据集
2012年辛顿团队以高分打破ImageNet SOTA记录
2014年GAN发明
2016年YOLO目标检测算法发明
2018年Transformer发明
2020年CLIP发明
2022年扩散模型应用到图像生成

用一句话来说就是：2012-2022这十年，前五年就是图像识别，后五年就是图像生成。

在NLP领域只有Open AI一家公司在孤行。2020年发布的GPT-3偏重NLG：摘要与生成。2022年发布的ChatGPT偏重NLU：问答与会话。其实大家也不用太惊讶ChatGPT，本身并不复杂也并不先进，重要点就在于有钱：大数据-大人工标注-大算力训练。

在框架上，谷歌和Facebook相映生辉。在算法上，谷歌和Open AI相映生辉，大家在分类的思路上或回归的思路上不断换姿势，但刷来刷去本质上不外乎是数据对儿-翻译模型原理，Transformer这块万能砖的长度也不外乎就是250个Segment（这可追溯到上世纪90年代的LSTM Segment长度），这就是我们第三次人工智能热潮的进步。

（3）多模态

从2020年开始流行多模态，也不外乎是数据对儿对齐，共享特征。

过去问答与会话，都是纯文字输入和输出居多。现在有了多模态，不仅输入可以吃多媒体数据，而且输出方面也是图文并茂：有了2D的数字人，有人脸、有表情、有手势、有身体姿势。你看过去的文字小冰，现在也升级成有虚拟形象的：华智冰。

（4）元宇宙

一切都在朝向元宇宙的方向上狂奔，在VR元宇宙世界中，2D变3D。现在人们还做不到真人形象的数字人，还只是卡通形象，未来一定是3D真人形象。

静态的3D逼真，那就用虚幻游戏引擎生成。动态的3D逼真，那就用图像生成大模型。

交互，就用ChatGPT大模型。中国人最擅长山寨，所以我相信到2023年6月，中国肯定一堆公司（比如智源、鹏城、之江、百度、阿里、腾讯、华为等等）会发布并开源中文海量数据的ChatGPT大模型。而且到时候一定会有若干个打着高科技旗号的创业公司把免费开源的ChatGPT包装个App的壳然后骗上千万风险投资。

而且中国人也会以此为基础进行魔改：再注入语音识别-语音转文字-语音合成（文字转语音），再注入机器翻译。毕竟这两个技术也已经很成熟了，我前段时间尝试抖音和科大讯飞的语音技术感觉成熟度挺高了，集成进来就行了嘛。

这样，一个有表情有手势有身体姿势的真人3D，能直接语音对话交流而且能自动翻译。

（5）商用

元宇宙毕竟是个人休闲娱乐。如何把ChatGPT应用于商业，如网上销售和网上客服。

我过去写过CRM 40年：

1984年Dell用IVR电话呼叫中心开始做个人电脑的线上销售，Dell不开线下销售门店。
1994年Siebel把Dell的这套范式迁移到企业产品的销售，发布了SFA产品，引爆了CRM这个词。
2004年Salesforce上市。
2014年内容营销的HubSpot上市。
2024年CRM的当红炸子鸡到底会是谁呢？我猜的就是Gong这家公司。

而我们中国嘛，不流行网上电子邮件营销-网上销售-网上客服。我过去就说过：

电话容易被录音，IM容易被截屏和转发。不能打电话、不能发IM，必须线下面见
电子邮件是为了留痕追责，纸质签字盖章是为了不让电脑篡改。（这让我想起了中国用顺丰人肉传递纸质合同和发票、日本人现在还普遍用传真机+盖章签字、美国人电子邮件搞定且没有发票）

中国人企业对企业的商业场景只能锁死在私密绑定：

喝醉酒探底线：一个永远喝不醉的，是令人恐惧的
玩麻将品性格：人性，权钱色名利气，每个人都有软肋
一起洗澡坦胸露怀：每个人脱了光鲜亮丽的衣服，露出真实的身体缺陷和身体隐私部位
一起玩大保健共投名状：互相握把柄，谁也跑不了谁

但要把ChatGPT这种通用大模型应用于某个具体领域或行业，不外乎还是得重新采集具体领域或行业的大数据，加工成数据对儿，进行数据标注-数据对齐，进行大算力预训练炼丹，进行观测-微调-提示调优。也就是说，过去该做的，未来还是一步不落的还得做。想省？没门儿。

Original: https://blog.csdn.net/david_lv/article/details/128260777
Author: david_lv
Title: 我不谈ChatGPT

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/811074/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

软件测试 git和gitee集成Pycharm 基于Flask的Mock Server服务器

文章目录 * – 1 Git – + 1.1 作用 + 1.2 工具 + 1.3 名称解释 – 2 安装git和注册Gitee – …

Python 2023年8月15日
0056
AGX Xavier/X86 ubuntu环境搭建:python3、conda、virtualenv、ros、boost编译libboost_python3、cv_bridge

一、ros安装 1.设置sources.list sudo sh -c ‘echo “deb http://packages.ros.org/ros/ubu…

Python 2023年9月8日
0051
旅游可视化系统flask+pyecharts

旅游可视化系统flask+pyecharts 1、先上效果图吧 ; 2、关于环境问题 pyecharts 1.8.1，Flask 1.1.2 3、思想步骤，首先我们是先用pyech…

Python 2023年8月14日
0042
NumPy 函数手册

NumPy手册文章目录 NumPy手册 * – 获取属性 + 秩形状大小元素数据类型元素占用空间大小内存地址创建数组 + 创建空数组创建零数组创建1数…

Python 2023年8月29日
0066
Django 学习 Blog 实操 23 — 应用单元测试

文章目录一、任务二、过程 * 2.1 概念 2.2 步骤 2.2 代码三、总结 * 3.1 总结 3.2 self.assertXX 总结 3.3 self.client 总…

Python 2023年8月5日
0048
Python-函数-算术函数

算术函数 #python-函数-算术函数 #(1)加减乘除 #加法 add(),减法 subtract(),乘法 multiply(),除法 divide() #作用：数组间的加减…

Python 2023年6月9日
0072
vue3 迫不得已我硬着头皮查看了keepalive的源代码，解决了线上的问题

🚀 优质资源分享 🚀 学习路线指引（点击解锁）知识定位人群定位🧡 Python实战微信订餐小程序 🧡 进阶级本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯…

Python 2023年8月10日
0049
如何通过.exe文件控制一台电脑

CVE-2022-21999漏洞如何实现发送一个.exe文件偷偷控制他人的电脑？这个想法很刑的，所以我只是说明我的实现方式，具体操作建议仅用于hvv等专业领域，请勿以身试法。首…

Python 2023年8月30日
0044
利用Numpy计算行列式

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年8月24日
0044
使用 MAUI 在 Windows 和 Linux 上绘制 PPT 的图表

我在做一个图表工具软件，这个软件使用 MAUI 开发。我的需求是图表的内容需要和 PPT 的图表对接，需要用到 OpenXML 解析 PPT 内容，读取到 PPT 图表元素的内容，…

Python 2023年10月22日
0044
numpy的创建（多种方法）

1使用array创建 array语法 “””numpy.array(object, dtype = None, copy = True, ord…

Python 2023年8月26日
0045
chatgpt接入微信

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年10月10日
0043
多个df文件之间含有重叠项的处理

在进行数据分析时, 为获取某个完整的panel数据往往需要将多个文件进行整合. 而当这些文件之间存在重叠的时候, 单纯的拼接难以得到好的结果. 本文将以pandas重复值处理的若干…

Python 2023年8月8日
0035
scrapy数据持久化

项目管道处理、存储抓取的数据，pipelines.py一个类为一个管道，process_item方法处理数据 Mysql持久化存储数据到mysql １.建立数据库、表crea…

Python 2023年10月6日
0042
electron 基础

electron 基础前文我们快速的用了一下 electron。本篇将进一步介绍其基础知识点，例如：生命周期、主进程和渲染进程通信、contextBridge、预加载（禁用nod…

Python 2023年10月20日
0072
pandas入门（二）：pandas中DataFrame的用法

DataFrame 是 pandas 中一个重要的数据结构，相当于表格数据模型，他能像 excel 那样方便的处理数据，能快速的生成统计数据和数据图形。在这里，看看 DataFra…

Python 2023年8月18日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

我不谈ChatGPT

大家都在看