1.1 人工智能概述

2023年5月25日上午5:23 • 人工智能 • 阅读 79

1. 人工智能起源

（1）图灵测试：多次测试（一般为 5min之内），如果有超过 30%的测试者不能确定被测试者是人还是机器，那么这台机器就通过了测试，并被认为具有 人类智能。

（2）达特茅斯会议

（3）发展阶段：起步发展（1956-20世纪60年代），反思发展期（20世纪60-70年代），应用发展期（20世纪70-80年代），低迷发展期（20世纪80-90年代），稳步发展（20世纪90-2010），蓬勃发展：2011年至今

2. 人工智能发展的必备三要素

（1）数据

（2）算法

（3）计算力：CPU，GPU,TPU；

CPU主要适合I\O密集型的任务

GPU主要适合计算密集型任务

什么类型的程序适合在GPU上运行？

（1）计算密集型的程序

所谓计算密集型(Compute-intensive)的程序，就是其大部分运行时间花在了寄存器运算上，寄存器的速度和处理器的速度相当，从寄存器读写数据几乎没有延时。可以做一下对比，读内存的延迟大概是几百个时钟周期；读硬盘的速度就不说了，即便是SSD, 也实在是太慢了。

（2）易于并行的程序

GPU其实是一种SIMD(Single Instruction Multiple Data)架构，他有成百上千个核，每一个核在同一时间最好能做同样的事情。

3. 人工智能、机器学习和深度学习

机器学习是实现人工智能的一种方式

[En]

Machine learning is a way to achieve artificial intelligence*
深度学习是从机器学习发展而来的一种方法
[En]
Deep learning is a method developed from machine learning*

4. 人工智能的主要分支

（1）计算机视觉

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。 物体检测和人脸识别是其比较成功的研究领域。

（2）语音识别

语音识别是指识别语音(说出的语言)并将其转换成对应文本的技术。相反的任务(文本转语音/TTS)也是这一领域内一个类似的研究主题。

语音识别进入应用阶段已经有很长时间了。近年来，随着大数据和深度学习技术的发展，语音识别取得了很大的进步，现在已经非常接近产生社会影响的阶段。

[En]

Speech recognition has been in the application stage for a long time. In recent years, with the development of big data and deep learning technology, speech recognition has made great progress, and now it is very close to the stage of social impact.

语音识别领域仍然面临着 声纹识别和 「鸡尾酒会效应」等一些特殊情况的难题。

现代语音识别系统严重依赖云，离线后可能无法达到预期效果。

[En]

Modern speech recognition systems rely heavily on the cloud, and * may not be able to achieve the desired results offline. *

（3）文本挖掘/分类

这里的文本挖掘主要是指文本分类，该技术可用于理解、组织和分类结构化或非结构化文本文档。其涵盖的主要任务有句法分析、情绪分析和垃圾信息检测。

当前阶段：

我们将这项技术归类为应用阶段，因为许多应用程序都集成了基于文本挖掘的情感分析或垃圾邮件检测技术。文本挖掘技术也被应用到智能投资的开发中，改善了用户体验。

[En]

We classify this technology into the application phase, because many applications have integrated emotional analysis or spam detection technology based on text mining. Text mining technology is also applied in the development of intelligent investment, and improves the user experience.

（4）机器翻译

机器翻译(MT)是利用机器的力量自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)。

当前阶段：

机器翻译是一个发展很快的应用领域。最近，由于神经机器翻译在这一领域取得了显著进展，但还没有完全达到专业翻译人员的水平；但我们相信，在大数据、云计算和深度学习技术的帮助下，机器翻译很快就会进入社会影响阶段。

[En]

Machine translation is an application field that has witnessed a great deal of development. Recently, remarkable progress has been made in this field due to neural machine translation, but it still does not fully reach the level of professional translators; however, we believe that with the help of big data, cloud computing and deep learning technology, machine translation will soon enter the stage of social impact.

在某些情况下， 俚语和行话等内容的翻译会比较困难(受限词表问题)。

专业领域的机器翻译(比如医疗领域)表现通常不好。

（5）机器人

机器人学(Robotics)研究的是机器人的设计、制造、运作和应用，以及控制它们的计算机系统、传感反馈和信息处理。

机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器；另外还有能够实现感知能力的软件，比如定位、地图测绘和目标识别。

5. 机器学习工作流程

（1）什么是机器学习：

机器学习是从数据中 自动分析获得模型，并利用模型对未知数据进行预测。

（2）机器学习工作流程：

用户数据的基本处理→数据→特征工程→机器学习→模型→在线服务评估

[En]

Basic processing of user data → data → feature Engineering → Machine Learning → Model Evaluation of → online Service

（3）获取到的数据集介绍

在数据集中一般：

一行数据我们称为一个样本
一列数据我们成为一个特征
有些数据有 目标值（标签值），有些数据没有目标值（如上表中，电影类型就是这个数据集的目标值）

数据类型的构成：

数据类型一：特征值+目标值（目标值是连续的和离散的）
数据类型2：只有特征值，没有目标值

[En]

data type 2: only eigenvalues, no target values*

数据分割：

机器学习的通用数据集分为两部分：

[En]

the general data set of machine learning is divided into two parts:*
测试数据：在模型检验时使用，用于 评估模型是否有效
训练数据：用于训练， 构建模型
划分比例：
训练集：70% 80% 75%
测试集：30% 20% 25%

（4） 数据基本处理：即对数据进行缺失值、去除异常值等处理

（5）特征工程：

什么是特征工程：使用专业背景知识和技术处理数据，使得特征能在机器学习算法过程中发挥更好的作用的过程—— 会直接影响机器学习的效果
为什么需要特征工程：吴恩达说特征和数据决定了机器学习的上限，模型和算法只是接近了这个上限

（6）特征工程包含的内容： 特征提取；特征预处理；特征降维

特征提取：将任意数据（如文本或图像）转换为可用于机器学习的数字特征
特征预处理：通过 一些转换函数将特征数据 转换成更加适合算法模型的特征数据过程

特征降维： 指在某些限定条件下， 降低随机变量(特征)个数，得到 一组”不相关”主变量的过程

（7）机器学习选择合适算法对模型进行训练

（8）对训练好的模型进行评估

6. 算法

（1）监督学习：

输入数据由输入特征值和目标值组成

[En]

the input data consists of input eigenvalues and target values.*
输出可以是一个连续的值（回归），或是输出是有限个离散值（称作分类）。

（2）无监督学习：

输入数据是由输入特征值组成，没有目标值
需要根据样本间的相似性对样本集进行类别划分。
定义：
实质是make decisions 问题，即自动进行决策，并且可以做连续决策。
举例：小孩想要走路，但在这之前，他需要先站起来，站起来之后还要保持平衡，接下来还要先迈出一条腿，是左腿还是右腿，迈出一步后还要迈出下一步。小孩就是 agent，他试图通过采取行动（即行走）来操纵环境（行走的表面），并且从 一个状态转变到另一个状态（即他走的每一步），当他完成任务的子任务（即走了几步）时，孩子得到奖励（给巧克力吃），并且当他不能走路时，就不会给巧克力。
主要包含五个元素：agent, action, reward, environment, observation；

6. 模型评估

（1）分类模型评估

包括：准确率、精确率、召回率、F1-score、AUC

（2）回归模型评估

RMSE仅能比较误差是相同单位的模型。

其他评价指标：相对平方误差（Relative Squared Error，RSE）、平均绝对误差（Mean Absolute Error，MAE)、相对绝对误差（Relative Absolute Error，RAE)

（3）拟合

欠拟合：模型学习的太过粗糙，连训练集中的样本数据特征关系都没有学出来。
过拟合：所建的机器学习模型或者是深度学习模型在训练样本中 表现得过于优越，导致在 测试数据集中表现不佳。

Original: https://blog.csdn.net/chuchu1994/article/details/122620923
Author: 为霖
Title: 1.1 人工智能概述

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/512446/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Pytorch】交叉熵损失函数 CrossEntropyLoss() 详解

文章目录一、损失函数 nn.CrossEntropyLoss() 二、什么是交叉熵三、Pytorch 中的 CrossEntropyLoss() 函数参考链接一、损失函数 …

人工智能 2023年6月15日
0088
【pytorch笔记】（五）自定义损失函数、学习率衰减、模型微调

本文目录： 1. 自定义损失函数 2. 动态调整学习率 3. 模型微调-torchvision * 3.1 使用已有模型 3.2 训练特定层自定义损失函数虽然pytorch提供…

人工智能 2023年7月13日
0075
知识图谱的时空关联设计

背景知识图谱可以应用在多个业务场景中，对各类对象进行表示、建模。作为一类重要的知识，空间信息在应用中经常需要用到，由此知识图谱与时空关联成为一种重要的应用形式，具备较好的可视化展…

人工智能 2023年6月1日
0097
TensorFlow中的强化学习是如何实现的

强化学习在TensorFlow中的实现在TensorFlow中，强化学习是通过构建神经网络模型和使用强化学习算法来实现的。强化学习是一种机器学习方法，用于解决序贯决策问题，其中智…

人工智能 2023年12月31日
0046
OCR文字识别技术总结（一）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月28日
0050
Anomaly Detection（异常检测）的原理及最新的技术应用（李宏毅视频课整理和总结）

文章目录 0 前言 1 Introduction * 1.1 Problem Formulation 1.2 Base Idea 2 With Classifier * 2.1 B…

人工智能 2023年7月28日
0076
yolov4和yolov5详解

YOLOv4 YOLOv4的三大贡献：设计了强大而高效的检测模型，任何人都可以用 1080Ti 和 2080Ti训练这个超快而精准的模型。验证了很多近几年 SOTA 的深度学习…

人工智能 2023年5月28日
0086
触发词检测

实验题目触发词检测实验内容本次实验我们了解如何将深度学习应用于语音识别，我们将构建语音数据集并实现触发词检测算法（有时也称为关键字检测或唤醒词检测）。触发词检测是一项技术，可…

人工智能 2023年5月23日
0062
已解决：在pycharm里面import TensorFlow2.0.0失败OSError: [WinError 126] 找不到指定的模块。

描述一下我的问题：由于我以前用的是CUDA10.0，然后GPU只能用tf2.0.0版本的，后来在网上看到兼容，所以换了版本。所以现在： 1.我的环境是 anaconda+win10…

人工智能 2023年5月24日
0070
FEMTO-ST轴承数据集（IEEE PHM 2012 Challenge）

挑战赛简介 IEEE PHM 2012挑战赛由IEEE可靠性协会和法国FEMTO-ST研究所组织。挑战的重点是估算轴承的剩余使用寿命（RUL）。这是一个关键问题，因为大多数旋转机械…

人工智能 2023年7月28日
0062
聊聊什么是SpringBoot 的自动装配原理

早期的Spring项目需要添加需要配置繁琐的xml,比如MVC、事务、数据库连接等繁琐的配置。Spring Boot的出现就无需这些繁琐的配置，因为Spring Boot基于约定大…

人工智能 2023年6月27日
0079
论文阅读笔记：KG2Vec: A node2vec-based vectorization model for knowledge graph

KG2Vec: A node2vec-based vectorization model for knowledge graphEditor: Chi-Hua Chen, Fuzh…

人工智能 2023年6月5日
0095
【春节档排片地域可视化分析】

春节档排片地域可视化分析数据来源：https://www.heywhale.com/mw/project/6201173f7a7c9a0017c3236a/dataset 一、明…

人工智能 2023年6月11日
0098
解决module ‘tensorflow‘ has no attribute ‘…‘系列

原代码 sess = tf.Session() result = sess.run(Y) sess.close() 修改后 sess = tf.compat.v1.Session(…

人工智能 2023年6月23日
0079
常见气象数据获取方式及批量下载代码汇总

气象数据获取因其数据源多、请求规则不一，格式复杂、体积庞大，所以经常成为气象小白的噩梦。这里收集了一些常用气象数据下载方法及下载的代码，供大家参考 1. 中国气象数据网（这是最官方…

人工智能 2023年7月29日
00297
yolov5不会用？龙哥教你labview如何利用yolov5进行工业视觉瑕疵检测

yolov5发布于2020年，其在检测精度和速度上相比与yolov4都有较大的提高，其主要特点是：1.小目标的检测精度上有明显的提高，2.能自适应锚框计算，3.yolov5s的模型…

人工智能 2023年7月12日
0091

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

1.1 人工智能概述

1. 人工智能起源

2. 人工智能发展的必备三要素

3. 人工智能、机器学习和深度学习

4. 人工智能的主要分支

5. 机器学习工作流程

6. 算法

6. 模型评估

大家都在看