商汤发布象棋机器人『元萝卜』；『南瓜书』西瓜书公式推导&解析；代码自动美化插件；Tock建立对话机器人的AI平台；前沿论文 | ShowMeAI资讯日报

2023年5月27日下午11:55 • 人工智能 • 阅读 81

ShowMeAI 日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点击查看 历史文章列表;，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击这里回复关键字日报免费获取AI电子月刊与资料包。

📢 商汤重磅发布『元萝卜SenseRobot』AI下棋机器人，郭晶晶担任首席体验官

https://robot.sensetime.com/

8月9日商汤科技召开新品发布会，重磅推出其首个家庭消费级人工智能产品『元萝卜SenseRobot』AI下棋机器人包含AI学棋、残局挑战、棋力闯关、巅峰挑战等多种模式，可以从『0基础』为孩子介绍和讲解象棋的文化、规则及每个棋子的使用技巧，在锻炼思维的同时，还能提升孩子的文化素养。此外，它还带来100多个残局设定和26个等级的棋力对战，让用户不仅可以体验”执子下棋”的真实感受，还能开动脑力享受高水平对弈的乐趣。

; 工具&框架

🚧 『TweetNLP』面向Twitter的NLP工具包

https://github.com/cardiffnlp/tweetnlp

https://tweetnlp.org/

TweetNLP 是一款 python 自然语言处理工具库，由最先进的语言模型对推文进行训练得来，提供了一系列有用的工具来分析/理解推文，如情感分析、表情符号预测、命名实体识别、仇恨与工具语言识别等。网站提供了 Demo 可以进行尝试！

; 🚧 『Spoor』编译器指示的应用程序跟踪，让你深入了解你的应用程序的性能

https://github.com/microsoft/spoor

https://www.spoor.dev/

Spoor 是微软提供的一款工具，能够深入了解应用程序的性能，使我们能够以纳秒级的精度分析应用程序。它包含三部分工具链：编译器仪器化以自动注入跟踪事件、捕获和缓冲事件、处理和可视化跟踪。

; 🚧 『Tock』开放对话AI平台构建工具包

https://github.com/theopenconversationkit/tock

https://doc.tock.ai/en/

Tock是开放对话式人工智能平台，可用于建立对话机器人，具备一系列很好的特性：

自然语言处理开源堆栈，与OpenNLP、斯坦福、Rasa等兼容
构建故事和分析的Tock Studio用户界面；用于Kotlin、Nodejs、Python和REST API的对话DSL
内置众多文本/语音渠道的连接器（Messenger、WhatsApp、谷歌助手、Alexa、Twitter等）
提供了与React和Flutter进行自定义Web/移动集成的工具包
利用Docker在任何地方（云端或内部）部署

; 🚧 『Jupyter Notebooks』代码自动美化插件

jupyterlab_code_formatter 是一个 jupyter notebook 的美化插件，可以通过 conda install -c conda-forge jupyterlab_code_formatter black isort 命令安装，它能对我们编写的代码段落进行自动美化排版，具体效果如下图所示：

博文&分享

👍 『文本数据分析·高级可视化』Advanced Visualisations for Text Data Analysis

https://towardsdatascience.com/advanced-visualisations-for-text-data-analysis-fc8add8796e2

这篇博文对Python中的文本数据的几个高级可视化方法进行讲解，包括：

N-gram词云：显示高阶N-gram的频率
和弦图：显示几个实体之间的联系和它们的强度
气泡图：在视觉上显示词的频率

; 👍 『南瓜书 PumpkinBook』免费书籍

https://datawhalechina.github.io/pumpkin-book/#/

下载：https://github.com/datawhalechina/pumpkin-book/releases

周志华老师的《机器学习》（西瓜书）是机器学习领域的经典入门教材之一，周老师为了使尽可能多的读者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述，但是这对那些想深究公式推导细节的读者来说可能”不太友好”，本书旨在对西瓜书里比较难理解的公式加以解析，以及对部分公式补充具体的推导细节。

; 数据&资源

🔥 『Computer Vision』微软·计算机视觉最佳实践、代码示例和相关文档

https://github.com/microsoft/computervision-recipes

这个 github 资源库是微软组织的计算机视觉系统构建示例和最佳实践指南，主要针对图像分类、物体检测和图像相似性等典型任务，大部分例子以Jupyter notebook和常见的实用函数的形式提供，并使用PyTorch作为底层深度学习库。

Repo 示例基于目前最先进的库构建，并围绕加载图像数据、建模优化和评估以及扩展到云端建立额外的效用。此外，还包含微软指出的经常观察到的陷阱，以及在云环境进行训练和部署的方法。

; 研究&论文

可以点击这里回复关键字日报，免费获取整理好的论文合辑。

科研进展

2022.08.08 『 姿态估计』3D Vision with Transformers: A Survey
2022.05.10 『 3D人脸建模』KeypointNeRF: Generalizing Image-based Volumetric Avatars using Relative Spatial Encoding of Keypoints
2022.08.02 『 单目视觉运动学』Deep Patch Visual Odometry
2022.07.12 『 计算机视觉』Next-ViT: Next Generation Vision Transformer for Efficient Deployment in Realistic Industrial Scenarios

⚡ 论文：3D Vision with Transformers: A Survey

论文时间：8 Aug 2022

领域任务：Pose Estimation， 姿态估计

论文地址：https://arxiv.org/abs/2208.04309

代码实现：https://github.com/lahoud/3d-vision-transformers

论文作者：Jean Lahoud, Jiale Cao, Fahad Shahbaz Khan, Hisham Cholakkal, Rao Muhammad Anwer, Salman Khan, Ming-Hsuan Yang

论文简介：The success of the transformer architecture in natural language processing has recently triggered attention in the computer vision field./transformer架构在自然语言处理中的成功最近引发了计算机视觉领域的关注。

论文摘要：transformer架构在自然语言处理中的成功，最近在计算机视觉领域引发了关注。由于transformer具有学习长距离依赖关系的能力，它已被用作广泛使用的卷积算子的替代品。这种替代被证明在许多任务中是成功的，在这些任务中，一些最先进的方法依靠transformer进行更好的学习。在计算机视觉中，三维领域也见证了越来越多的采用transformer的三维卷积神经网络和多层感知器网络。尽管许多调查都集中在视觉中的transformer上，但由于与二维视觉相比，三维视觉在数据表示和处理方面存在差异，因此需要特别关注。在这项工作中，我们对100多种用于不同三维视觉任务的transformer方法进行了系统和彻底的回顾，包括分类、分割、检测、完成、姿态估计等。我们讨论了三维视觉中的transformer设计，这使得它可以处理具有各种三维表示的数据。对于每个应用，我们强调了所提出的基于transformer的方法的关键属性和贡献。为了评估这些方法的竞争力，我们在12个三维基准上将它们的性能与普通的非变压器方法进行比较。在调查的最后，我们讨论了三维视觉中transformer的不同开放方向和挑战。除了所提交的论文外，我们的目标是经常更新最新的相关论文及其相应的实施方案，对应的网址是：https://github.com/lahoud/3d-vision-transformers

; ⚡ 论文：KeypointNeRF: Generalizing Image-based Volumetric Avatars using Relative Spatial Encoding of Keypoints

论文时间：10 May 2022

领域任务：3D FACE MODELING, 3D Face Reconstruction， 3D人脸建模， 3D人脸重建

论文地址：https://arxiv.org/abs/2205.04992

代码实现：https://github.com/facebookresearch/KeypointNeRF

论文作者：Marko Mihajlovic, Aayush Bansal, Michael Zollhoefer, Siyu Tang, Shunsuke Saito

论文简介：In this work, we investigate common issues with existing spatial encodings and propose a simple yet highly effective approach to modeling high-fidelity volumetric humans from sparse views./在这项工作中，我们研究了现有空间编码的常见问题，并提出了一种简单而高效的方法，以从稀疏视图中建立高保真的体积人类模型。

论文摘要：基于图像的体积化人类使用像素对齐的特征，有望泛化到未见过的姿势和身份。先前的工作利用全局空间编码和多视图几何一致性来减少空间模糊性。然而，全局编码经常遭受对训练数据分布的过度拟合，而且很难从稀疏视图中学习多视图一致性重建。在这项工作中，我们研究了现有空间编码的常见问题，并提出了一种简单而高效的方法，以从稀疏视图中建立高保真体积的人类模型。其中一个关键的想法是通过稀疏的三维关键点来编码相对空间三维信息。这种方法对视点的稀疏性和跨数据集领域的差距具有鲁棒性。我们的方法在头部重建方面优于最先进的方法。在对未见过的受试者进行人体重建时，我们也取得了与之前使用参数化人体模型和时间特征聚合的工作相当的性能。我们的实验表明，先前工作中的大部分错误源于对空间编码的不恰当选择，因此我们为基于图像的高保真人体建模提出了一个新方向 https://markomih.github.io/KeypointNeRF

⚡ 论文：Deep Patch Visual Odometry

论文时间：8 Aug 2022

领域任务：Monocular Visual Odometry， 单目视觉运动学

论文地址：https://arxiv.org/abs/2208.04726

代码实现：https://github.com/princeton-vl/dpvo

论文作者：Zachary Teed, Lahav Lipson, Jia Deng

论文简介：We propose Deep Patch Visual Odometry (DPVO), a new deep learning system for monocular Visual Odometry (VO)./我们提出了Deep Patch Visual Odometry (DPVO)，这是一个新的深度学习系统，用于单目视觉测绘（VO）。

论文摘要：我们提出了Deep Patch Visual Odometry（DPVO），一个新的深度学习系统，用于单眼视觉测量（VO）。DPVO是准确和稳健的，同时在单个RTX-3090 GPU上以2-5倍的实时速度运行，只使用4GB的内存。我们在标准基准上进行了评估，在准确性和速度上都超过了所有先前的工作（经典或新方法）。代码可在 https://github.com/princeton-vl/DPVO 获取。

; ⚡ 论文：Next-ViT: Next Generation Vision Transformer for Efficient Deployment in Realistic Industrial Scenarios

论文时间：12 Jul 2022

领域任务： 计算机视觉

论文地址：https://arxiv.org/abs/2207.05501

代码实现：https://github.com/bytedance/next-vit,https://github.com/wilile26811249/Next-ViT

论文作者：Jiashi Li, Xin Xia, Wei Li, Huixia Li, Xing Wang, Xuefeng Xiao, Rui Wang, Min Zheng, Xin Pan

论文简介：Then, Next Hybrid Strategy (NHS) is designed to stack NCB and NTB in an efficient hybrid paradigm, which boosts performance in various downstream tasks./然后，下一个混合策略（NHS）被设计为在一个高效的混合范式中堆叠NCB和NTB，从而提升了各种下游任务的性能。

论文摘要：由于复杂的注意力机制和模型设计，大多数现有的视觉transformer（ViTs）在现实的工业部署场景中不能像卷积神经网络（CNNs）那样有效地执行，例如TensorRT和CoreML。这就提出了一个明显的挑战。能否设计一个视觉神经网络，使其推断速度与CNN一样快，性能与ViTs一样强大？最近的工作试图设计CNN-Transformer混合架构来解决这个问题，然而这些工作的整体性能远远不能令人满意。为了解决这些问题，我们提出了下一代视觉transformer，即Next-ViT，用于在现实的工业场景中有效部署，从延迟/准确度权衡的角度来看，它在CNN和ViT中都占优势。在这项工作中，Next Convolution Block（NCB）和Next Transformer Block（NTB）分别被开发出来，以方便部署的机制捕捉局部和全局信息。然后，设计了Next Hybrid Strategy（NHS），将NCB和NTB堆叠在一个高效的混合范式中，从而提高了各种下游任务的性能。大量的实验表明，Next-ViT在各种视觉任务中的延迟/精度权衡方面明显优于现有的CNN、ViT和CNN-Transformer混合架构。在TensorRT上，Next-ViT在COCO检测上超过ResNet 5.5 mAP（从40.4到45.9），在ADE20K分割上超过7.7% mIoU（从38.8%到46.5%）。同时，它取得了与CSWin相当的性能，而推理速度则加快了3.6倍。在CoreML上，Next-ViT在COCO检测上超过EfficientFormer 4.6 mAP（从42.6到47.2），在ADE20K分割上超过3.5% mIoU（从45.1%到48.6%）。我们的代码和模型在以下网站公开：https://github.com/bytedance/Next-ViT

我们是 ShowMeAI，致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！点击查看 历史文章列表，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击这里回复关键字日报免费获取AI电子月刊与资料包。

作者：韩信子@ShowMeAI
历史文章列表;
专题合辑&电子月刊
*欢迎回复，拜托点赞，留言推荐中有价值的文章、工具或建议，我们都会尽快回复哒~

Original: https://blog.csdn.net/ShowMeAI/article/details/126380282
Author: ShowMeAI
Title: 商汤发布象棋机器人『元萝卜』；『南瓜书』西瓜书公式推导&解析；代码自动美化插件；Tock建立对话机器人的AI平台；前沿论文 | ShowMeAI资讯日报

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/528236/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Mac下Tomcat服务器的使用-Tomcat服务器关闭

回答1：要在Linux上运行的实例，可以以下命令： 1. 进入的bin目录： cd /path/to/</p> <p>/bin<code&gt…

人工智能 2023年6月29日
0057
实验三图像空间域平滑与锐化（Python实现）

图像平滑（去噪）：编写超限像素平滑法，灰度最相近的K个邻点平均法（函数名称可以自定义），并对上面实验1选择的噪声图片进行处理，显示处理前后的各个图像，分析不同方法对不同噪声的处理效…

人工智能 2023年6月18日
0078
【OpenCV图像处理5】图像的变换

文章目录五、图像的变换 * 1、图像的基本变换 – 1.1 图像的缩放 1.2 图像的翻转 1.3 图像的旋转 2、图像的仿射变换 – 2.1 图像平移 …

人工智能 2023年6月22日
0059
机器学习中的数学——距离定义（六）：马氏距离（Mahalanobis Distance）

马氏距离（Mahalanobis Distance）是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的，表示数据的协方差距离。它是一种有效的计算两个未知样本集…

人工智能 2023年6月15日
0084
论文阅读《Sparse R-CNN：End-to-End Object Detection with Learnable Proposals》

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月12日
0057
Ubuntu查看cuDNN版本

1、先成功下载cuDNN(如果这个有问题的，请参考我的另一个博客，地址：tensorflow2.0及以上版本用GPU加速计算_English ONly的博客-CSDN博客) 2、将…

人工智能 2023年5月25日
0076
手把手教你win10下安装Anaconda

1.简介： Anaconda简单理解来说，就是一个大的环境池子，池子里面有不同的环境。每个环境用不同的名称进行标识。当我们需要哪个环境时，就在anaconda中激活哪个环境去使用即…

人工智能 2023年7月26日
00157
DNA 6. 基因组变异之绘制精美瀑布图（ComplexHeatmap）

桓峰基因公众号推出基于基因组变异数据生信分析教程并配有视频在线教程，目前整理出来的教程目录如下： DNA 1. Germline Mutation Vs. Somatic Muta…

人工智能 2023年6月19日
0071
机器学习——图像分类

1 图像分类的概念 1.1 什么是图像分类？图像分类，根据图像信息中所反映出来的不同特征，把不同类别的目标区分开来的图像处理方法 1.2 图像分类的难度 ●任何拍摄情况的改变都…

人工智能 2023年6月26日
0077
TensorFlow、CUDA、cuDNN版本对应关系

Linux Windows macOS 版本Python 版本编译器构建工具cuDNNCUDAtensorflow-2.6.03.6-3.9GCC 7.3.1Bazel 3.7.2…

人工智能 2023年5月23日
0050
fl21怎么换主题flstudio皮肤怎么换?

FLstudio21如何更改皮肤主题？不光是背景，还有按键什么的？请参考下面的步骤进行设置fl视图设置。第1步，打开visualstudiofl视图设置。第2步fl视图设置，…

人工智能 2023年7月30日
0056
中的并行计算是如何实现的

问题描述如何实现中的并行计算？详细介绍并行计算是指同时运行多个计算任务来加快计算速度的一种计算模式。在实际应用中，我们常常需要处理大规模的数据，这时候串行计算往往会面临运算速…

人工智能 2023年12月31日
0039
Python机器学习入门到高级：数据清洗（含详细代码）

🌸个人主页：JoJo的数据分析历险记 📝个人介绍：小编大四统计在读，目前保研到统计学top3高校继续攻读统计研究生 💌如果文章对你有帮助，欢迎 *关注、点赞、收藏、订阅专栏最近…

人工智能 2023年7月17日
0049
基于MATLAB的车道线识别、自动驾驶识别

使用单目相机的视觉感知这个例子展示了如何构建一个能够进行车道边界和车辆检测的单眼摄像机传感器仿真。该传感器将在车辆坐标系中报告这些检测结果。在本例中，您将了解自动驾驶工具箱™使用…

人工智能 2023年6月17日
0067
第11章Stata回归诊断与应对

目录 11.1异方差检验与应对案例延伸 11.2自相关检验与应对案例延伸 11.3多重共线性检验与应对案例延伸在上以讲中，简要介绍了最小二乘线性回归，这种方法可以满足大部分…

人工智能 2023年6月17日
0064
Ubuntu 安装 ESPNET

前言 ESPNET 是目前语音领域比较流行的库，github有4.7k stars，下面对安装过程进行记录。环境 Docker 虚拟环境 Docker 镜像：ufoym/deep…

人工智能 2023年5月23日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31