Task1 Pandas基础学习（一）

2023年7月8日上午6:53 • 人工智能 • 阅读 67

DataFrame介绍：

DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。

导入包：

1.将字典转化为DataFrame

定义字典：

data = {"grammer":["Python","C","Java","GO",np.nan,"SQL","PHP","Python"],
       "score":[1,2,3,4,5,6,7,10]}

将字典转化为DataFrame：

df = pd.DataFrame(data)

&#x5F97;&#x5230;&#xFF1A;

2.提取含有字符串”Python”行：

方法一：


df[df['grammer'] == 'Python']

方法二：

results = df['grammer'].str.contains("Python")
results.fillna(value=False,inplace = True)
df[results]

得到的结果：

3.输出列名：

print(df.columns)

得到的结果：

Out[28]: Index(['grammer', 'score'], dtype='object')

4.将第二列改成”popularity”:


df.rename(columns = {'score':'popularity'}, inplace = True)

输出df：

5.统计grammer每一列中编程语言出现的次数：

df['grammer'].value_counts()

结果：

6.提取popularity中大于三的：

df[df['score']>3]

结果：

7.按照grammer列进行去除重复值：


df.drop_duplicates(['grammer'])

8.计算popularity列的平均值：

df['score'].mean()

9.将grammer列转化为list：


df['grammer'].tolist()

10.将DataFrame保存为csv

df.to_csv("text.csv")

结果得到了一个csv文件：

task来源于和鲸训练营

Original: https://blog.csdn.net/weixin_51756104/article/details/116356100
Author: 小皮麻花
Title: Task1 Pandas基础学习（一）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/677983/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

使用neo4j-admin导入数据到neo4j

首先了解neo4j-admin这个工具的优缺点：缺点：由于是类似初始化数据库操作，需要先把neo4j服务停止，删除数据库，优点：导入数据速度快版本：3.5.28进入数据库安装目…

人工智能 2023年6月1日
0060
分类评价指标 F值详解 | Micro F1 & Macro F1 & Weight F1

之前写一个作业样本不均衡问题。然后查了很多文章都说要更换评价指标，不能再使用准确率了，要计算F值。我看了一下F值怎么计算，看了挺多文章的，但是感觉说的比较迷惑，或者说法比较拗口。最…

人工智能 2023年6月30日
00137
学校图书借阅管理系统(MySQL)

文章目录一.需求分析 * 1.1项目需求分析简介 1.2数据字典 – 1.2.1数据项 1.2.2数据结构二.数据库概念结构设计 * 2.1数据流图 2.2数据库逻…

人工智能 2023年7月29日
0049
机器学习：SOM聚类的实现

SOM SOM算法是一种无监督学习的神经网络算法。由输入层和竞争层（输出层）组成。SOM是一种聚类方法。 ; 算法步骤初始化竞争层；竞争层一行代表一个坐标点（x，y）。根据竞争…

人工智能 2023年5月31日
00126
清风数学建模学习笔记——系统(层次)聚类原理详解及案例分析

系统聚类系统聚类的合并算法通过计算两类数据点间的距离，对最为接近的两类数据点进行组合，并反复迭代这一过程，直到将所有数据点合成一类，并生成聚类谱系图。此外，系统聚类可以解决簇数 …

人工智能 2023年5月31日
0070
能否通过技术分析敏锐捕捉提前入驻即将轮动的版块

BigQuant人工智能量化投资交易平台不管是跨市场、还是跨板块轮动，其实量化比起主观更具先天优势，因为投资者当某个行业出现信息或冲击时，专门从事相关行业的投资者可能也无法迅速把…

人工智能 2023年6月1日
00106
python数据分析的一些基础性知识（一）

1、pandas中的数据读写文本文件是由若干行字符构成的计算机文件，csv是一种用分隔符分隔的文件格式，相对简单，比较通用，是以纯文本形式存储表格数据（数字和文本），应用于程序之…

人工智能 2023年6月11日
00263
ewiews面板回归模型操作_Eviews3种面板模型的选择-F检验操作详情

CSDN同步链接-Eviews3种面板模型的选择-F检验操作详情之前有小伙伴问小编关于三种面板模型(不变系数、变截距、变系数)的选择，具体如何操作，所以今天小编亲自来实操咯。今…

人工智能 2023年6月18日
00112
3D单目(mono 3D)目标检测算法综述

layout: posttitle: 3D单目(mono 3D)目标检测算法综述date: 2021-01-22 22:08:39.000000000 +09:00categori…

人工智能 2023年7月9日
0087
巧用工具！轻轻松松将声音转换成文字

今天给大家介绍，如何在工作中，巧用工具，将我们会议中的录音声音，转换成文字，省了打字的时间，节约我们的工作效率准备工作：一台能够正常联网的电脑安装”录音啦&#82…

人工智能 2023年5月25日
0071
时间序列与ARIMA模型简记

时间序列分析预测的方法和形式多种多样，根据方法本身的性质特点将预测方法分为定性预测方法、时间序列分析、因果关系预测。时间序列是按照一定的时间间隔排列的一组数据，通过对这些时间序…

人工智能 2023年7月17日
0076
2022年国产AI深度学习框架使用占比（MindSpore、Paddle Paddle、Tensorflow、Pytorch）

对 AI 框架来说，国外最知名社区是 Microsoft 收购的开源代码托管平台 Github，国内知名社区是由OSCHINA.NET 推出的代码托管平台 Gitee（码云） 1…

人工智能 2023年7月22日
00110
关于SSML音频合成是否成功的判断

判断SSML音频是否合成成功 1.创建SpeechConfig对象 var config = SpeechConfig.FromSubscription("e1f258d…

人工智能 2023年5月25日
0086
【动手学习深度学习】循环神经网络-3.语言模型

上一篇：【动手学习深度学习】循环神经网络-2.文本预处理文章目录 * – 3.语言模型 – + 3.1 学习语言模型 + 3.2 马尔科夫模型与n元语法 …

人工智能 2023年5月28日
0076
【数据挖掘】视觉模式挖掘：Hog特征+余弦相似度/k-means聚类

实验概述本次实验使用的是VOC2012数据集，首先从图像中随机采样图像块，然后利用Hog方法提取图像块特征，最后采用余弦相似度和k-means聚类两种方法来挖掘视觉模式。数据集…

人工智能 2023年7月17日
0064
基于6种监督学习（逻辑回归+决策树+随机森林+SVM+朴素贝叶斯+神经网络）的毒蘑菇分类

公众号：尤而小屋作者：Peter编辑：Peter 大家好，我是Peter~ 本文是kaggle案例分享的第3篇，赛题的名称是：Mushroom Classification，Saf…

人工智能 2023年7月14日
00177

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Task1 Pandas基础学习（一）

大家都在看