Python数据分析与应用_从数据获取到可视化题库及答案

2023年7月14日下午8:15 • 人工智能 • 阅读 66

*填空题
*判断题
*选择题
*简答题
*填空题
*判断题
*选择题

arr_2d = np.array([[11, 20, 13],[14, 25, 16],[27, 18, 9]])

print(arr_2d[1, :1])

执行上述程序后，最终输出的结果为（）。

arr = np.arange(6).reshape(1, 2, 3)

print(arr.transpose(2, 0, 1))

执行上述程序后，最终输出的结果为（）。

[[[2 5]]

[[0 3]]

[[1 4]]]

[[[1 4]]

[[0 3]]

[[2 5]]]

[[[0 3]]

[[1 4]]

[[2 5]]]

[[[0]

[3]]

[[1]

[4]]

[[2]

[5]]]

*简答题
*程序题
*填空题
*判断题
*选择题

import pandas as pd

ser_obj = pd.Series(range(1, 6), index=[5, 3, 0, 4, 2])

ser_obj.sort_index()

执行上述程序后，最终输出的结果为（）。

5 1

3 2

0 3

4 4

2 5

0 3

2 5

3 2

4 4

5 1

4 4

3 2

2 5

0 3

2 5

4 4

0 3

3 2

5 1

*简答题
*程序题
*填空题
*判断题
*选择题

from pandas import Series

import pandas as pd

from numpy import NaN

series_obj = Series([None, 4, NaN])

pd.isnull(series_obj)

执行上述程序后，最终输出的结果为（）。

0 True

1 False

2 True

0 True

1 True

2 False

0 False

1 True

2 True

0 True

1 True

2 True

import numpy as np

import pandas as pd

ser_obj = pd.Series([4, np.nan, 6, 5, -3, 2])

ser_obj.sort_values()

执行上述程序后，最终输出的结果为（）。

4 -3.0

5 2.0

0 4.0

3 5.0

2 6.0

1 NaN

2 6.0

3 5.0

0 4.0

5 2.0

4 -3.0

5 2.0

0 4.0

3 5.0

2 6.0

4 -3.0

1 NaN

0 4.0

1 NaN

2 6.0

3 5.0

4 -3.0

5 2.0

*简答题
*程序题
*填空题
*判断题
*选择题

import pandas as pd

(pd.DataFrame([[2, 3],] * 3, columns=[‘A’, ‘B’])).apply(lambda x: x + 1)

执行上述程序后，最终输出的结果为（）。

A B

0 3 2

1 3 2

2 3 2

A B

0 2 3

1 2 3

2 2 3

A B

0 3 4

1 3 4

2 3 4

A B

0 4 3

1 4 3

2 4 3

*简答题
*程序题
*填空题
*判断题
*选择题
*程序题
*填空题
*判断题
*选择题

import pandas as pd

period1 = pd.Period(‘2015/6/1’)

print(period1 + 50)

执行上述程序，最终输出的结果为（）。

import pandas as pd

import numpy as np

date_index = pd.date_range(start=”2018/08/10″, periods=5)

date_se = pd.Series(np.arange(5), index=date_index)

sorted_se = date_se.sort_index()

print(sorted_se.truncate(after=’2018-8-11′))

执行上述程序，最终输出的结果为（）。

2018-08-12 2

2018-08-13 3

2018-08-12 2

2018-08-13 3

2018-08-14 4

2018-08-10 0

2018-08-11 1

2018-08-12 2

2018-08-10 0

2018-08-11 1

*简答题
*程序分析题

阅读下面的程序，分析代码是否能够编译通过。如果能编译成功，请列出运行的结果，否则请说明编译失败的原因。

import pandas as pd

date_index = pd.date_range(‘2018/08/10’)

ser_obj = pd.Series(11, date_index)

print(ser_obj)

import pandas as pd

period1 = pd.Period(‘2017/1’)

period2 = pd.Period(‘2017/6’)

print(period2-period1)

date_index = pd.date_range(‘2018/09/10’, ‘2018/09/13’)

ser_obj = pd.Series(11, date_index)

ser_obj[‘2018\09\12’]

*填空题
*判断题
*选择题

from nltk.corpus import stopwords

import nltk

sentence = ‘Life is short,you need Python.’

words = nltk.word_tokenize(sentence)

stop_words = stopwords.words(‘english’)

remain_words = []

for word in words:

if word not in stop_words:

remain_words.append(word)

print(remain_words)

执行上述程序，最终输出的结果为（）。

import jieba

sentence = ‘人生苦短，我用Pyhton’

terms_list = jieba.cut(sentence, cut_all=True)

print(‘ ‘.join(terms_list))

执行上述程序，最终输出的结果为（）。

*简答题
*填空题
*判断题
*选择题
*简答题
*填空题
*判断题
*选择题
*简答题

NumPy数组不需要循环遍历，即可对每个元素执行批量的算术运算操作，这个过程叫做矢量化运算。

两个数组的某一维度等长，或其中一个数组为一维数组。

*程序题

import numpy as np

arr = np.zeros(5)

print(arr)

import numpy as np

arr = np.zeros((8,8),dtype=int)

arr[1::2,::2] = 1

arr[::2,1::2] = 1

print(arr)

*填空题
*判断题
*选择题
*简答题

DataFrame是一个类似于二维数组的对象，它每列的数据可以是不同的数据类型。DataFrame的结构也是由索引和数据组成的，并且DataFrame的索引有行索引和列索引。

*程序题

import numpy as np

import pandas as pd

df_data = np.array([[1, 5, 8, 8], [2, 2, 4, 9],

[7, 4, 2, 3], [3, 0, 5, 2]]) # 创建数组

col_data = np.array([‘A’, ‘B’, ‘C’, ‘D’]) # 创建数组

基于数组创建DataFrame对象

df_obj = pd.DataFrame(columns=col_data, data=df_data)

df_obj

sort_values_data = df_obj.sort_values(by=[‘B’], ascending=False)

sort_values_data

sort_values_data.to_csv(r’E:\数据分析\write_data.csv’)

‘写入完毕’

*填空题
*判断题
*选择题
*简答题
*程序题

import pandas as pd

import numpy as np

group_a = pd.DataFrame({‘A’: [2,3,5,2,3],

‘B’: [‘5′,np.nan,’2′,’3′,’6’],

‘C’: [8,7,50,8,2],

‘key’: [3,4,5,2,5]})

group_b = pd.DataFrame({‘A’: [3,3,3],

‘B’: [4,4,4],

‘C’: [5,5,5]})

print(group_a)

print(group_b)

group_a =group_a.combine_first(group_b)

group_a

group_a.rename(columns={‘key’:’D’})

*填空题
*判断题
*选择题
*简答题
*程序题

import pandas as pd

studnets_data = pd.DataFrame({‘年级’:[‘大一’,’大二’,’大三’,

‘大四’,’大二’,’大三’,

‘大一’,’大三’,’大四’],

‘姓名’:[‘李宏卓’,’李思真’,’张振海’,

‘赵鸿飞’,’白蓉’,’马腾飞’,

‘张晓凡’,’金紫萱’,’金烨’],

‘年龄’:[18,19,20,21,

19,20,18,20,21],

‘身高’:[175,165,178,175,

160,180,167,170,185],

‘体重’:[65,60,70,76,55,

70,52,53,73]})

data = studnets_data.groupby(‘年级’)

Freshman = dict([x for x in data])[‘大一’]

print(Freshman )

data = data.apply(max)

del data[‘年级’]

print(data)

Junior = dict([x for x in data])[‘大三’]

print(Freshman[‘体重’].apply(‘mean’))

print(Junior[‘体重’].apply(‘mean’))

*填空题
*判断题
*选择题
*程序题

import pandas as pd

stock_data = pd.DataFrame({‘证券代码’:[‘000609′,’000993′,’002615’,

‘000795’,’002766′,’000971′,

‘000633’,’300173′,’300279′,’000831′],

‘证券简称’:[‘中迪投资’,’闽东电力’,’哈尔斯’,

‘英洛华’,’索菱股份’,’高升控股’,

‘合金投资’,’智慧松德’,’和晶科技’,’五矿稀土’],

‘最新价’:[4.80,4.80,5.02,3.93,6.78,

3.72,4.60,4.60,5.81,9.87],

‘涨幅跌%’:[10.09,10.09,10.09,10.08,

10.06,10.06,10.06,10.05,10.05,10.04]})

print(stock_data)

import matplotlib.pyplot as plt

%matplotlib inline

plt.rcParams[‘font.sans-serif’]=[‘SimHei’] # 正常显示中文标签

plt.rcParams[‘axes.unicode_minus’]=False # 正常显示负号

x_axis = stock_data[‘证券简称’]

y_axis = stock_data[‘最新价’]

plt.bar(x_axis ,y_axis )

先进行保存，如果在show()函数后面使用，会出现保存的图片是空白图片

plt.savefig(r”C:\Users\admin\Desktop\shares_bar .png”)

plt.show()

*填空题
*判断题
*选择题
*简答题

如果是将高频率数据聚合到低频率，则称为降采样；如果是将低频率数据转换到高频率数据，则称为升采样。

*程序分析题
*填空题
*判断题
*选择题
*简答题

常用的文本情感分析方法有两种分别是基于情感词典和基于机器学习。使用情感词典的方法主要是通过制定一系列的情感词典和规则，对文本进行段落拆解、句法分析、情感值计算，而机器学习方法是将问题进行归纳分类，根据分类对文本进行不同的标注。

文本相似度的检测一般分为如下步骤：1、通过特征提取的模型或手动实现，找出这两篇文章的关键词。2、从每篇文章中各取出若干个关键词，把这些关键词合并成一个集合，然后计算每篇文章中各个词对于这个集合中的关键词的词频。3、生成两篇文章中各自的词频向量。4、计算两个向量的余弦相似度，值越大则表示越相似。

Original: https://blog.csdn.net/m0_63394128/article/details/124698433
Author: 高校知识店铺合集汇总
Title: Python数据分析与应用_从数据获取到可视化题库及答案

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692795/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Document-Level Event Role Filler Extraction using Multi-Granularity Contextualized Encodin（2020）论文笔记

背景当识别事件参数所需的信息分布在多个句子中时,需要更大的上下文视图来确定哪些文本跨度对应于事件角色填充.完整的文档级提取问题通常需要角色填充词提取、名词短语共指消解和事件跟踪(…

人工智能 2023年6月1日
0068
Pyspark分类–LinearSVC

LinearSVC:支持向量机线性分类LINEARSVC模型 class pyspark.ml.classification.LinearSVC(featuresCol=&#821…

人工智能 2023年7月2日
0072
RepVGG论文详解以及使用Pytorch进行模型复现

RepVGG: Making VGG-style ConvNets Great Again 是 2021 CVPR的一篇论文，正如他的名字一样，使用 structural re-p…

人工智能 2023年7月13日
0082
（2018 -NIPS）SimplE embedding for link prediction in knowledge

（2018 -NIPS）SimplE embedding for link prediction in knowledge 本文为阅读论文过程中的个人总结加上翻译内容构成。摘要 …

人工智能 2023年6月1日
0082
分布式计算 MapReduce 究竟是怎么一回事？

前言如果要对文件中的内容进行统计，大家觉得怎么做呢？一般的思路都是将不同地方的文件数据读取到内存中，最后集中进行统计。如果数据量少还好，但是面对海量数据、大数据的场景这样真的合适…

人工智能 2023年7月29日
0065
数仓大宽表

个人建议是：宽表可以从很多的表中结合数据，但是鉴于宽表自身的缺陷，不建议过”宽”，在无法提前做测试的情况下，尽量只使用”小宽表”，…

人工智能 2023年7月17日
0047
Cellcall:细胞间通讯分析工具（单细胞数据生信实操）

近日，做单细胞细胞间通讯分析，发现又有新的方法出现—cellcall，文章发表在Nucleic Acids Research杂志。看了一下，这个方法相比于Cellch…

人工智能 2023年7月14日
0081
python金融分析小知识(32)——机器学习之KNN回归算法的使用

Hello 大家好，我是一名新来的金融领域打工人，日常分享一些python知识，都是自己在学习生活中遇到的一些问题，分享给大家，希望对大家有一定的帮助！在上一篇文章中我给大家介绍…

人工智能 2023年6月18日
0054
【中秋征文】使用Python中秋节程序员的浪漫《嫦娥奔月》

一、前言大家好，我是猿童学🐵，欢迎来到中秋创作第三期，祝大家中秋节快乐。嫦娥相信大家不会陌生，她是中国古代神话中的人物。熟话说：”嫦娥飞天去，神州归来也”…

人工智能 2023年7月4日
0099
python 机器学习 sklearn——手把手教你预测心脏病

文章目录流程前期准备 * 数据导包数据操作 * 准备样本数据结果数据切分训练集训练数据 – 逻辑回归决策树结果总结流程 1.数据导入，清洗拆分 …

人工智能 2023年7月19日
0047
用python+opencv实现目标检测

前言 opencv是什么可能很多人都不清楚，那么这个时候咱们就可以打开百度输入opencv是什么。这不就有了吗，然后点击进去。这不就完美的解决了opencv是干啥的了吗，不过估计…

人工智能 2023年7月9日
0076
数据科学分布——Beta分布

Beta分布概念参数影响 * 数量比例随机产生数据概率密度函数累积概率密度函数概念贝塔分布（Beta Distribution) 是一个作为伯努利分布和二项式分布的…

人工智能 2023年6月25日
0064
[Python]-pandas模块-机器学习Python入门《Python机器学习手册》-03-数据整理

这本书类似于工具书或者字典，对于python具体代码的调用和使用场景写的很清楚，感觉虽然是工具书，但是对照着做一遍应该可以对机器学习中python常用的这些库有更深入的理解，在应用…

人工智能 2023年6月4日
0062
keras-yolo部署 – 权重转换(h5 -＞tflite) （2.0版）

本来我tensorflow1.13转换tflite还能转换的，但是后面我们对模型改造了一下，代码突然就抽风了，直接说当前版本不支持’流’（Switch、Me…

人工智能 2023年5月25日
0079
Tesseract-OCR5.0字体训练以及提高准确率、提升训练效率的方法

目录 1、准备工作 2、训练步骤 2.1、生成训练用tif和box文件 2.2、生成lstm文件 2.3、生成lstmf文件 2.4、生成lstmf清单文件 2.5、开始训练 2….

人工智能 2023年5月26日
00134
图像处理技术（二）滤波去噪（上）

在图像处理领域中，在真正的应用过程前，通常需要对图像进行预先处理，达到去除干扰项的目的。滤波去噪就是其中的一项图像预处理工作。在.NET下常用OpenCV进行图像处理工作,常用的…

人工智能 2023年6月4日
0077

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python数据分析与应用_从数据获取到可视化题库及答案

大家都在看