Python数据分析与应用_从数据获取到可视化题库及答案

  • *填空题

  • *判断题

  • *选择题

  • *简答题

  • *填空题

  • *判断题

  • *选择题

arr_2d = np.array([[11, 20, 13],[14, 25, 16],[27, 18, 9]])

print(arr_2d[1, :1])

执行上述程序后,最终输出的结果为( )。

arr = np.arange(6).reshape(1, 2, 3)

print(arr.transpose(2, 0, 1))

执行上述程序后,最终输出的结果为( )。

[[[2 5]]

[[0 3]]

[[1 4]]]

[[[1 4]]

[[0 3]]

[[2 5]]]

[[[0 3]]

[[1 4]]

[[2 5]]]

[[[0]

[3]]

[[1]

[4]]

[[2]

[5]]]

  • *简答题

  • *程序题

  • *填空题

  • *判断题

  • *选择题

import pandas as pd

ser_obj = pd.Series(range(1, 6), index=[5, 3, 0, 4, 2])

ser_obj.sort_index()

执行上述程序后,最终输出的结果为( )。

5 1

3 2

0 3

4 4

2 5

0 3

2 5

3 2

4 4

5 1

5 1

4 4

3 2

2 5

0 3

2 5

4 4

0 3

3 2

5 1

  • *简答题

  • *程序题

  • *填空题

  • *判断题

  • *选择题

from pandas import Series

import pandas as pd

from numpy import NaN

series_obj = Series([None, 4, NaN])

pd.isnull(series_obj)

执行上述程序后,最终输出的结果为( )。

0 True

1 False

2 True

0 True

1 True

2 False

0 False

1 True

2 True

0 True

1 True

2 True

import numpy as np

import pandas as pd

ser_obj = pd.Series([4, np.nan, 6, 5, -3, 2])

ser_obj.sort_values()

执行上述程序后,最终输出的结果为( )。

4 -3.0

5 2.0

0 4.0

3 5.0

2 6.0

1 NaN

1 NaN

2 6.0

3 5.0

0 4.0

5 2.0

4 -3.0

5 2.0

0 4.0

3 5.0

2 6.0

4 -3.0

1 NaN

0 4.0

1 NaN

2 6.0

3 5.0

4 -3.0

5 2.0

  • *简答题

  • *程序题

  • *填空题

  • *判断题

  • *选择题

import pandas as pd

(pd.DataFrame([[2, 3],] * 3, columns=[‘A’, ‘B’])).apply(lambda x: x + 1)

执行上述程序后,最终输出的结果为( )。

A B

0 3 2

1 3 2

2 3 2

A B

0 2 3

1 2 3

2 2 3

A B

0 3 4

1 3 4

2 3 4

A B

0 4 3

1 4 3

2 4 3

  • *简答题

  • *程序题

  • *填空题

  • *判断题

  • *选择题

  • *程序题

  • *填空题

  • *判断题

  • *选择题

import pandas as pd

period1 = pd.Period(‘2015/6/1’)

print(period1 + 50)

执行上述程序,最终输出的结果为( )。

import pandas as pd

import numpy as np

date_index = pd.date_range(start=”2018/08/10″, periods=5)

date_se = pd.Series(np.arange(5), index=date_index)

sorted_se = date_se.sort_index()

print(sorted_se.truncate(after=’2018-8-11′))

执行上述程序,最终输出的结果为( )。

2018-08-12 2

2018-08-13 3

2018-08-12 2

2018-08-13 3

2018-08-14 4

2018-08-10 0

2018-08-11 1

2018-08-12 2

2018-08-10 0

2018-08-11 1

  • *简答题

  • *程序分析题

阅读下面的程序,分析代码是否能够编译通过。如果能编译成功,请列出运行的结果,否则请说明编译失败的原因。

import pandas as pd

date_index = pd.date_range(‘2018/08/10’)

ser_obj = pd.Series(11, date_index)

print(ser_obj)

import pandas as pd

period1 = pd.Period(‘2017/1’)

period2 = pd.Period(‘2017/6’)

print(period2-period1)

date_index = pd.date_range(‘2018/09/10’, ‘2018/09/13’)

ser_obj = pd.Series(11, date_index)

ser_obj[‘2018\09\12’]

  • *填空题

  • *判断题

  • *选择题

from nltk.corpus import stopwords

import nltk

sentence = ‘Life is short,you need Python.’

words = nltk.word_tokenize(sentence)

stop_words = stopwords.words(‘english’)

remain_words = []

for word in words:

if word not in stop_words:

remain_words.append(word)

print(remain_words)

执行上述程序,最终输出的结果为( )。

import jieba

sentence = ‘人生苦短,我用Pyhton’

terms_list = jieba.cut(sentence, cut_all=True)

print(‘ ‘.join(terms_list))

执行上述程序,最终输出的结果为( )。

  • *简答题

  • *填空题

  • *判断题

  • *选择题

  • *简答题

  • *填空题

  • *判断题

  • *选择题

  • *简答题

NumPy数组不需要循环遍历,即可对每个元素执行批量的算术运算操作,这个过程叫做矢量化运算。

两个数组的某一维度等长,或其中一个数组为一维数组。

  • *程序题

import numpy as np

arr = np.zeros(5)

print(arr)

import numpy as np

arr = np.zeros((8,8),dtype=int)

arr[1::2,::2] = 1

arr[::2,1::2] = 1

print(arr)

  • *填空题

  • *判断题

  • *选择题

  • *简答题

DataFrame是一个类似于二维数组的对象,它每列的数据可以是不同的数据类型。DataFrame的结构也是由索引和数据组成的,并且DataFrame的索引有行索引和列索引。

  • *程序题

import numpy as np

import pandas as pd

df_data = np.array([[1, 5, 8, 8], [2, 2, 4, 9],

[7, 4, 2, 3], [3, 0, 5, 2]]) # 创建数组

col_data = np.array([‘A’, ‘B’, ‘C’, ‘D’]) # 创建数组

基于数组创建DataFrame对象

df_obj = pd.DataFrame(columns=col_data, data=df_data)

df_obj

sort_values_data = df_obj.sort_values(by=[‘B’], ascending=False)

sort_values_data

sort_values_data.to_csv(r’E:\数据分析\write_data.csv’)

‘写入完毕’

  • *填空题

  • *判断题

  • *选择题

  • *简答题

  • *程序题

import pandas as pd

import numpy as np

group_a = pd.DataFrame({‘A’: [2,3,5,2,3],

‘B’: [‘5′,np.nan,’2′,’3′,’6’],

‘C’: [8,7,50,8,2],

‘key’: [3,4,5,2,5]})

group_b = pd.DataFrame({‘A’: [3,3,3],

‘B’: [4,4,4],

‘C’: [5,5,5]})

print(group_a)

print(group_b)

group_a =group_a.combine_first(group_b)

group_a

group_a.rename(columns={‘key’:’D’})

  • *填空题

  • *判断题

  • *选择题

  • *简答题

  • *程序题

import pandas as pd

studnets_data = pd.DataFrame({‘年级’:[‘大一’,’大二’,’大三’,

‘大四’,’大二’,’大三’,

‘大一’,’大三’,’大四’],

‘姓名’:[‘李宏卓’,’李思真’,’张振海’,

‘赵鸿飞’,’白蓉’,’马腾飞’,

‘张晓凡’,’金紫萱’,’金烨’],

‘年龄’:[18,19,20,21,

19,20,18,20,21],

‘身高’:[175,165,178,175,

160,180,167,170,185],

‘体重’:[65,60,70,76,55,

70,52,53,73]})

data = studnets_data.groupby(‘年级’)

Freshman = dict([x for x in data])[‘大一’]

print(Freshman )

data = data.apply(max)

del data[‘年级’]

print(data)

Junior = dict([x for x in data])[‘大三’]

print(Freshman[‘体重’].apply(‘mean’))

print(Junior[‘体重’].apply(‘mean’))

  • *填空题

  • *判断题

  • *选择题

  • *程序题

import pandas as pd

stock_data = pd.DataFrame({‘证券代码’:[‘000609′,’000993′,’002615’,

‘000795’,’002766′,’000971′,

‘000633’,’300173′,’300279′,’000831′],

‘证券简称’:[‘中迪投资’,’闽东电力’,’哈尔斯’,

‘英洛华’,’索菱股份’,’高升控股’,

‘合金投资’,’智慧松德’,’和晶科技’,’五矿稀土’],

‘最新价’:[4.80,4.80,5.02,3.93,6.78,

3.72,4.60,4.60,5.81,9.87],

‘涨幅跌%’:[10.09,10.09,10.09,10.08,

10.06,10.06,10.06,10.05,10.05,10.04]})

print(stock_data)

import matplotlib.pyplot as plt

%matplotlib inline

plt.rcParams[‘font.sans-serif’]=[‘SimHei’] # 正常显示中文标签

plt.rcParams[‘axes.unicode_minus’]=False # 正常显示负号

x_axis = stock_data[‘证券简称’]

y_axis = stock_data[‘最新价’]

plt.bar(x_axis ,y_axis )

先进行保存,如果在show()函数后面使用,会出现保存的图片是空白图片

plt.savefig(r”C:\Users\admin\Desktop\shares_bar .png”)

plt.show()

  • *填空题

  • *判断题

  • *选择题

  • *简答题

如果是将高频率数据聚合到低频率,则称为降采样;如果是将低频率数据转换到高频率数据,则称为升采样。

  • *程序分析题

  • *填空题

  • *判断题

  • *选择题

  • *简答题

常用的文本情感分析方法有两种分别是基于情感词典和基于机器学习。使用情感词典的方法主要是通过制定一系列的情感词典和规则,对文本进行段落拆解、句法分析、情感值计算,而机器学习方法是将问题进行归纳分类,根据分类对文本进行不同的标注。

文本相似度的检测一般分为如下步骤:1、通过特征提取的模型或手动实现,找出这两篇文章的关键词。2、从每篇文章中各取出若干个关键词,把这些关键词合并成一个集合,然后计算每篇文章中各个词对于这个集合中的关键词的词频。3、生成两篇文章中各自的词频向量。4、计算两个向量的余弦相似度,值越大则表示越相似。

Original: https://blog.csdn.net/m0_63394128/article/details/124698433
Author: 高校知识店铺合集汇总
Title: Python数据分析与应用_从数据获取到可视化题库及答案

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/692795/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球