-
*填空题
-
*判断题
-
*选择题
-
*简答题
-
*填空题
-
*判断题
-
*选择题
arr_2d = np.array([[11, 20, 13],[14, 25, 16],[27, 18, 9]])
print(arr_2d[1, :1])
执行上述程序后,最终输出的结果为( )。
arr = np.arange(6).reshape(1, 2, 3)
print(arr.transpose(2, 0, 1))
执行上述程序后,最终输出的结果为( )。
[[[2 5]]
[[0 3]]
[[1 4]]]
[[[1 4]]
[[0 3]]
[[2 5]]]
[[[0 3]]
[[1 4]]
[[2 5]]]
[[[0]
[3]]
[[1]
[4]]
[[2]
[5]]]
-
*简答题
-
*程序题
-
*填空题
-
*判断题
-
*选择题
import pandas as pd
ser_obj = pd.Series(range(1, 6), index=[5, 3, 0, 4, 2])
ser_obj.sort_index()
执行上述程序后,最终输出的结果为( )。
5 1
3 2
0 3
4 4
2 5
0 3
2 5
3 2
4 4
5 1
5 1
4 4
3 2
2 5
0 3
2 5
4 4
0 3
3 2
5 1
-
*简答题
-
*程序题
-
*填空题
-
*判断题
-
*选择题
from pandas import Series
import pandas as pd
from numpy import NaN
series_obj = Series([None, 4, NaN])
pd.isnull(series_obj)
执行上述程序后,最终输出的结果为( )。
0 True
1 False
2 True
0 True
1 True
2 False
0 False
1 True
2 True
0 True
1 True
2 True
import numpy as np
import pandas as pd
ser_obj = pd.Series([4, np.nan, 6, 5, -3, 2])
ser_obj.sort_values()
执行上述程序后,最终输出的结果为( )。
4 -3.0
5 2.0
0 4.0
3 5.0
2 6.0
1 NaN
1 NaN
2 6.0
3 5.0
0 4.0
5 2.0
4 -3.0
5 2.0
0 4.0
3 5.0
2 6.0
4 -3.0
1 NaN
0 4.0
1 NaN
2 6.0
3 5.0
4 -3.0
5 2.0
-
*简答题
-
*程序题
-
*填空题
-
*判断题
-
*选择题
import pandas as pd
(pd.DataFrame([[2, 3],] * 3, columns=[‘A’, ‘B’])).apply(lambda x: x + 1)
执行上述程序后,最终输出的结果为( )。
A B
0 3 2
1 3 2
2 3 2
A B
0 2 3
1 2 3
2 2 3
A B
0 3 4
1 3 4
2 3 4
A B
0 4 3
1 4 3
2 4 3
-
*简答题
-
*程序题
-
*填空题
-
*判断题
-
*选择题
-
*程序题
-
*填空题
-
*判断题
-
*选择题
import pandas as pd
period1 = pd.Period(‘2015/6/1’)
print(period1 + 50)
执行上述程序,最终输出的结果为( )。
import pandas as pd
import numpy as np
date_index = pd.date_range(start=”2018/08/10″, periods=5)
date_se = pd.Series(np.arange(5), index=date_index)
sorted_se = date_se.sort_index()
print(sorted_se.truncate(after=’2018-8-11′))
执行上述程序,最终输出的结果为( )。
2018-08-12 2
2018-08-13 3
2018-08-12 2
2018-08-13 3
2018-08-14 4
2018-08-10 0
2018-08-11 1
2018-08-12 2
2018-08-10 0
2018-08-11 1
-
*简答题
-
*程序分析题
阅读下面的程序,分析代码是否能够编译通过。如果能编译成功,请列出运行的结果,否则请说明编译失败的原因。
import pandas as pd
date_index = pd.date_range(‘2018/08/10’)
ser_obj = pd.Series(11, date_index)
print(ser_obj)
import pandas as pd
period1 = pd.Period(‘2017/1’)
period2 = pd.Period(‘2017/6’)
print(period2-period1)
date_index = pd.date_range(‘2018/09/10’, ‘2018/09/13’)
ser_obj = pd.Series(11, date_index)
ser_obj[‘2018\09\12’]
-
*填空题
-
*判断题
-
*选择题
from nltk.corpus import stopwords
import nltk
sentence = ‘Life is short,you need Python.’
words = nltk.word_tokenize(sentence)
stop_words = stopwords.words(‘english’)
remain_words = []
for word in words:
if word not in stop_words:
remain_words.append(word)
print(remain_words)
执行上述程序,最终输出的结果为( )。
import jieba
sentence = ‘人生苦短,我用Pyhton’
terms_list = jieba.cut(sentence, cut_all=True)
print(‘ ‘.join(terms_list))
执行上述程序,最终输出的结果为( )。
-
*简答题
-
*填空题
-
*判断题
-
*选择题
-
*简答题
-
*填空题
-
*判断题
-
*选择题
-
*简答题
NumPy数组不需要循环遍历,即可对每个元素执行批量的算术运算操作,这个过程叫做矢量化运算。
两个数组的某一维度等长,或其中一个数组为一维数组。
- *程序题
import numpy as np
arr = np.zeros(5)
print(arr)
import numpy as np
arr = np.zeros((8,8),dtype=int)
arr[1::2,::2] = 1
arr[::2,1::2] = 1
print(arr)
-
*填空题
-
*判断题
-
*选择题
-
*简答题
DataFrame是一个类似于二维数组的对象,它每列的数据可以是不同的数据类型。DataFrame的结构也是由索引和数据组成的,并且DataFrame的索引有行索引和列索引。
- *程序题
import numpy as np
import pandas as pd
df_data = np.array([[1, 5, 8, 8], [2, 2, 4, 9],
[7, 4, 2, 3], [3, 0, 5, 2]]) # 创建数组
col_data = np.array([‘A’, ‘B’, ‘C’, ‘D’]) # 创建数组
基于数组创建DataFrame对象
df_obj = pd.DataFrame(columns=col_data, data=df_data)
df_obj
sort_values_data = df_obj.sort_values(by=[‘B’], ascending=False)
sort_values_data
sort_values_data.to_csv(r’E:\数据分析\write_data.csv’)
‘写入完毕’
-
*填空题
-
*判断题
-
*选择题
-
*简答题
-
*程序题
import pandas as pd
import numpy as np
group_a = pd.DataFrame({‘A’: [2,3,5,2,3],
‘B’: [‘5′,np.nan,’2′,’3′,’6’],
‘C’: [8,7,50,8,2],
‘key’: [3,4,5,2,5]})
group_b = pd.DataFrame({‘A’: [3,3,3],
‘B’: [4,4,4],
‘C’: [5,5,5]})
print(group_a)
print(group_b)
group_a =group_a.combine_first(group_b)
group_a
group_a.rename(columns={‘key’:’D’})
-
*填空题
-
*判断题
-
*选择题
-
*简答题
-
*程序题
import pandas as pd
studnets_data = pd.DataFrame({‘年级’:[‘大一’,’大二’,’大三’,
‘大四’,’大二’,’大三’,
‘大一’,’大三’,’大四’],
‘姓名’:[‘李宏卓’,’李思真’,’张振海’,
‘赵鸿飞’,’白蓉’,’马腾飞’,
‘张晓凡’,’金紫萱’,’金烨’],
‘年龄’:[18,19,20,21,
19,20,18,20,21],
‘身高’:[175,165,178,175,
160,180,167,170,185],
‘体重’:[65,60,70,76,55,
70,52,53,73]})
data = studnets_data.groupby(‘年级’)
Freshman = dict([x for x in data])[‘大一’]
print(Freshman )
data = data.apply(max)
del data[‘年级’]
print(data)
Junior = dict([x for x in data])[‘大三’]
print(Freshman[‘体重’].apply(‘mean’))
print(Junior[‘体重’].apply(‘mean’))
-
*填空题
-
*判断题
-
*选择题
-
*程序题
import pandas as pd
stock_data = pd.DataFrame({‘证券代码’:[‘000609′,’000993′,’002615’,
‘000795’,’002766′,’000971′,
‘000633’,’300173′,’300279′,’000831′],
‘证券简称’:[‘中迪投资’,’闽东电力’,’哈尔斯’,
‘英洛华’,’索菱股份’,’高升控股’,
‘合金投资’,’智慧松德’,’和晶科技’,’五矿稀土’],
‘最新价’:[4.80,4.80,5.02,3.93,6.78,
3.72,4.60,4.60,5.81,9.87],
‘涨幅跌%’:[10.09,10.09,10.09,10.08,
10.06,10.06,10.06,10.05,10.05,10.04]})
print(stock_data)
import matplotlib.pyplot as plt
%matplotlib inline
plt.rcParams[‘font.sans-serif’]=[‘SimHei’] # 正常显示中文标签
plt.rcParams[‘axes.unicode_minus’]=False # 正常显示负号
x_axis = stock_data[‘证券简称’]
y_axis = stock_data[‘最新价’]
plt.bar(x_axis ,y_axis )
先进行保存,如果在show()函数后面使用,会出现保存的图片是空白图片
plt.savefig(r”C:\Users\admin\Desktop\shares_bar .png”)
plt.show()
-
*填空题
-
*判断题
-
*选择题
-
*简答题
如果是将高频率数据聚合到低频率,则称为降采样;如果是将低频率数据转换到高频率数据,则称为升采样。
-
*程序分析题
-
*填空题
-
*判断题
-
*选择题
-
*简答题
常用的文本情感分析方法有两种分别是基于情感词典和基于机器学习。使用情感词典的方法主要是通过制定一系列的情感词典和规则,对文本进行段落拆解、句法分析、情感值计算,而机器学习方法是将问题进行归纳分类,根据分类对文本进行不同的标注。
文本相似度的检测一般分为如下步骤:1、通过特征提取的模型或手动实现,找出这两篇文章的关键词。2、从每篇文章中各取出若干个关键词,把这些关键词合并成一个集合,然后计算每篇文章中各个词对于这个集合中的关键词的词频。3、生成两篇文章中各自的词频向量。4、计算两个向量的余弦相似度,值越大则表示越相似。
Original: https://blog.csdn.net/m0_63394128/article/details/124698433
Author: 高校知识店铺合集汇总
Title: Python数据分析与应用_从数据获取到可视化题库及答案
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/692795/
转载文章受原作者版权保护。转载请注明原作者出处!