1. loc 和iloc 提取行、列
loc:通过具体索引来提取行;
iloc:通过行号来提取行。
iloc
不管是有索引还是无索引都可以用 iloc
来提取,比如:
data.iloc[:, [0, 1]] # [行,列]
指,提取 data文件的所有行的第 0列和第 1列。
2. value_counts() 统计值的重复次数
(1).value_counts()
统计有多少值,以及每个值的重复次数。
(2).reset_index()
重置索引。
(3).sort_index()
按照key进行排序
3. pd.read_csv() 读取文件 | pd.to_csv() 存储文件
读取文件。
例如:
path = '../xx.csv'
f1_df = pd.read_csv(path, sep=',', names=['a1', 'a2'], header=0)
listt = [1,2,3,4,5]
f2_df = pd.DataFrame(columns= ['b1', 'b2', 'b3'])
f2_df['b1'] = d1_df['a1']
f2_df['b2'] = d1_df['a2']
f2_df['b3'] = listt
f2_df.to_csv(path, sep='\t', columns=['b1', 'b2'], header=True)
4. csv.reader(df) 读取文件
import csv
path = '../xx.csv'
df = open(path, 'r')
next(df)
file = csv.reader(df)
for line in df:
b1 = line[0]
b2 = line[1]
b3 = line[2]
参考:
1.Pandas中loc和iloc函数用法详解:https://blog.csdn.net/qq_33217634/article/details/88423660
2. pandas中.value_counts()的用法:https://www.jianshu.com/p/f773b4b82c66
3. pandas 读取文件 加入列索引:https://blog.csdn.net/u010211479/article/details/79178910?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EsearchFromBaidu%7Edefault-1.pc_relevant_baidujshouduan&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EsearchFromBaidu%7Edefault-1.pc_relevant_baidujshouduan
4. python – pandas Series.value_counts返回相等计数字符串的不一致顺序:http://www.voidcn.com/article/p-epmympot-bve.html
Original: https://blog.csdn.net/qq_31225201/article/details/119515075
Author: 让我安静会
Title: [数据处理][Pandas] .csv文件 提取行列 | 统计次数 | 读取文件
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/752579/
转载文章受原作者版权保护。转载请注明原作者出处!