python观察日志(part28)–数据的加载与存储
原创
文章标签 python csv excel 数据分析 json 文章分类 Hadoop 大数据
©著作权归作者所有:来自51CTO博客作者GoatGui的原创作品,请联系作者获取转载授权,否则将追究法律责任
学习笔记,仅供参考,有错必究
参考文献:;
数据的加载与存储
文本文件的加载与存储
import numpy as npimport matplotlib.pyplot as plt
from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = 'all' plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus']=False
读取csv文件
import pandas as pddata = pd.read_csv('./data/test.csv', encoding='gb18030')data.head()
城市
人均地区生产总值(元)
第三产业占GDP比重
人均地方财政收入
对外贸易系数
0
上海
78989
59.36
18135.913470
1.292077
1
南京市
67455
51.31
6899.471236
0.558394
2
无锡市
107365
41.30
8931.908085
0.615872
3
徐州市
25100
37.29
1716.189263
0.065778
4
常州市
70138
39.62
5999.911067
0.418762
data = pd.read_csv('./data/test.csv', encoding='gb18030', skiprows=[1])data.head()
城市
人均地区生产总值(元)
第三产业占GDP比重
人均地方财政收入
对外贸易系数
0
南京市
67455
51.31
6899.471236
0.558394
1
无锡市
107365
41.30
8931.908085
0.615872
2
徐州市
25100
37.29
1716.189263
0.065778
3
常州市
70138
39.62
5999.911067
0.418762
4
苏州市
122565
39.41
11766.805100
1.821834
data = pd.read_csv('./data/test.csv', encoding='gb18030', sep = ',')data.head()
城市
人均地区生产总值(元)
第三产业占GDP比重
人均地方财政收入
对外贸易系数
0
上海
78989
59.36
18135.913470
1.292077
1
南京市
67455
51.31
6899.471236
0.558394
2
无锡市
107365
41.30
8931.908085
0.615872
3
徐州市
25100
37.29
1716.189263
0.065778
4
常州市
70138
39.62
5999.911067
0.418762
data = pd.read_csv('./data/test.csv', encoding='gb18030', names = ['city', 'a', 'b', 'c', 'd'])data.head()
city
a
b
c
d
0
城市
人均地区生产总值(元)
第三产业占GDP比重
人均地方财政收入
对外贸易系数
1
上海
78989
59.36
18135.91347
1.292076869
2
南京市
67455
51.31
6899.471236
0.558393574
3
无锡市
107365
41.3
8931.908085
0.615871884
4
徐州市
25100
37.29
1716.189263
0.065778095
存储csv文件
df = pd.DataFrame(np.array(range(12)).reshape((6, 2)), columns = ['A', 'B'])df.to_csv('./output/test_output.csv')df.to_csv('./output/test_output2.csv', '|')
除了读取csv文件以外,还可以通过read_json(),read_html等方式读取json,html等文件;to_json(),to_html()等方式写出json,html等文件.
Excel表格
读取Excel文件
data1 = pd.read_excel("./data/test_excel.xlsx", 'Sheet1')excel = pd.ExcelFile("./data/test_excel.xlsx")data2 = pd.read_excel(excel, "Sheet2")print("data1: \n", data1)print("data2: \n", data2)
data1: ID Name Age0 1 Ada 191 2 Tim 202 3 Huang 213 4 Black 224 5 Jam 235 6 Pick 246 7 Julia 257 8 Kattle 26data2: ID Wage0 1 150001 2 120002 3 130003 4 100004 5 30005 6 50006 7 80007 8 9000
写出Excel文件
data1 = data1[:5]data1data2 = data2[:6]data2excel = pd.DataFrame()excel.to_excel("./output/test_output3.xlsx")writer = pd.ExcelWriter("./output/test_output3.xlsx")data1.to_excel(writer, "Sheet1")data2.to_excel(writer, "Sheet2")writer.save()
ID
Name
Age
0
1
Ada
19
1
2
Tim
20
2
3
Huang
21
3
4
Black
22
4
5
Jam
23
ID
Wage
0
1
15000
1
2
12000
2
3
13000
3
4
10000
4
5
3000
5
6
5000
- 赞
- 收藏
- 评论
- *举报
上一篇:python观察日志(part27)–数组及矩阵运算
下一篇:python观察日志(part26)–numpy数组操作
Original: https://blog.51cto.com/u_15181342/5354760
Author: GoatGui
Title: python观察日志(part28)–数据的加载与存储
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/517634/
转载文章受原作者版权保护。转载请注明原作者出处!