python观察日志(part28)–数据的加载与存储

python观察日志(part28)–数据的加载与存储

原创

GoatGui博主文章分类:python ©著作权

文章标签 python csv excel 数据分析 json 文章分类 Hadoop 大数据

©著作权归作者所有:来自51CTO博客作者GoatGui的原创作品,请联系作者获取转载授权,否则将追究法律责任

学习笔记,仅供参考,有错必究
参考文献:​​​;

数据的加载与存储

文本文件的加载与存储

import numpy as npimport matplotlib.pyplot as plt
from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = 'all' plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus']=False

读取csv文件

import pandas as pddata = pd.read_csv('./data/test.csv', encoding='gb18030')data.head()

城市

人均地区生产总值(元)

第三产业占GDP比重

人均地方财政收入

对外贸易系数

0

上海

78989

59.36

18135.913470

1.292077

1

南京市

67455

51.31

6899.471236

0.558394

2

无锡市

107365

41.30

8931.908085

0.615872

3

徐州市

25100

37.29

1716.189263

0.065778

4

常州市

70138

39.62

5999.911067

0.418762

data = pd.read_csv('./data/test.csv', encoding='gb18030', skiprows=[1])data.head()

城市

人均地区生产总值(元)

第三产业占GDP比重

人均地方财政收入

对外贸易系数

0

南京市

67455

51.31

6899.471236

0.558394

1

无锡市

107365

41.30

8931.908085

0.615872

2

徐州市

25100

37.29

1716.189263

0.065778

3

常州市

70138

39.62

5999.911067

0.418762

4

苏州市

122565

39.41

11766.805100

1.821834

data = pd.read_csv('./data/test.csv', encoding='gb18030', sep = ',')data.head()

城市

人均地区生产总值(元)

第三产业占GDP比重

人均地方财政收入

对外贸易系数

0

上海

78989

59.36

18135.913470

1.292077

1

南京市

67455

51.31

6899.471236

0.558394

2

无锡市

107365

41.30

8931.908085

0.615872

3

徐州市

25100

37.29

1716.189263

0.065778

4

常州市

70138

39.62

5999.911067

0.418762

data = pd.read_csv('./data/test.csv', encoding='gb18030', names = ['city', 'a', 'b', 'c', 'd'])data.head()

city

a

b

c

d

0

城市

人均地区生产总值(元)

第三产业占GDP比重

人均地方财政收入

对外贸易系数

1

上海

78989

59.36

18135.91347

1.292076869

2

南京市

67455

51.31

6899.471236

0.558393574

3

无锡市

107365

41.3

8931.908085

0.615871884

4

徐州市

25100

37.29

1716.189263

0.065778095

存储csv文件

df = pd.DataFrame(np.array(range(12)).reshape((6, 2)), columns = ['A', 'B'])df.to_csv('./output/test_output.csv')df.to_csv('./output/test_output2.csv', '|')

除了读取csv文件以外,还可以通过read_json(),read_html等方式读取json,html等文件;to_json(),to_html()等方式写出json,html等文件.

Excel表格

读取Excel文件

data1 = pd.read_excel("./data/test_excel.xlsx", 'Sheet1')excel = pd.ExcelFile("./data/test_excel.xlsx")data2 = pd.read_excel(excel, "Sheet2")print("data1: \n", data1)print("data2: \n", data2)
data1:     ID    Name  Age0   1     Ada   191   2     Tim   202   3   Huang   213   4   Black   224   5     Jam   235   6    Pick   246   7   Julia   257   8  Kattle   26data2:     ID   Wage0   1  150001   2  120002   3  130003   4  100004   5   30005   6   50006   7   80007   8   9000

写出Excel文件

data1 = data1[:5]data1data2 = data2[:6]data2excel = pd.DataFrame()excel.to_excel("./output/test_output3.xlsx")writer = pd.ExcelWriter("./output/test_output3.xlsx")data1.to_excel(writer, "Sheet1")data2.to_excel(writer, "Sheet2")writer.save()

ID

Name

Age

0

1

Ada

19

1

2

Tim

20

2

3

Huang

21

3

4

Black

22

4

5

Jam

23

ID

Wage

0

1

15000

1

2

12000

2

3

13000

3

4

10000

4

5

3000

5

6

5000

  • 收藏
  • 评论
  • *举报

上一篇:python观察日志(part27)–数组及矩阵运算

下一篇:python观察日志(part26)–numpy数组操作

Original: https://blog.51cto.com/u_15181342/5354760
Author: GoatGui
Title: python观察日志(part28)–数据的加载与存储

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/517634/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球