[Python]-pandas模块-机器学习Python入门《Python机器学习手册》-02-加载数据:加载文件

这本书类似于工具书或者字典,对于python具体代码的调用和使用场景写的很清楚,感觉虽然是工具书,但是对照着做一遍应该可以对机器学习中python常用的这些库有更深入的理解,在应用中也能更为熟练。

包括:

3-6部分主要是不同文件的读入,采用pandas模块,本文也会结合其他笔记进行补充。

02-3 加载CSV文件

02-4 加载Excel文件

import pandas as pd

sheetname 指加载哪张数据表,可以是表名字符串,也可以是表号(0开始)
如果需要读取多个表,sheetname可以作为列表,返回值为dataframe的字典
dataframe = pd.read_excel(url, sheetname = 0, header = 1)

02-5 加载json文件

import pandas as pd
dataframe = pd.read_json(url, orient = 'columns')

02-6 查询SQL数据库

import pandas as pd
from sqlalchemy import create_engine

创建一个数据库的连接
database_connection = create_engine('sqline:///sample.db')
加载数据
dataframe = pd.read_sql_query('SELECT * FROM data', database_connection)

Original: https://www.cnblogs.com/camilia/p/16690974.html
Author: CAMILIA
Title: [Python]-pandas模块-机器学习Python入门《Python机器学习手册》-02-加载数据:加载文件

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/683339/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球