pandas的一些用法

2023年8月7日下午9:23 • Python • 阅读 67

pandas的一些常用方法和遇到的小问题

1. pandas读取json文件
2.pandas日期转换
3.pandas写入csv格式文件出现中文乱码问题解决方法
4. pd.DataFrame
5.pd.read_json()
pandas读取json文件

import pandas as pd
pathfile = 'xxx.json'
data = pd.read_json(pathfile)

data的类型为 <class 'pandas.core.frame.dataframe'></class>
Python机器学习（八十三）Pandas 读取 JSON 数据

2.pandas日期转换

3.pandas写入csv格式文件出现中文乱码问题解决方法

utf-8和 utf-8-sig是不一样的，常常在csv文件中会遇到。
python3 库pandas写入csv格式文件出现中文乱码问题解决方法
pd.DataFrame

代码：
import pandas as pd
a = [['a','b','c','d'], ['e','f','g','h']]
a_df = pd.DataFrame(a)
print(a_df)
print(type(a_df))

结果：
   0  1  2  3
0  a  b  c  d
1  e  f  g  h
<class 'pandas.core.frame.DataFrame'>

代码：
#对于简单列表而言，转为DataFrame后，需要转置，才是一行
b = ['a','b','c','d']
b_df = pd.DataFrame(b)
print(b_df)
print(type(b_df))

b_df_T = b_df.T
print(b_df_T)
print(type(b_df_T))

结果：
   0
0  a
1  b
2  c
3  d

   0  1  2  3
0  a  b  c  d

实际遇到的例子：
某些情况我们需要将 一行列表存入csv文件中，当 all_content = pd.DataFrame(all_content)后，数据被转成一列，这时 all_content.to_csv()会出错。所以加一个 flag标志的判断，当是一列是进行转置。

    if len(all_content) == 0:
        all_content = row
        flag = True
    else:
        all_content = np.row_stack((all_content, row))
        flag = False

all_content = pd.DataFrame(all_content)
if flag:
    all_content = all_content.T
all_content.to_csv(out_file, index=False,header=header,encoding='utf-8-sig')

5.pd.read_json()

近期处理一些数据（数据已经脱敏），格式如下：


[
 {
  "reposts_count": 0,
  "favorited": 0,
  "update_time": "Sun Jan 06 23:07:51 +0800 2000",
  "original_pic": "",
  "text": " 哈哈@123123123",
  "created_at": "Mon Oct 29 11:30:05 +0800 2000",
  "mid": 123123123123123123,
  "annotations": "",
  "source": "",
  "user": {
    "id": 123123123,
    "idstr": "123123123",
    "screen_name": "xxxxxx",
    "name": "xxxxxxxx",
    "location": "China",
    "gender": "m",
    "statuses_count": 133,
    "favourites_count": 0
  },
  "in_reply_to_screen_name": "",
  "in_reply_to_user_id": 0,
  "comments_count": 2
 },
 {
  "reposts_count": 0,
  "favorited": 0,
  "update_time": "Sun Jan 06 23:07:51 +0800 2010",
  "original_pic": "",
  "text": " 哈哈哈！你好！！",
  "created_at": "Mon Oct 29 11:30:05 +0800 2010",
  "mid": 456456456465456456,
  "annotations": "",
  "source": "",
  "user": {
    "id": 456456456,
    "idstr": "456456456",
    "screen_name": "yyyyyyyy",
    "name": "yyyyyyyy",
    "location": "China",
    "gender": "f",
    "statuses_count": 133,
    "favourites_count": 0
  },
  "in_reply_to_screen_name": "",
  "in_reply_to_user_id": 0,
  "comments_count": 2
 },
]

需要提取上面文件123456.json（或者123456.txt）中的相关内容（例如需要提取 “text”的内容, "user"中的“id”内容），提取方法如下：

import pandas as pd

datafile = pd.read_json("123456.json",encoding='utf-8')

print("type(datafile): ",type(datafile))
print("datafile:\n",datafile)

num_shape = datafile.shape[0]
print("\n该文件中有 ",num_shape, " 条数据!")

data_text = datafile['text']
print("\ntype(data_text): ",type(data_text))
print("data_text:\n",data_text)

data_user = datafile['user']
print("\ntype(data_user): ",type(data_user))
print("data_user:\n",data_user)

for i in range(num_shape):
    print("\n第",i,"条数据中：")
    text = data_text[i]
    print("type(text):",type(text))
    print("text:", text)
    uid = str(data_user[i]['id'])
    print("type(uid):", type(uid))
    print("uid:", uid)

结果：
type(datafile):  <class 'pandas.core.frame.DataFrame'>
datafile:
    reposts_count  favorited  ... in_reply_to_user_id comments_count
0              0          0  ...                   0              2
1              0          0  ...                   0              2
[2 rows x 13 columns]

该文件中有  2  条数据!

type(data_text):  <class 'pandas.core.series.Series'>
data_text:
0    嘻嘻@123123123
1    哈哈哈！你好！！
Name: text, dtype: object

type(data_user):  <class 'pandas.core.series.Series'>
data_user:
0    {'id': 123123123, 'idstr': '123123123', 'scree...}
1    {'id': 456456456, 'idstr': '456456456', 'scree...}
Name: user, dtype: object

第 0 条数据中：
type(text): <class 'str'>
text: 嘻嘻@123123123
type(uid): <class 'str'>
uid: 123123123

第 1 条数据中：
type(text): <class 'str'>
text: 哈哈哈！你好！！
type(uid): <class 'str'>
uid: 456456456

Original: https://blog.csdn.net/weixin_45644062/article/details/123049979
Author: 佐罗的哈士奇
Title: pandas的一些用法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/740925/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

numpy函数学习

numpy函数学习 numpy函数学习 numpy函数学习 * stack 广播 np.tile stack 叠，本质目的是合并多个数组并增维。new = np.stack([ar…

Python 2023年8月24日
0048
Three—面向对象与面向过程/属性和变量/关于self/一些魔法方法的使用/继承/super方法/多态

python的面向对象面向对象与面向过程面向过程面向过程思想：需要实现一个功能的时候，看重的是开发的步骤和过程，每一个步骤都需要自己亲力亲为，需要自己编写代码（自己来做）面…

Python 2023年11月1日
0039
【量化投资】离散傅里叶变换求数组周期

好久没有更新量化分析相关的内容，本节将介绍如何通过傅里叶变换求解一组数据当中可能存在的周期性，后续将应用本节的结果实际在量化程序中进行应用。本文计算方法不一定正确，欢迎大家多多指…

Python 2023年8月28日
0054
【Python 实战基础】Pandas如何从字符串中解析某一数据，并统计多于一次的该数据

一、实战场景二、主要知识点文件读写基础语法 Pandas list 三、菜鸟实战 1、创建 python 文件 2、运行结果实战场景：Pandas如何从字符串中解析某一数据…

Python 2023年8月9日
0051
python各个绘图的作用_Matplotlib主要的作用是什么？_后端开发

C语言如何定义变量_后端开发 C语言定义变量的语法格式为：【数据类型变量名;】。数据类型表示我们想要存储什么类型的数据就定义什么类型的变量，变量名表示给变量取什么名字，例如【in…

Python 2023年9月5日
0043
《深度学习的数学》chap1 神经网络的思想

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年9月15日
0047
Python接口自动化测试工具(Pytest+Allure+jsonpath+xlrd+excel、支持Restful接口规范)

1.实现：get/post请求(上传文件)::理论上其他delete/put等请求也实现了，支持restful接口规范2.发送邮件3.生成allure测试报告4.压缩测试报告文件5…

Python 2023年9月13日
0055
Django 通过拼接路由，获取请求接口中的form-data形式参数

Django 通过拼接路由，获取请求接口中的form-data形式参数代码部分 * 主项目路由写法： – 主目录下urls.py 主目录同级目录下 urls与view…

Python 2023年8月3日
0047
Python Pandas绘图教程（详解版）

Python Pandas绘图教程（详解版） Pandas 在数据分析、数据可视化方面有着较为广泛的应用，Pandas 对 Matplotlib 绘图软件包的基础上单独封装了一个p…

Python 2023年8月6日
0043
troubleshoot：PVC动态扩容报错

动态扩容PVC的时候报错(kubectl edit pvc pvcname)：”error: persistentvolumeclaims “pvvolum…

Python 2023年10月12日
0039
Win10 + python3.6 安装pyspider

下载地址：https://phantomjs.org/download.html下载的文件解压缩之后，bin文件夹下，找到phantomjs.exe，将其复制到python的scr…

Python 2023年8月10日
0037
Python数据预处理，数据清洗的全过程复习

数据导入数据查看数据清洗数据提取&筛选数据排序数据汇总&统计数据标准化导入相关包数据存储数据清洗的详细全过程（带案例思路写） 1、导入相关包 Imp…

Python 2023年8月6日
0055
【游戏开发实战】下载原神模型，PMX转FBX，导入到Unity中，卡通渲染，绑定人形动画（附Demo工程）

文章目录 * – + 一、前言 + 二、原神模型下载 + * 1、第一期模型 * 2、第二期模型 * 3、第三期模型 * 4、第四期模型 * 5、第五期模型 * 6、第…

Python 2023年10月10日
00137
浅谈一下pyd文件的逆向

1.何为pyd文件 .pyd 文件是由非 Python，其它编程语言编写 (或直接把 .py 文件转换成 .c 中间文件) 编译生成的 Python 扩展模块，是类似 .so…

Python 2023年8月23日
0058
使用Python实现K-means

写在前面：本代码用于课程作业，仅写到二维，欢迎大家进行拓展。 #定义函数&#xFF1…

Python 2023年8月16日
0033
Python代码阅读（第44篇）：寻找符合条件的元素的位置

本文中的代码实现了列表中符合条件的元素的位置。 [En] The code read in this article implements the location of elig…

Python 2023年5月24日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pandas的一些用法

pandas的一些常用方法和遇到的小问题

大家都在看