深度学习之 python pandas

2023年7月8日上午8:14 • 人工智能 • 阅读 59

在数据科学领域，pandas是非常有用的工具，在数据科学细分领域大数据（通常和深度学习有关）这部分，本篇博客从pandas重要函数开始，到数据变换以及数据分析。pandas提供了数据变换、数据清理、数据可视化以及数据提取等主要数据处理功能。本篇使用的博客python版本是：


import platform
print(platform.python_version())
输入：
3.8.7

pandas基础

python中使用pandas需要import该模块，使用 import pandas as pd，dataframe是pandas中最常用的一种数据格式，股票数据、超市百货商店交易数据等很多都可以用dataframe表示。dataframe的创建如下：


import pandas as pd

Speeds={'Animal': ['Falcon', 'Falcon',
                              'Parrot', 'Parrot'],
                   'MaxSpeed': [380., 370.,  24., 23.0]}

df = pd.DataFrame(Speeds)
print(df)
其输出是一张表，如下：
   Animal  MaxSpeed
0  Falcon     380.0
1  Falcon     370.0
2  Parrot      24.0
3  Parrot      23.0

上述代码中Speeds是一个字典，Animal 和MaxSpeed是key值，其后list是对应的value值，0,1,2,3是索引值，用于dataframe的索引，可以用于检索、查询、修改、删除等操作。
如果想获取一列值，则只需要dataframe名其后加中括号，中括号中写入列名就行，如下所示：


import pandas as pd

df = pd.DataFrame({'Animal': ['Falcon', 'Falcon',
                              'Parrot', 'Parrot'],
                   'MaxSpeed': [380., 370.,  24., 23.0]})

print(df['MaxSpeed'])
输出为：
0    380.0
1    370.0
2     24.0
3     23.0

pandas还可以增加列，筛选等操作：


df['Size'] = [16., 60., 25., 40.]
print(df)
输出为：
   Animal  MaxSpeed  Size
0  Falcon     380.0  16.0
1  Falcon     370.0  60.0
2  Parrot      24.0  25.0
3  Parrot      23.0  40.0

print(df[df['Size'] >= 40.0])
输出为：
   Animal  MaxSpeed  Size
1  Falcon     370.0  60.0
3  Parrot      23.0  40.0

除了自己构建dataframe之外，还可以读入已有的一些文件格式，比如csv、xsl等，iris.csv是常用于深度学习的kaggle开源数据集iris数据集地址，使用pd.read_csv方法即可。pandas dataframe的基本用法如下：


import pandas as pd

iris = pd.read_csv('iris.csv')

print(iris.shape)
输出：
(150, 5)

print(iris.head(5))
print(iris.tail(5))
输出：
   sepallength  sepalwidth  petallength  petalwidth        class
0          5.1         3.5          1.4         0.2  Iris-setosa
1          4.9         3.0          1.4         0.2  Iris-setosa
2          4.7         3.2          1.3         0.2  Iris-setosa
3          4.6         3.1          1.5         0.2  Iris-setosa
4          5.0         3.6          1.4         0.2  Iris-setosa
     sepallength  sepalwidth  petallength  petalwidth           class
145          6.7         3.0          5.2         2.3  Iris-virginica
146          6.3         2.5          5.0         1.9  Iris-virginica
147          6.5         3.0          5.2         2.0  Iris-virginica
148          6.2         3.4          5.4         2.3  Iris-virginica
149          5.9         3.0          5.1         1.8  Iris-virginica

print(iris.dtypes)
输出：
sepallength    float64
sepalwidth     float64
petallength    float64
petalwidth     float64
class           object
dtype: object

print(iris.loc[3:5])
输出：
   sepallength  sepalwidth  petallength  petalwidth        class
3          4.6         3.1          1.5         0.2  Iris-setosa
4          5.0         3.6          1.4         0.2  Iris-setosa
5          5.4         3.9          1.7         0.4  Iris-setosa

print(iris.loc[3, 'sepallength'])
print(iris.iloc[3,0])
输出：
4.6
4.6

iris.to_csv('iris-out.csv', index=False)

此外pandas还有对异常数据的一些处理方法，这放到后续小节。

pandas数据计算

数据类型转换

这里以nasa的行星数据为例，


import pandas as pd

planets = pd.read_csv('planets.csv')

print(planets.head(3))
输出
            method  number  orbital_period  mass  distance  year
0  Radial Velocity       1         269.300  7.10     77.40  2006
1  Radial Velocity       1         874.774  2.21     56.95  2008
2  Radial Velocity       1         763.000  2.60     19.84  2011

print(planets.dtypes)
输出
method             object
number              int64
orbital_period    float64
mass              float64
distance          float64
year                int64
dtype: object

print(planets.mean())
输出
number               1.785507
orbital_period    2002.917596
mass                 2.638161
distance           264.069282
year              2009.070531
dtype: float64

print(planets['number'][0]/planets['mass'][0])
输出
0.14084507042253522

print(planets['number'][0].astype(float))
输出
1.0

print(planets['mass'][0].astype(int))
输出
7
planets['year'][0].astype(str)
输出
'2006'

planets['year_dt'] = pd.to_datetime(planets['year'], format='%Y')
print(planets['year_dt'])
输出
0      2006-01-01
1      2008-01-01
2      2011-01-01
3      2007-01-01
4      2009-01-01
          ...

1030   2006-01-01
1031   2007-01-01
1032   2007-01-01
1033   2008-01-01
1034   2008-01-01
Name: year_dt, Length: 1035, dtype: datetime64[ns]

字符串类型

在pandas中， .str是字符串的存取器，其提供了大量的字符串操作方法。


import pandas as pd

names = pd.Series([' github; Shichaog','csdn; Shichaog'])

names = names.str.replace(';','/')
print(names)

print(names.str.len())

names = names.str.strip()
print(names)
print(names.str.len())

names = names.str.upper()
print(names)

names = names.str.split('; ')
print(names)

names = pd.Series([i[::-1] for i in names])
print(names)

names = [' '.join(i) for i in names]
print(names)

日期数据处理


import pandas as pd

daterange = pd.period_range('1/1/2020', freq='30d', periods=4)
date_df = pd.DataFrame(data=daterange,columns=['sample date'])
print(date_df)
输出：
  sample date
0  2020-01-01
1  2020-01-31
2  2020-03-01
3  2020-03-31

date_df['date difference'] = date_df['sample date'].diff(periods=1)
print(date_df)
输出：
  sample date date difference
0  2020-01-01             NaT
1  2020-01-31     <30 * Days>
2  2020-03-01     <30 * Days>
3  2020-03-31     <30 * Days>

date_df['first of month'] = date_df['sample date'].values.astype('datetime64[M]')
print(date_df)
输出：
  sample date date difference first of month
0  2020-01-01             NaT     2020-01-01
1  2020-01-31     <30 * Days>     2020-01-01
2  2020-03-01     <30 * Days>     2020-03-01
3  2020-03-31     <30 * Days>     2020-03-01

print(date_df.dtypes)
输出：
sample date           period[30D]
date difference            object
first of month     datetime64[ns]
dtype: object

date_df['sample date'] = date_df['sample date'].dt.to_timestamp()
print(date_df.dtypes)
输出：
sample date        datetime64[ns]
date difference            object
first of month     datetime64[ns]
dtype: object

date_df['sample date'] - date_df['first of month']
date_df['sample date'] - date_df['date difference']
date_df['sample date'] - pd.Timedelta('30 d')

date_df['sample date'].dt.day_name()

错误数据处理

未经过清理的数据会有错误、缺失等，据统计，通常在数据清理在整个项目中通常需要花费80%-90%时间，pandas和python提供了一些数据清理方法，可以大大节省数据清理所需的时间

数值错误

对于数值类的数据，如成交量之类，有数值丢失、数值错误以及数据重复三种类型错误可能发生。
pandas.isnull可用于判别数据缺失的情况，如下的array使用nan初始化时是一个缺失的值，这时可以使用该方法判断。


>>>array = np.array([[1, np.nan, 3], [4, 5, np.nan]])
>>>array
array([[ 1., nan,  3.],
       [ 4.,  5., nan]])
>>>pd.isna(array)
array([[False,  True, False],
       [False, False,  True]])

>>>index = pd.DatetimeIndex(["2017-07-05", "2017-07-06", None,
                          "2017-07-08"])
>>>index
DatetimeIndex(['2017-07-05', '2017-07-06', 'NaT', '2017-07-08'],
              dtype='datetime64[ns]', freq=None)
>>>pd.isna(index)
array([False, False,  True, False])

>>>df = pd.DataFrame([['ant', 'bee', 'cat'], ['dog', None, 'fly']])
>>>df
     0     1    2
0  ant   bee  cat
1  dog  None  fly
>>>pd.isna(df)
       0      1      2
0  False  False  False
1  False   True  False

此外也可以使用dropna()等方法去掉非数值的行/列，或者fillna()方法设置为某个值。

异常值

这种类型的值是超出了正常范围，比如cpu的使用率、汽车速度、人类的身高、体重等数据都是有一个合理范围的，这比较符合统计学里的正太分布。


import pandas as pd

df = pd.DataFrame({'Animal': ['Falcon', 'Falcon','Falcon', 'Falcon', 'Falcon',
                              'Parrot', 'Parrot', 'Parrot', 'Parrot', 'Parrot'],
                   'MaxSpeed': [380., 370., 330., 1000, 320, 24., 26., 23.0, 1.0, 25.0]})

print(df.groupby('Animal').describe())
输出：
       MaxSpeed
          count   mean         std    min    25%    50%    75%     max
Animal
Falcon      5.0  480.0  291.804729  320.0  330.0  370.0  380.0  1000.0
Parrot      5.0   19.8   10.568822    1.0   23.0   24.0   25.0    26.0

print(df['Animal'].value_counts())
输出
Falcon    5
Parrot    5

pd.pivot(df, columns='Animal').plot(subplots=True)

print(df.query('Animal=="Falcon" & ( MaxSpeed > 400.)'))

apply & map

pandas dataframe值修改时可以通过apply以及map等函数提供的方法，这类的方法的好处是不再需要使用其它语言类似for/loop之类的语句。


import pandas as pd

apple_df = pd.read_csv('../AAPL Historical Data.csv')
该df的输出如下，其是一个股票的daily交易信息，包括日期、收盘价、开盘价以及成交量和换手率等。
            Date   Price    Open    High     Low    Vol. Change %
0   Jul 19, 2022  151.00  147.98  151.20  146.92  82.15M    2.67%
1   Jul 18, 2022  147.07  150.84  151.54  146.74  77.54M   -2.06%
2   Jul 15, 2022  150.17  149.78  150.86  148.20  76.26M    1.15%
3   Jul 14, 2022  148.47  144.08  148.95  143.25  78.14M    2.05%
4   Jul 13, 2022  145.49  142.99  146.45  142.12  71.19M   -0.25%
5   Jul 12, 2022  145.86  145.76  148.45  145.05  77.59M    0.68%
6   Jul 11, 2022  144.87  145.67  146.64  143.78  63.31M   -1.48%
7   Jul 08, 2022  147.04  145.26  147.55  145.00  64.30M    0.47%
8   Jul 07, 2022  146.35  143.29  146.55  143.28  65.73M    2.40%
9   Jul 06, 2022  142.92  141.35  144.12  141.08  73.55M    0.96%
10  Jul 05, 2022  141.56  137.77  141.61  136.93  70.95M    1.89%
11  Jul 01, 2022  138.93  136.04  139.04  135.66  71.05M    1.62%
12  Jun 30, 2022  136.72  137.25  138.37  133.77  98.63M   -1.80%
13  Jun 29, 2022  139.23  137.46  140.67  136.67  65.98M    1.30%
14  Jun 28, 2022  137.44  142.13  143.42  137.32  66.75M   -2.98%
15  Jun 27, 2022  141.66  142.70  143.49  140.96  70.21M    0.00%
16  Jun 24, 2022  141.66  139.90  141.91  139.77  88.44M    2.45%
17  Jun 23, 2022  138.27  136.82  138.59  135.63  72.11M    2.16%
18  Jun 22, 2022  135.35  134.79  137.76  133.91  73.12M   -0.38%
19  Jun 21, 2022  135.87  133.42  137.06  133.32  80.68M    3.28%

apple_df=apple_df.drop(columns=['Open', 'High', 'Low', 'Vol.', 'Change %'])

apple_df = apple_df.iloc[::-1]
apple_df['SMA3'] = apple_df['Price'].rolling(3).mean()

            Date   Price        SMA3
19  Jun 21, 2022  135.87         NaN
18  Jun 22, 2022  135.35         NaN
17  Jun 23, 2022  138.27  136.496667
16  Jun 24, 2022  141.66  138.426667
15  Jun 27, 2022  141.66  140.530000
14  Jun 28, 2022  137.44  140.253333
13  Jun 29, 2022  139.23  139.443333
12  Jun 30, 2022  136.72  137.796667
11  Jul 01, 2022  138.93  138.293333
10  Jul 05, 2022  141.56  139.070000
9   Jul 06, 2022  142.92  141.136667
8   Jul 07, 2022  146.35  143.610000
7   Jul 08, 2022  147.04  145.436667
6   Jul 11, 2022  144.87  146.086667
5   Jul 12, 2022  145.86  145.923333
4   Jul 13, 2022  145.49  145.406667
3   Jul 14, 2022  148.47  146.606667
2   Jul 15, 2022  150.17  148.043333
1   Jul 18, 2022  147.07  148.570000
0   Jul 19, 2022  151.00  149.413333

apple_df = apple_df.dropna()

apple_df['Cross_direction'] = apple_df.apply(lambda x: 'upper' if x['Price']>x['SMA3'] else 'lower',axis=1)
            Date   Price        SMA3 Cross_direction
17  Jun 23, 2022  138.27  136.496667           upper
16  Jun 24, 2022  141.66  138.426667           upper
15  Jun 27, 2022  141.66  140.530000           upper
14  Jun 28, 2022  137.44  140.253333           lower
13  Jun 29, 2022  139.23  139.443333           lower
12  Jun 30, 2022  136.72  137.796667           lower
11  Jul 01, 2022  138.93  138.293333           upper
10  Jul 05, 2022  141.56  139.070000           upper
9   Jul 06, 2022  142.92  141.136667           upper
8   Jul 07, 2022  146.35  143.610000           upper
7   Jul 08, 2022  147.04  145.436667           upper
6   Jul 11, 2022  144.87  146.086667           lower
5   Jul 12, 2022  145.86  145.923333           lower
4   Jul 13, 2022  145.49  145.406667           upper
3   Jul 14, 2022  148.47  146.606667           upper
2   Jul 15, 2022  150.17  148.043333           upper
1   Jul 18, 2022  147.07  148.570000           lower
0   Jul 19, 2022  151.00  149.413333           upper

cross_map = {"upper":"Red","lower":"Blue"}
apple_df['Cross Color'] = apple_df['Cross_direction'].map(cross_map)
            Date   Price        SMA3 Cross_direction Cross Color
17  Jun 23, 2022  138.27  136.496667           upper         Red
16  Jun 24, 2022  141.66  138.426667           upper         Red
15  Jun 27, 2022  141.66  140.530000           upper         Red
14  Jun 28, 2022  137.44  140.253333           lower        Blue
13  Jun 29, 2022  139.23  139.443333           lower        Blue
12  Jun 30, 2022  136.72  137.796667           lower        Blue
11  Jul 01, 2022  138.93  138.293333           upper         Red
10  Jul 05, 2022  141.56  139.070000           upper         Red
9   Jul 06, 2022  142.92  141.136667           upper         Red
8   Jul 07, 2022  146.35  143.610000           upper         Red
7   Jul 08, 2022  147.04  145.436667           upper         Red
6   Jul 11, 2022  144.87  146.086667           lower        Blue
5   Jul 12, 2022  145.86  145.923333           lower        Blue
4   Jul 13, 2022  145.49  145.406667           upper         Red
3   Jul 14, 2022  148.47  146.606667           upper         Red
2   Jul 15, 2022  150.17  148.043333           upper         Red
1   Jul 18, 2022  147.07  148.570000           lower        Blue
0   Jul 19, 2022  151.00  149.413333           upper         Red

applymap_df=apple_df.applymap(lambda x: len(str(x)))

    Date  Price  SMA3  Cross_direction  Cross Color
17    12      6    18                5            3
16    12      6    18                5            3
15    12      6     6                5            3
14    12      6    18                5            4
13    12      6    18                5            4
12    12      6    18                5            4
11    12      6    18                5            3
10    12      6     6                5            3
9     12      6    18                5            3
8     12      6    18                5            3
7     12      6    18                5            3
6     12      6    18                5            4
5     12      6    18                5            4
4     12      6    18                5            3
3     12      6    18                5            3
2     12      6    18                5            3
1     12      6    18                5            4
0     12      5    18                5            3

print(apple_df)

Dataframe 变换

分组和聚合

可通过groupby和agg方法实现。


import pandas as pd

iris = pd.read_csv('iris.csv')
print(iris.head(5))

   sepallength  sepalwidth  petallength  petalwidth        class
0          5.1         3.5          1.4         0.2  Iris-setosa
1          4.9         3.0          1.4         0.2  Iris-setosa
2          4.7         3.2          1.3         0.2  Iris-setosa
3          4.6         3.1          1.5         0.2  Iris-setosa
4          5.0         3.6          1.4         0.2  Iris-setosa

print(iris.groupby(['class']).max())

                 sepallength  sepalwidth  petallength  petalwidth
class
Iris-setosa              5.8         4.4          1.9         0.6
Iris-versicolor          7.0         3.4          5.1         1.8
Iris-virginica           7.9         3.8          6.9         2.5

df = iris.groupby(['class']).agg({'petallength':['mean','min','max'],'petalwidth':'count'})
print(df)

                petallength           petalwidth
                       mean  min  max      count
class
Iris-setosa           1.464  1.0  1.9         50
Iris-versicolor       4.260  3.0  5.1         50
Iris-virginica        5.552  4.5  6.9         50

df.columns = ['_'.join(col).strip() for col in df.columns.values]
df.reset_index()
print(df)

                 petallength_mean  ...  petalwidth_count
class                              ...

Iris-setosa                 1.464  ...                50
Iris-versicolor             4.260  ...                50
Iris-virginica              5.552  ...                50

groupings = iris.groupby(['class'])
groupings.get_group('Iris-setosa').head()
print(groupings.max())

                 sepallength  sepalwidth  petallength  petalwidth
class
Iris-setosa              5.8         4.4          1.9         0.6
Iris-versicolor          7.0         3.4          5.1         1.8
Iris-virginica           7.9         3.8          6.9         2.5

groupings.apply(lambda x: x.max())

                 sepallength  sepalwidth  ...  petalwidth            class
class                                     ...

Iris-setosa              5.8         4.4  ...         0.6      Iris-setosa
Iris-versicolor          7.0         3.4  ...         1.8  Iris-versicolor
Iris-virginica           7.9         3.8  ...         2.5   Iris-virginica

groupings.filter(lambda x: x['petalwidth'].max() <5)

     sepallength  sepalwidth  petallength  petalwidth           class
0            5.1         3.5          1.4         0.2     Iris-setosa
1            4.9         3.0          1.4         0.2     Iris-setosa
2            4.7         3.2          1.3         0.2     Iris-setosa
3            4.6         3.1          1.5         0.2     Iris-setosa
4            5.0         3.6          1.4         0.2     Iris-setosa
..           ...         ...          ...         ...             ...

reshape

有时需要对原始的pandas dataframe 变换之后再使用，pandas中用于实现该功能的四个比较常用的方法是stack()、unstack()、pivot()以及melt()四个。

pivot

pivot用于生成一个新的dataframe，通过给定的索引(index)、列(column)以及给定的值（Values）重新生一个DataFrame对象。此函数不支持数据聚合，多个值将导致列中的多索引。
pivot(index=None,columns=None,values=None) -> DataFrame
index：指定一列做为生成DataFrame对象的索引，如果为空则默认为原来的索引。
columns：指定一列的值作为列名，必须传值。
values：指定一列作为生成DataFrame对象的值。可以为空。


import pandas as pd

data = {'水果':['苹果','梨','草莓','苹果','梨','草莓'],
       '商店':["C1","C1","C1", "C2","C2","C2"],
       '价格':[10,9,8,8,6,8]}
df = pd.DataFrame(data)
print(df)
输出：
   水果  商店  价格
0  苹果  C1  10
1   梨  C1   9
2  草莓  C1   8
3  苹果  C2   8
4   梨  C2   6
5  草莓  C2   8

df_pivot = df.pivot(index='水果',columns='商店',values='价格')
print(df_pivot)
输出：
商店  C1  C2
水果
梨    9   6
苹果  10   8
草莓   8   8

stack和unstack

stack 提供和pivot相反的功能，将列转为行。

df2 = df.set_index(['水果','商店'])
print(df2)

stacked_df = pd.DataFrame(df2.stack())
print(stacked_df)

unstack_df = stacked_df.unstack('商店')

则上述df2和stacked_df分别如下：
df2

stacked_df

使用unstack

melt

melt_df = df.melt(id_vars=['水果','商店'], var_name='value type')
print(melt_df)

pivot_table

pivot_table: 通过指定的索引和列对数据进行重塑，可以聚合。

pivot_table_df = df.pivot_table(index='水果',columns='商店',values='价格')
print(pivot_table_df)

拼接和合并

merge

merge 方法用于将两个dataframe、series合并成一个dataframe，其关键字how指明了合并的方式，on指示了按哪个字段合并。

df1 = pd.DataFrame({'Char': ['A', 'B', 'C', 'D'],
                    'number': [1, 2, 3, 4]})
df2 = pd.DataFrame({'Char': ['C', 'D', 'E', 'F'],
                    'number': [3, 4, 5, 6]})
merge_df = df1.merge(df2,how='left',on='number')
inner_df = df1.merge(df2,how='inner',left_on='number',right_on='number')
m2_df = df1.merge(df2,how='right',on='number',suffixes=('','_right'))

由于df2并没有A和B两个字段，因而合并后其值为nan。

concat和join


df3 = pd.concat([df1,df2]).drop_duplicates().reset_index(drop=True)

df4 = pd.concat([df1,df2],axis=1)

new_row = pd.Series(['Z',26],index=df3.columns)
df3.append(new_row,ignore_index=True)

join_df = pd.DataFrame({'Char': ['F','G', 'H', 'I'],
                        'number': [6, 7, 8, 9]})

df2.join(join_df, rsuffix='_right')

画图

pandas 提供了多种画图工具，可以绘制线性图、柱状图以及关系矩阵图等等。

df.plot();
df.plot.area(stacked=True);
df.hist();
from pandas.plotting import scatter_matrix

scatter_matrix(df,figsize=(4, 6),);

此外，在一个细分的行业或者领域里，还还有一些专用的绘图包，如seanborn绘制热力图，mplfinance绘制股票等金融数据图等。

统计信息


df.mean()

df.median()

.mode()
.std()

.describe()

.corr()

Original: https://blog.csdn.net/shichaog/article/details/125776354
Author: shichaog
Title: 深度学习之 python pandas

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/678101/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

AI-无损检测方向速读：基于深度学习的表面缺陷检测方法综述

1 表面缺陷检测的概念表面缺陷检测是机器视觉领域中非常重要的一项研究内容, 也称为 AOI (Automated optical inspection) 或 ASI (Autom…

人工智能 2023年7月28日
0061
C语言期末复习题（上）

1. 输入两个正整数，m和n，求其最大公约数和最小公倍数。 test01() { int m, n; int gy = 0, gb = 0; printf("请输入输入两…

人工智能 2023年6月30日
0085
向毕业妥协系列之机器学习笔记:构建ML系统(三)

目录一.机器学习开发的迭代二.误差分析三.添加更多数据四.迁移学习五.机器学习项目的完整周期一.机器学习开发的迭代然后我们以识别垃圾电子邮件为例来讲解一下这个过程如…

人工智能 2023年6月30日
0066
【采集读写】基于matlab语音采集与读写【含Matlab源码 538期】

⛄一、获取代码方式获取代码方式1：完整代码已上传我的资源：【采集读写】基于matlab语音采集与读写【含Matlab源码 538期】点击上面的蓝色字体，付费直接下载，就可以了。 …

人工智能 2023年5月27日
00101
如何比较两个或多个分布：从可视化到统计检验的方法总结

比较一个变量在不同组中的分布是数据科学中的一个常见问题。当我们想要评估一项策略(用户体验功能、广告活动、药物等)的因果效应时，因果推断的黄金标准便是随机对照试验，也就是所谓的A /…

人工智能 2023年7月15日
0062
fl21怎么换主题flstudio皮肤怎么换?

FLstudio21如何更改皮肤主题？不光是背景，还有按键什么的？请参考下面的步骤进行设置fl视图设置。第1步，打开visualstudiofl视图设置。第2步fl视图设置，…

人工智能 2023年7月31日
0051
AttributeError: module ‘tensorflow._api.v1.compat‘ has no attribute ‘v1‘

猜测原因：TensorFlow不同版本的API有出入，用法不兼容解决：修改API即可。将代码：config = tf.compat.v1.ConfigProto()confi…

人工智能 2023年5月26日
00149
Bert文本分类实战（附代码讲解）

[ BERT_是目前自然语言处理领域最先进的模型之一，拥有强大的语言理解能力和处理文本任务的能力。其中 _BERT_多分类 _文本分类_的应用广泛，可以用于情感分析、垃圾邮件过滤、…

人工智能 2023年7月3日
0055
数据挖掘1——课后习题

数据挖掘1——课后习题部分习题 * 第一章：引论 – 1.3 1.4 1.5 第二章：认识数据 – 2.5 2.6 第三章：数据预处理 – 3…

人工智能 2023年6月24日
00110
2021“华为杯”第十八届研究生数学建模D题

数学建模已结束数日，今晚刚好闲来无事，决定对这次数学建模进行一下总结。题目下发以后，和队友经过一番商讨，便决定在B和D之间选择一个，原因也很简单，本身研究方向是NLP，机器学习和…

人工智能 2023年6月16日
0080
PointNeXt: 通过改进的训练以及模型缩放策略重新探究PointNet++

原文链接：作者：Gordon ::: 论文链接：https://arxiv.org/abs/2206.04670代码链接（已开源）：https://github.com/guoch…

人工智能 2023年7月27日
0065
Cuda与cudnn对应关系

Tensorflow 与Cuda、cudnn对应关系 Cuda和cudnn是支持NVIDIA支持GPU的两个库，分别用于高性能计算和深度神经网络计算的支持。 Cuda（Comput…

人工智能 2023年5月26日
0084
Qt+YOLOv4实现目标检测

环境：系统：win10 （显卡：NVIDIA GTX 1050） Yolo版本：V4 cuda:11.2 cudnn:8.1.1 opencv:3.4.15 VS:2019 1….

人工智能 2023年7月12日
0061
使用DGL完成节点分类任务

更多图神经网络和深度学习内容请关注： ; 节点分类任务概述 节点分类(node classi…

人工智能 2023年6月30日
0093
Python｜excel表格数据一键转json格式小工具｜支持xlsx、xls格式转json｜【源码+解析】

背景最近在使用 JavaScript编写一些浏览器 RPA脚本，脚本使用过程中遇到一些问题，脚本使用的数据往往存放在 excel表，但运行时只能读取 json数据，导致频繁人工 …

人工智能 2023年7月30日
0048
关键点检测之直接回归(逐行手撕Pytorch)

直接回归的整个流程如下：用卷积提特征用全连接层进行回归得到关键点 *与标签做损失并优化损失当图像很大的时候，神经网络是在整张图像中去寻找一个像素点，所以直接回归这一解决办法让…

人工智能 2023年7月23日
0072

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31