Logistic Regression with a Neural Network mindset

2023年6月5日下午10:28 • Java • 阅读 99

文章内容为吴恩达深度学习第二周的编程作业

ipynbg格式代码及数据集–>陈能豆
密码: o1bn

#!/usr/bin/env python
coding: utf-8

# &#x5434;&#x6069;&#x8FBE;&#x6DF1;&#x5EA6;&#x5B66;&#x4E60;&#x7B2C;&#x4E8C;&#x5468;&#x7F16;&#x7A0B;&#x4F5C;&#x4E1A;

## &#x9898;&#x76EE;&#x90E8;&#x5206;

&#x5148;&#x6765;&#x770B;&#x4E00;&#x4E0B; &#x82F1;&#x6587;&#x7684;&#x9898;&#x76EE;&#x90E8;&#x5206;

Logistic Regression with a Neural Network mindset
Welcome to your first (required) programming assignment! You will build a logistic regression classifier to recognize cats. This assignment will step you through how to do this with a Neural Network mindset, and so will also hone your intuitions about deep learning.

#
Instructions:
#
Do not use loops (for/while) in your code, unless the instructions explicitly ask you to do so.

You will learn to:
#
Build the general architecture of a learning algorithm, including:
Initializing parameters
Calculating the cost function and its gradient
Using an optimization algorithm (gradient descent)
Gather all three functions above into a main model function, in the right order.

### &#x7B80;&#x5355;&#x89E3;&#x91CA;&#x4E00;&#x4E0B;&#x8981;&#x6C42;
&#x8981;&#x6C42;&#x6211;&#x4EEC;&#x5EFA;&#x8BAE;&#x4E00;&#x4E2A;&#x903B;&#x8F91;&#x56DE;&#x5F52;&#x5206;&#x7C7B;&#x5668;&#x6765;&#x8BC6;&#x522B;&#x732B;&#x7684;&#x56FE;&#x7247;
#
#### &#x8981;&#x6C42;&#x5982;&#x4E0B;&#xFF1A;
* &#x4E0D;&#x8981;&#x5728;&#x4EE3;&#x7801;&#x4E2D;&#x4F7F;&#x7528;&#x5FAA;&#x73AF;&#xFF08;for/while&#xFF09;&#xFF0C;&#x9664;&#x975E;&#x6307;&#x4EE4;&#x660E;&#x786E;&#x8981;&#x6C42;&#x60A8;&#x8FD9;&#x6837;&#x505A;&#x3002;
#
* &#x7B97;&#x6CD5;&#x7684;&#x67B6;&#x6784;&#x5982;&#x4E0B;&#xFF1A;
1. &#x53C2;&#x6570;&#x521D;&#x59CB;&#x5316;
2. &#x6210;&#x672C;&#x51FD;&#x6570;&#x53CA;&#x68AF;&#x5EA6;&#x7684;&#x8BA1;&#x7B97;
3. &#x4F18;&#x5316;&#x7B97;&#x6CD5;
#
&#x4F60;&#x9700;&#x8981;&#x7F16;&#x5199;&#x4E0A;&#x9762;&#x63D0;&#x5230;&#x7684;&#x65B9;&#x6CD5;&#xFF0C;&#x5E76;&#x8FDB;&#x884C;&#x7EC4;&#x5408;&#xFF0C;&#x6210;&#x4E3A;&#x4E00;&#x4E2A;&#x6A21;&#x578B;
#
#### &#x6570;&#x636E;&#x96C6;&#x6982;&#x8FF0;
&#x8FD9;&#x91CC;&#x4F1A;&#x63D0;&#x4F9B;&#x7ED9;&#x6211;&#x4EEC;&#x4E00;&#x4E2A;&#x6570;&#x636E;&#x96C6;&#xFF0C;&#x540D;&#x5B57;&#x4E3A;&#x201D;data.h5&#x201C;(&#x548C;&#x4E0B;&#x9762;&#x4EE3;&#x7801;&#x7528;&#x7684;&#x662F;&#x540C;&#x4E00;&#x4E2A;&#x6570;&#x636E;&#x96C6;&#xFF0C;&#x4E0D;&#x8FC7;&#x540D;&#x5B57;&#x6539;&#x6210;&#x4E86;&#x201D;train_catvnoncat.h5&#x201C;)
&#x91CC;&#x9762;&#x5305;&#x542B;&#x4E86;&#x76F8;&#x5173;&#x6570;&#x636E;&#x96C6;&#xFF0C;&#x66F4;&#x5177;&#x4F53;&#x7684;&#x53EF;&#x4EE5;&#x770B;&#x4EE3;&#x7801;&#x7684;&#x6570;&#x636E;&#x5BFC;&#x5165;&#x65B9;&#x6CD5;&#x3002;
&#x4E3B;&#x8981;&#x5305;&#x62EC;&#xFF1A;
1. &#x6807;&#x7B7E;&#x8BBE;&#x7F6E;&#x597D;&#x7684;&#x8BAD;&#x7EC3;&#x96C6;&#xFF0C;&#x6807;&#x8BB0;&#x662F;&#x5426;&#x4E3A;cat(0/1)
2. &#x6807;&#x7B7E;&#x8BBE;&#x7F6E;&#x597D;&#x7684;&#x6D4B;&#x8BD5;&#x96C6;
3. &#x56FE;&#x7247;&#x7684;&#x5F62;&#x72B6;&#x4E3A;(64, 64, 3)
#
#
&#x6570;&#x636E;&#x96C6;&#x53CA;&#x4EE3;&#x7801;&#x9644;&#x4E0A;&#x94FE;&#x63A5;--> [&#x9648;&#x80FD;&#x8C46;](https://pan.baidu.com/s/1VMCuVU8IKWLycKM6B20O_g)
&#x63D0;&#x53D6;&#x5BC6;&#x7801;&#xFF1A;q73d
#
#### ok  &#x4E0B;&#x9762;&#x770B;&#x4EE3;&#x7801;
#

In[98]:

pip --version   # &#x8FD9;&#x91CC;&#x770B;&#x4E00;&#x4E0B;python&#x7684;&#x7248;&#x672C;  &#xFF0C;3.6 &#x4EE5;&#x53CA;&#x522B;&#x7684;&#x7248;&#x672C;&#x5E94;&#x8BE5;&#x4E5F;&#x662F;&#x53EF;&#x884C;&#x7684;

### &#x4EE3;&#x7801;&#x90E8;&#x5206;

#### &#x4EE3;&#x7801;&#x6BB5;&#x540E;&#x9762;&#x9644;&#x4E0A;&#x76F8;&#x5173;&#x91CD;&#x70B9;&#x63D0;&#x793A;
#### &#x76F8;&#x5173;&#x51FD;&#x6570;&#x7528;&#x6CD5; &#x4E0D;&#x4F1A;&#x7684;&#x767E;&#x5EA6;

In[197]:

import numpy as np
import matplotlib.pyplot as plt
import h5py
import random
&#x4E0B;&#x9762;&#x4E24;&#x4E2A;&#x7528;&#x4E8E;&#x6D4B;&#x8BD5;&#x6A21;&#x578B;
from PIL import Image
import imageio

&#x5BFC;&#x5165;&#x76F8;&#x5173;&#x5305;

In[198]:

&#x5BFC;&#x5165;&#x6570;&#x636E;&#x51FD;&#x6570;
def load_datasets():

    train_datasets = h5py.File('datasets/train_catvnoncat.h5',"r")
    train_set_x_origi = np.array(train_datasets["train_set_x"][:])
    train_set_y_origi = np.array(train_datasets["train_set_y"][:])
    # &#x8BFB;&#x53D6;&#x8BAD;&#x7EC3;&#x96C6;

    test_datasets = h5py.File('datasets/test_catvnoncat.h5',"r")
    test_set_x_origi = np.array(test_datasets["test_set_x"][:])
    test_set_y_origi = np.array(test_datasets["test_set_y"][:])
    # &#x6D4B;&#x8BD5;&#x96C6;

    classes = np.array(test_datasets["list_classes"][:])
    # &#x5B58;&#x50A8;&#x53EF;&#x80FD;&#x7684;&#x7ED3;&#x679C;   0 non-cat  1  cat

    # &#x521D;&#x59CB;&#x5316;&#x77E9;&#x9635;&#x683C;&#x5F0F;
    train_set_y_origi = train_set_y_origi.reshape( (1,train_set_y_origi.shape[0]) )
    test_set_y_origi = test_set_y_origi.reshape( (1,test_set_y_origi.shape[0]) )

    return train_set_x_origi,train_set_y_origi,test_set_x_origi,test_set_y_origi,classes

&#x4ECE;&#x6570;&#x636E;&#x96C6;&#x4E2D;&#x5BFC;&#x5165;&#x6570;&#x636E;  &#x5176;&#x4E2D;classes &#x7528;&#x4E8E;&#x5B58;&#x50A8;&#x53EF;&#x80FD;&#x7684;&#x7ED3;&#x679C;
classes: array([b'non-cat', b'cat'], dtype='|S7')

In[199]:

&#x8BFB;&#x5165;&#x6570;&#x636E;
train_set_x_origi,train_set_y,test_set_x_origi,test_set_y,classes = load_datasets()

In[200]:

&#x663E;&#x793A;&#x4E00;&#x4E0B;&#x8BAD;&#x7EC3;&#x96C6;&#x7684;&#x6570;&#x636E;
index = random.randint(1,train_set_y.shape[1])

plt.imshow(train_set_x_origi[index])
&#x6253;&#x5370;&#x56FE;&#x7247;

&#x6253;&#x5370;&#x7ED3;&#x679C;
print( "The picture number is " +str(index) + "  The ans is " +classes[ np.squeeze(train_set_y[:,index])].decode("utf-8") )

print("&#x4F7F;&#x7528;np.squeeze&#xFF1A;" + str(np.squeeze(train_set_y[:,index])) )
print("&#x4E0D;&#x4F7F;&#x7528;np.squeeze&#xFF1A; " + str(train_set_y[:,index])  )

&#x663E;&#x793A;&#x7684;&#x662F;&#x6570;&#x636E;&#x96C6;&#x4E2D;&#x968F;&#x673A;&#x7684;&#x4E00;&#x5F20;&#x56FE;&#x7247;&#x53CA;&#x7ED3;&#x679C;
&#x53EF;&#x6539;&#x4E3A;&#x6307;&#x5B9A;&#x7F16;&#x53F7;
squeeze &#x51FD;&#x6570;&#x7684;&#x4F5C;&#x7528;&#x4E3A;&#x538B;&#x7F29;&#x7EF4;&#x5EA6;
&#x662F;&#x5426;&#x4F7F;&#x7528;squeeze&#x7684;&#x533A;&#x522B;&#x89C1;&#x4EE3;&#x7801;
#

In[201]:

&#x67E5;&#x770B;&#x77E9;&#x9635;&#x7EF4;&#x6570;
im_number_train = train_set_y.shape[1]
im_number_test = test_set_y.shape[1]
im_size = train_set_x_origi.shape[1]

&#x6253;&#x5370;
print("&#x8BAD;&#x7EC3;&#x96C6;&#x56FE;&#x7247;&#x6570;&#x91CF;&#xFF1A; "+str(im_number_train))
print("&#x6D4B;&#x6570;&#x96C6;&#x56FE;&#x7247;&#x6570;&#x91CF;&#xFF1A; "+str(im_number_test))
print("&#x56FE;&#x7247;&#x5BBD;&#x5EA6;&#x9AD8;&#x5EA6;&#x4E3A;&#xFF1A; "+str(im_size))
print("&#x6BCF;&#x5F20;&#x56FE;&#x7247;&#x5927;&#x5C0F;&#x4E3A;" +str(im_size)+","+str(im_size)+",3")
print("&#x8BAD;&#x7EC3;&#x96C6;x&#x7EF4;&#x6570;&#x4E3A; "+str(train_set_x_origi.shape))
print("&#x8BAD;&#x7EC3;&#x96C6;y&#x7EF4;&#x6570;&#x4E3A; "+str(train_set_y.shape))
print("&#x6D4B;&#x8BD5;&#x96C6;x&#x7EF4;&#x6570;&#x4E3A; "+str(test_set_x_origi.shape))
print("&#x6D4B;&#x8BD5;&#x96C6;y&#x7EF4;&#x6570;&#x4E3A; "+str(test_set_y.shape))

shaape &#x51FD;&#x6570; &#x8FD4;&#x56DE;&#x77E9;&#x9635;&#x7EF4;&#x6570;
&#x8FD4;&#x56DE;&#x6570;&#x636E;&#x7C7B;&#x578B;&#x4E3A;n&#x5143;&#x7EC4;   &#x53EF;&#x901A;&#x8FC7;&#x4E0B;&#x6807;&#x5F15;&#x7528;

In[202]:

&#x964D;&#x7EF4;  &#x6570;&#x636E;&#x9884;&#x5904;&#x7406;
train_set_x_flatten = train_set_x_origi.reshape(train_set_x_origi.shape[0],-1).T
test_set_x_flatten = test_set_x_origi.reshape(test_set_x_origi.shape[0],-1).T

&#x6253;&#x5370;&#x964D;&#x7EF4;&#x540E;&#x7684;&#x7EF4;&#x6570;

print("&#x8BAD;&#x7EC3;&#x96C6;&#x964D;&#x7EF4;&#x540E;&#x7684;&#x7EF4;&#x6570;&#x4E3A; "+str(train_set_x_flatten.shape))
print("&#x6D4B;&#x8BD5;&#x96C6;&#x964D;&#x7EF4;&#x540E;&#x7684;&#x7EF4;&#x6570;&#x4E3A; "+str(test_set_x_flatten.shape))

reshape &#x51FD;&#x6570;&#x7528;&#x4E8E;&#x6539;&#x53D8;&#x77E9;&#x9635;&#x7EF4;&#x6570;
-1 &#x8868;&#x793A; &#x81EA;&#x52A8;&#x8BA1;&#x7B97;&#x4E0B;&#x4E00;&#x7EF4;&#x5EA6;

In[203]:

&#x6838;&#x5BF9;&#x7EF4;&#x6570;
print("&#x8BAD;&#x7EC3;&#x96C6;x&#x7684;&#x4F4D;&#x6570;&#x4E3A; "+str(train_set_x_flatten.shape))
print("&#x8BAD;&#x7EC3;&#x96C6;y&#x7EF4;&#x6570;&#x4E3A; "+str(train_set_y.shape))
print("&#x6D4B;&#x8BD5;&#x96C6;x&#x7684;&#x7EF4;&#x6570;&#x4E3A; "+str(test_set_x_flatten.shape))
print("&#x6D4B;&#x8BD5;&#x96C6;y&#x7EF4;&#x6570;&#x4E3A; "+str(test_set_y.shape))

In[204]:

&#x6570;&#x636E;&#x6807;&#x51C6;&#x5316;
&#x56FE;&#x7247;&#x5B58;&#x50A8;&#x7684;&#x503C;&#x4E3A;&#x50CF;&#x7D20;&#x503C;    0-255
&#x4F8B;&#x5982;&#x6570;&#x636E;&#x96C6;&#x4E2D;
print(np.amax(train_set_x_flatten))
print(np.amin(train_set_x_flatten))

train_set_x = train_set_x_flatten/255
test_set_x = test_set_x_flatten/255

In[205]:

def sigmoid(z):
    # &#x53C2;&#x6570;&#x4E3A;z&#x6570;&#x7EC4;

    # &#x8FD4;&#x56DE;s = sigmoid(z)

    s = 1/(1+np.exp(-z))

    return s

&#x6FC0;&#x6D3B;&#x51FD;&#x6570;&#x6709;&#x5F88;&#x591A;&#x79CD;
![image.png](attachment:image.png "&#x6FC0;&#x6D3B;&#x51FD;&#x6570;")

In[206]:

&#x6D4B;&#x8BD5;siggmod &#x51FD;&#x6570; &#x662F;&#x5426;&#x7B26;&#x5408;&#x9884;&#x671F;
print( "sigmoid(0) = "+str(sigmoid(0)))
print( "sigmoid(1) = "+str(sigmoid(1)))
print( "sigmoid(10) = "+str(sigmoid(10)))
print( "sigmoid(-1) = "+str(sigmoid(-1)))
print( "sigmoid(-10) = "+str(sigmoid(-10)))

In[207]:

def initialize_zeros_vector(size):
    # &#x51FD;&#x6570;&#x4F5C;&#x7528; &#x751F;&#x6210; &#x5E76;&#x8FD4;&#x56DE;&#x4E00;&#x4E2A;(size,1) &#x7684;0&#x5411;&#x91CF;  &#x540C;&#x65F6;&#x521D;&#x59CB;&#x5316; b=0

    w = np.zeros( (size,1) )
    b = 0

    # &#x65AD;&#x8A00;&#x786E;&#x4FDD;&#x7EF4;&#x6570;
    assert( w.shape== (size,1) )
    assert( isinstance(b,float) or isinstance(b,int) )

    return (w , b)

In[208]:

def  two_way_propogate(W,b,X,Y ):
    # &#x5B9E;&#x73B0;&#x6B63;&#x5411;&#x4F20;&#x64AD;&#x548C;&#x53CD;&#x5411;&#x4F20;&#x64AD;

    m = X.shape[1]

    # &#x6B63;&#x5411;&#x4F20;&#x64AD;

    A = sigmoid(np.dot(W.T,X )+b)
    cost = (-1/m)*np.sum(Y*np.log(A)  + (1-Y)*np.log(1-A))

    # &#x53CD;&#x5411;&#x4F20;&#x64AD;
    dw = (1/m)* np.dot(X,(A-Y).T)
    db = (1/m)* np.sum(A-Y)

    assert(dw.shape==W.shape)
    assert(db.dtype == float)
    cost = np.squeeze(cost)

    # &#x5B58;&#x50A8;dw db
    grads = {
        "dw":dw,
        "db":db
    }

    return grads, cost

### &#x8FD9;&#x91CC;&#x9644;&#x4E0A;&#x8BFE;&#x7A0B;&#x4E2D;&#x6C42;&#x5BFC;&#x8BA1;&#x7B97;&#x8FC7;&#x7A0B;&#x4E2D;&#x7684;&#x90E8;&#x5206;&#x622A;&#x56FE;&#xFF0C;&#x4FBF;&#x4E8E;&#x7406;&#x89E3;
&#x5411;&#x91CF;&#x5316;&#x4E4B;&#x524D;&#xFF1A;
![image.png](attachment:image.png)
&#x5411;&#x91CF;&#x5316;&#x540E;&#xFF1A;
![image.png](attachment:image.png)

In[209]:

&#x6D4B;&#x8BD5; two_way_propogate
&#x968F;&#x4FBF;&#x521D;&#x59CB;&#x5316;&#x4E00;&#x4E9B;&#x53C2;&#x6570;
W ,b ,X, Y = np.array([ [2],[2] ]),2,np.array([ [1,0],[0,0] ]),np.array([0,0])
grabs, cost = two_way_propogate(W,b,X,Y)
print("dw = " + str(grabs["dw"]))
print("db = " + str(grabs["db"]))
print("cost = " + str(cost))
&#x8FED;&#x4EE3;&#x4E00;&#x6B21; &#x770B;&#x6548;&#x679C;&#x5982;&#x4F55;
learning_rate = 0.1
W = W -learning_rate*grabs["dw"]
b= b- learning_rate * grabs["db"]
grads, cost = two_way_propogate(W,b,X,Y)
print("&#x8FED;&#x4EE3;&#x4E00;&#x6B21;&#x540E;")
print("dw = " + str(grabs["dw"]))
print("db = " + str(grabs["db"]))
print("cost = " + str(cost))

In[210]:

def optimize( W , b , X , Y , num_iteration , learning_rate , print_cost=False , print_frequency = 100):
    # &#x8BE5;&#x51FD;&#x6570;&#x4F5C;&#x7528; &#x8FD0;&#x7528;&#x68AF;&#x5EA6;&#x4E0B;&#x964D;&#x4F18;&#x5316;W &#x548C;b
    # &#x53C2;&#x6570;&#x63CF;&#x8FF0;&#x653E;&#x5728;&#x4E0B;&#x9762;
"""
    &#x6B64;&#x51FD;&#x6570;&#x901A;&#x8FC7;&#x8FD0;&#x884C;&#x68AF;&#x5EA6;&#x4E0B;&#x964D;&#x7B97;&#x6CD5;&#x6765;&#x4F18;&#x5316;w&#x548C;b

    &#x53C2;&#x6570;&#xFF1A;
        w  - &#x6743;&#x91CD;&#xFF0C;&#x5927;&#x5C0F;&#x4E0D;&#x7B49;&#x7684;&#x6570;&#x7EC4;&#xFF08;num_px * num_px * 3&#xFF0C;1&#xFF09;
        b  - &#x504F;&#x5DEE;&#xFF0C;&#x4E00;&#x4E2A;&#x6807;&#x91CF;
        X  - &#x7EF4;&#x5EA6;&#x4E3A;&#xFF08;num_px * num_px * 3&#xFF0C;&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x7684;&#x6570;&#x91CF;&#xFF09;&#x7684;&#x6570;&#x7EC4;&#x3002;
        Y  - &#x771F;&#x6B63;&#x7684;&#x201C;&#x6807;&#x7B7E;&#x201D;&#x77E2;&#x91CF;&#xFF08;&#x5982;&#x679C;&#x975E;&#x732B;&#x5219;&#x4E3A;0&#xFF0C;&#x5982;&#x679C;&#x662F;&#x732B;&#x5219;&#x4E3A;1&#xFF09;&#xFF0C;&#x77E9;&#x9635;&#x7EF4;&#x5EA6;&#x4E3A;(1,&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x7684;&#x6570;&#x91CF;)
        num_iterations  - &#x4F18;&#x5316;&#x5FAA;&#x73AF;&#x7684;&#x8FED;&#x4EE3;&#x6B21;&#x6570;
        learning_rate  - &#x68AF;&#x5EA6;&#x4E0B;&#x964D;&#x66F4;&#x65B0;&#x89C4;&#x5219;&#x7684;&#x5B66;&#x4E60;&#x7387;
        print_cost  - &#x6BCF;100&#x6B65;&#x6253;&#x5370;&#x4E00;&#x6B21;&#x635F;&#x5931;&#x503C;

    &#x8FD4;&#x56DE;&#xFF1A;
        params  - &#x5305;&#x542B;&#x6743;&#x91CD;w&#x548C;&#x504F;&#x5DEE;b&#x7684;&#x5B57;&#x5178;
        grads  - &#x5305;&#x542B;&#x6743;&#x91CD;&#x548C;&#x504F;&#x5DEE;&#x76F8;&#x5BF9;&#x4E8E;&#x6210;&#x672C;&#x51FD;&#x6570;&#x7684;&#x68AF;&#x5EA6;&#x7684;&#x5B57;&#x5178;
        &#x6210;&#x672C; - &#x4F18;&#x5316;&#x671F;&#x95F4;&#x8BA1;&#x7B97;&#x7684;&#x6240;&#x6709;&#x6210;&#x672C;&#x5217;&#x8868;&#xFF0C;&#x5C06;&#x7528;&#x4E8E;&#x7ED8;&#x5236;&#x5B66;&#x4E60;&#x66F2;&#x7EBF;&#x3002;

    &#x63D0;&#x793A;&#xFF1A;
    &#x6211;&#x4EEC;&#x9700;&#x8981;&#x5199;&#x4E0B;&#x4E24;&#x4E2A;&#x6B65;&#x9AA4;&#x5E76;&#x904D;&#x5386;&#x5B83;&#x4EEC;&#xFF1A;
        1&#xFF09;&#x8BA1;&#x7B97;&#x5F53;&#x524D;&#x53C2;&#x6570;&#x7684;&#x6210;&#x672C;&#x548C;&#x68AF;&#x5EA6;&#xFF0C;&#x4F7F;&#x7528;propagate&#xFF08;&#xFF09;&#x3002;
        2&#xFF09;&#x4F7F;&#x7528;w&#x548C;b&#x7684;&#x68AF;&#x5EA6;&#x4E0B;&#x964D;&#x6CD5;&#x5219;&#x66F4;&#x65B0;&#x53C2;&#x6570;&#x3002;
"""
    costs =[]
    for i in range(num_iteration):
        grads , cost = two_way_propogate( W , b, X , Y )

        dw = grads["dw"]
        db = grads["db"]
        W = W- dw * learning_rate
        b = b- db * learning_rate

        if(i%print_frequency==0):
            costs.append(cost)

        if(print_cost and i%print_frequency==0):
            print("&#x8FED;&#x4EE3;&#x6B21;&#x6570;&#x4E3A;&#xFF1A;%i , &#x8BEF;&#x5DEE;&#x503C;&#x4E3A;&#xFF1A;  %f" % (i,cost))

    params = {
        "W": W,
        "b": b
    }

    grads = {
        "dw": dw,
        "db": db
    }

    return (params , grabs , costs)

        w  - &#x6743;&#x91CD;&#x77E9;&#x9635;
        b  - &#x504F;&#x5DEE;&#x503C;  &#x4E00;&#x4E2A;&#x6570;
        X  - &#x7EF4;&#x5EA6;&#x4E3A; &#x8BAD;&#x7EC3;&#x96C6;
        Y  - &#x8BAD;&#x7EC3;&#x6807;&#x7B7E;&#x96C6; &#x771F;&#x6B63;&#x7684;&#x201C;&#x6807;&#x7B7E;&#x201D;&#x77E2;&#x91CF;&#xFF08;&#x5982;&#x679C;&#x975E;&#x732B;&#x5219;&#x4E3A;0&#xFF0C;&#x5982;&#x679C;&#x662F;&#x732B;&#x5219;&#x4E3A;1&#xFF09;&#xFF0C;&#x77E9;&#x9635;&#x7EF4;&#x5EA6;&#x4E3A;(1,&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x7684;&#x6570;&#x91CF;)
        num_iterations  - &#x4F18;&#x5316;&#x5FAA;&#x73AF;&#x7684;&#x8FED;&#x4EE3;&#x6B21;&#x6570;
        learning_rate  - &#x68AF;&#x5EA6;&#x4E0B;&#x964D;&#x66F4;&#x65B0;&#x89C4;&#x5219;&#x7684;&#x5B66;&#x4E60;&#x7387;
        print_cost  - &#x662F;&#x5426;&#x6253;&#x5370;cost
        print_frequency - &#x6253;&#x5370;&#x9891;&#x7387;&#xFF0C;&#x8FED;&#x4EE3;&#x591A;&#x5C11;&#x6B21;&#x6253;&#x5370;&#x4E00;&#x6B21;cost

In[211]:

&#x6D4B;&#x8BD5; optimize
W, b, X, Y = np.array([[2], [3]]), 3, np.array([[0,1], [2,2]]), np.array([[0, 2]])
params , grads , costs = optimize(W , b , X , Y , num_iteration=100 , learning_rate = 0.009)
print ("w = " + str(params["W"]))
print ("b = " + str(params["b"]))
print ("dw = " + str(grads["dw"]))
print ("db = " + str(grads["db"]))

In[212]:

def predict(W , b , X):

    # &#x6839;&#x636E;&#x53C2;&#x6570; &#x9884;&#x6D4B;&#x7ED3;&#x679C;

    m = X.shape[1]

    # &#x8FD9;&#x91CC;&#x53C2;&#x6570;&#x7684;&#x7EF4;&#x5EA6;&#x5047;&#x8BBE;&#x662F;&#x7B26;&#x5408;&#x7684;  &#x4E0D;&#x9700;&#x8981;&#x5224;&#x65AD;

    A = sigmoid( np.dot(W.T,X )+b)

    assert(A.shape==(1,m))
    for i in range(A.shape[1]):

        A[0,i] = 1 if A[0,i] >0.5  else 0
    # &#x9ED8;&#x8BA4;0.5&#x4E3A;&#x4E34;&#x754C;&#x503C;

    assert(A.shape==(1,m) )

    return A

&#x8FD9;&#x91CC;&#x7684;0.5 &#x53EF;&#x4EE5;&#x4FEE;&#x6539;&#x4E3A;&#x4E00;&#x4E2A;&#x6307;&#x5B9A;&#x7684;&#x4E34;&#x754C;&#x503C;    &#x6216;&#x8BBE;&#x7F6E;&#x4E3A;&#x53C2;&#x6570;

In[213]:

&#x6D4B;&#x8BD5;predict
w, b, X, Y = np.array([[1], [2]]), 2, np.array([[1,2], [3,4]]), np.array([[1, 0]])
print("predictions = " + str(predict(w, b, X)))

In[214]:

def model ( X_train , Y_train , X_test , Y_test , num_iterations = 2000 , learning_rate = 0.5, print_cost = False , print_frequency = 100):

    W , b = initialize_zeros_vector(X_train.shape[0])
    parameters , grabs , costs = optimize(W , b , X_train , Y_train , num_iterations , learning_rate , print_cost, print_frequency)

    W , b = parameters["W"] , parameters["b"]
    # &#x9884;&#x6D4B;&#x6D4B;&#x8BD5;&#x96C6;
    Y_prediction_tset = predict(W , b , X_test)
    Y_prediction_train = predict(W , b , X_train)

    # &#x6253;&#x5370;&#x51C6;&#x786E;&#x6027;
    print("&#x8BAD;&#x7EC3;&#x96C6;&#x51C6;&#x786E;&#x6027;&#xFF1A; " , format(100 - np.mean(np.abs(Y_prediction_train - Y_train)) * 100 ) , "%")
    print("&#x6D4B;&#x8BD5;&#x96C6;&#x51C6;&#x786E;&#x6027;&#xFF1A; " , format(100 - np.mean(np.abs(Y_prediction_tset - Y_test)) * 100 ) , "%")

    d = {
        "costs" : costs,
        "Y_prediction_test" : Y_prediction_tset,
        "Y_prediction_train" : Y_prediction_train,
        "W" : W,
        "b" : b,
        "learning_rate" : learning_rate,
        "num_iterations" : num_iterations
    }

    return d

In[215]:

&#x6D4B;&#x6570;model
d = model(train_set_x,train_set_y,test_set_x,test_set_y,num_iterations=2000,learning_rate=0.005,print_cost=True)

In[216]:

costs = np.squeeze( d["costs"] )
plt.plot(costs)
plt.ylabel("cost")
plt.xlabel("iterations(per 100)")
plt.title("Learning rate= "+ str(d["learning_rate"]))
plt.show

In[217]:

&#x6D4B;&#x8BD5;&#x4E0D;&#x540C;&#x7684;&#x5B66;&#x4E60;&#x7387;

learning_rates = [0.01,0.001,0.0001]
models = {}
for i in learning_rates:
    print("learning_rate is: " + str(i))
    models[str(i)]=model(train_set_x,train_set_y,test_set_x,test_set_y,num_iterations=2000,learning_rate=i,print_cost=False)
    print("\n")

for i in learning_rates:
    plt.plot(np.squeeze(models[str(i)]["costs"]  ), label= str(models[str(i)]["learning_rate"]))

plt.ylabel('cost')
plt.xlabel('iterations')
legend = plt.legend(loc='upper center' , shadow=True )
frame = legend.get_frame()
frame.set_facecolor('0.90')
plt.show

In[218]:

def test_my_image( my_image):
    image_name = my_image
    fname = "images/" + my_image  # &#x5728;&#x5F53;&#x524D;&#x76EE;&#x5F55;&#x4E0B;&#x6709;&#x4E00;&#x4E2A;images&#x6587;&#x4EF6;&#x5939;  &#x7528;&#x4E8E;&#x5B58;&#x653E;&#x6211;&#x4EEC;&#x7684;&#x56FE;&#x7247;
    image = np.array(imageio.imread(fname))

    my_image = Image.fromarray(image).resize(( im_size , im_size ))
    my_image = np.array(my_image).reshape((1, im_size * im_size * 3)).T

    my_predicted_image = predict(d["W"], d["b"], my_image)

    plt.imshow(image)
    print("image name is: "+image_name)
    print( "y = " + str(np.squeeze(my_predicted_image)) + ", your algorithm predicts a \"" + classes[int(np.squeeze(my_predicted_image)),].decode("utf-8") +  "\" picture.")

&#x4E0B;&#x9762;&#x6211;&#x4EEC;&#x81EA;&#x5DF1;&#x6574;&#x4E00;&#x5F20;&#x56FE;&#x7247;&#x8BD5;&#x4E00;&#x8BD5;

In[220]:

my_image1 = "my_image1.jpg"
my_image2 = "my_image1.jpg"
my_image3 = "my_image2.jpg"
my_image4 = "my_image3.jpg"
my_image5 = "my_image4.jpg"
test_my_image(my_image1)
test_my_image(my_image2)
test_my_image(my_image3)
test_my_image(my_image4)
test_my_image(my_image5)

####  &#x58F0;&#x660E;&#xFF1A; &#x672C;&#x4EBA;&#x53C2;&#x8003;&#x4E86;[Kulbear](https://github.com/Kulbear/deep-learning-coursera) &#x7684;github&#x4E0A;&#x7684;&#x6587;&#x7AE0; &#xFF0C;&#x52A0;&#x4EE5;&#x81EA;&#x5DF1;&#x7406;&#x89E3;&#xFF0C;&#x7F16;&#x5199;&#x4E86;&#x672C;&#x7BC7;&#x5185;&#x5BB9;&#x3002;&#x5C3D;&#x529B;&#x8BA9;&#x4EBA;&#x8F7B;&#x677E;&#x7406;&#x89E3;&#x8BFE;&#x7A0B;&#x5185;&#x5BB9;&#x53CA;&#x4F5C;&#x4E1A;

个人作品，如有错误，请指出；如要转载，请注明出处。三克油。。

Original: https://www.cnblogs.com/cndccm/p/14887504.html
Author: Mr小明同学
Title: Logistic Regression with a Neural Network mindset

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/573014/

转载文章受原作者版权保护。转载请注明原作者出处！

Java

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MongoDB 简介

Failure will never overtake me if my determination to succeed is strong enough. 只要我成功的决心足够…

Java 2023年6月9日
0070
spring拦截器中使用spring的自动注入

需要在spring的拦截器中使用自定义的服务，这要就设计到将服务注入到拦截器中。网上看的情况有两种： 1、 1 @Configuration 2 public class OptP…

Java 2023年5月30日
0091
32位Win7下安装与配置PHP环境（一）

运行PHP网站，主要需要安装、配置三个软件，Apache、PHP和MySQL。如果需要编辑调试PHP程序，还要安装一个编辑调试软件。一、 ApacheApache是和IIS类似的一…

Java 2023年5月29日
0072
初次使用create-react-app

最近玩了一下React，感觉还挺好玩的，说实话对后端的来说比vue好多了，记得刚学vue的时候是一头雾水；基础知识暂时后面慢慢说，其实感觉还是挺容易的吧，今天就简单使用一下rea…

Java 2023年6月6日
0088
Netty之非阻塞处理

Netty 是一个异步的、基于事件驱动的网络应用框架，用以快速开发高性能、高可靠性的网络 IO 程序。同步I/O : 需要进程去真正的去操作I/O；异步I/O：内核在I/O操作…

Java 2023年6月7日
0067
3.12美团

1.幸运数字 class Test { public static void main(String[] args) { Scanner scanner = new Scanner…

Java 2023年6月5日
0069
java.lang.ClassNotFoundException: javax.xml.bind.DatatypeConverter

在构建项目的时候使用的是jdk11，项目访问时报错故障原因使用了jdk版本过高解决：直接在pom.xml中添加如下依赖可以解决（也可以试试降低jdk的版本） javax.xm…

Java 2023年5月29日
0077
教学日志：javaSE-循环语句

/* while循环：先判断条件，再执行逻辑代码四部分组成： 1、初始化：循环的初始化变量 2、条件判断：条件返回必须是true或false 3、循环体：条件满足的话执行的逻辑代…

Java 2023年6月5日
0089
停止、启动nginx以及在windows下使用dos命令停止占用的端口

停止nginx程序停止命令 nginx.exe -s stop 或 nginx.exe -s quit 区别：stop可以快速停止nginx，可能并不保存相关信息；quit是完整…

Java 2023年6月9日
0080
MarkDown语法学习

用 “#” + ” ” 即可创建标题。一个 “#” + ” ” 就是一级标题，两个 …

Java 2023年6月5日
00111
从餐厅服务员到一线互联网电商程序员（上）

本系列文章分三部分: 上: 餐厅、洗浴会所打工经历。中: 大学求学创业经历。下: 互联网从业经历。本文为第一部分，关注微信公众号 “真香号”,及时阅读中…

Java 2023年6月7日
00118
ftp多文件压缩下载

@GetMapping(value = "/find") public String findfile(String filePath, String file…

Java 2023年6月9日
0072
JAVA入门基础_从零开始的培训_SpringCloud入门学习

分布式的最佳实践：微服务的大致框架单体架构（优缺点）垂直架构分布式架构(SOA) 微服务架构（知道API网关与服务的区别）什么是SpringCloud呢？服务注册与发现、…

Java 2023年6月9日
0061
Swagger UI 与SpringMVC的整合 II

pom.xml <dependency> <groupId>io.springfoxgroupId> <artifactId>spring…

Java 2023年5月30日
0085
Java学习-第一部分-第三阶段-第二节：反射

反射笔记目录：(https://www.cnblogs.com/wenjie2000/p/16378441.html) 一个需求引出反射请看下面的问题根据配置文件 re.pr…

Java 2023年6月15日
0078
python 类与对象

如果需创建一个类，那么可以使用 class 关键字：实例使用名为 a 的属性，创建一个名为 MyClass 的类： class MyClass: a = 6 现在我们可以使用名为 …

Java 2023年6月9日
0052

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Logistic Regression with a Neural Network mindset

大家都在看