訂閱
糾錯
加入自媒體

使用TensorFlow從頭開始實現(xiàn)這個架構(gòu)

在此之前,我已經(jīng)討論了MobileNet的體系結(jié)構(gòu)

接下來,我們將看到如何使用TensorFlow從頭開始實現(xiàn)這個架構(gòu)。

實現(xiàn):

MobileNet架構(gòu):

圖顯示了我們將在代碼中實現(xiàn)的MobileNet體系結(jié)構(gòu)。網(wǎng)絡(luò)從Conv、BatchNorm、ReLU塊開始,并從其上跟隨多個MobileNet塊。它最終以一個平均池和一個完全連接的層結(jié)束,并激活Softmax。

我們看到該體系結(jié)構(gòu)有一個模式——Conv-dw/s1,后跟Conv/s1,依此類推。這里dw是深度層和步幅數(shù),然后是Conv層和步幅數(shù)。這兩條線是MobileNet區(qū)塊。

“Filter Shape”列給出了核大小和要使用的濾波器數(shù)量的詳細(xì)信息。列的最后一個數(shù)字表示濾波器的數(shù)量。我們看到濾波器數(shù)量從32逐漸增加到64,從64逐漸增加到128,從128逐漸增加到256,以此類推。

最后一列顯示了隨著我們深入網(wǎng)絡(luò),圖像的大小是如何變化的。輸入大小選擇為224*224像素,有3個通道,輸出層分類為1000類。

正常CNN架構(gòu)塊之間的差異(左),與MobileNet架構(gòu)(右):

構(gòu)建網(wǎng)絡(luò)時需要記住的幾件事:

所有層之后都是批量標(biāo)準(zhǔn)化和ReLU非線性。

與具有Conv2D層的普通CNN模型不同,MobileNet具有Depthwise  Conv層,如圖所示。

工作流

從TensorFlow庫導(dǎo)入所有必要的層

為MobileNet塊編寫輔助函數(shù)

構(gòu)建模型的主干

使用helper函數(shù)構(gòu)建模型的主要部分

導(dǎo)入圖層

import tensorflow as tf

# 導(dǎo)入所有必要的層

from tensorflow.keras.layers import Input, DepthwiseConv2D

from tensorflow.keras.layers import Conv2D, BatchNormalization

from tensorflow.keras.layers import ReLU, AvgPool2D, Flatten, Dense

from tensorflow.keras import Model

Keras已經(jīng)內(nèi)置了一個DepthwiseConv層,所以我們不需要從頭開始創(chuàng)建它。

MobileNet塊

MobileNet塊的表示

要為MobileNet塊創(chuàng)建函數(shù),我們需要以下步驟:

函數(shù)的輸入:

a.張量(x)

b.卷積層的濾波器數(shù)量(濾波器)

c.卷積層的步長(步長)

運行:

a.應(yīng)用3x3分步卷積層,然后是批量標(biāo)準(zhǔn)化層和ReLU激活

b.應(yīng)用帶有1x1卷積層的濾波器,然后是批量標(biāo)準(zhǔn)化層和ReLU激活

返回張量(輸出)

這3個步驟在下面的代碼塊中實現(xiàn)。

# MobileNet block

def mobilnet_block (x, filters, strides):

x = DepthwiseConv2D(kernel_size = 3, strides = strides, padding = 'same')(x)

x = BatchNormalization()(x)

x = ReLU()(x)

x = Conv2D(filters = filters, kernel_size = 1, strides = 1)(x)

x = BatchNormalization()(x)

x = ReLU()(x)

return x

構(gòu)建模型的主干

如圖2所示,第一層為Conv/s2,濾波器形狀為3x32。

模型的主干

# 模型的主干

input = Input(shape = (224,224,3))

x = Conv2D(filters = 32, kernel_size = 3, strides = 2, padding = 'same')(input)

x = BatchNormalization()(x)

x = ReLU()(x)

模型的主要部分:

# 模型的主要部分

x = mobilnet_block(x, filters = 64, strides = 1)

x = mobilnet_block(x, filters = 128, strides = 2)

x = mobilnet_block(x, filters = 128, strides = 1)

x = mobilnet_block(x, filters = 256, strides = 2)

x = mobilnet_block(x, filters = 256, strides = 1)

x = mobilnet_block(x, filters = 512, strides = 2)

for _ in range (5):

x = mobilnet_block(x, filters = 512, strides = 1)

x = mobilnet_block(x, filters = 1024, strides = 2)

x = mobilnet_block(x, filters = 1024, strides = 1)

x = AvgPool2D (pool_size = 7, strides = 1, data_format='channels_first')(x)

output = Dense (units = 1000, activation = 'softmax')(x)

model = Model(inputs=input, outputs=output)

model.summary()

模型摘要的一個片段

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號