TensorFlow函數(shù):tf.layers.BatchNormalization

2018-08-17 14:31 更新

tf.layers.BatchNormalization函數(shù)

BatchNormalization類

繼承自: Layer

定義在:tensorflow/python/layers/normalization.py.

來自http://arxiv.org/abs/1502.03167的批處理規(guī)范化層.

批處理規(guī)范化指的是通過減少內部協(xié)變量轉換來加速深度網(wǎng)絡訓練

參數(shù):

  • axis:應標準化的軸或軸的int列表,通常是軸的特征,例如,在一個具有data_format="channels_first"的Conv2D圖層后面,設置axis=1.如果提供了軸列表,則axis中的每個軸將同時規(guī)范化;默認值是-1,它使用最后一個軸.注意:在使用多軸批處理范數(shù)的情況下,beta,gamma,moving_mean,和moving_variance變量與輸入張量具有相同的秩,所有縮減(非軸)維度中的維度大小為1).
  • momentum:移動平均值的動量.
  • epsilon:添加到方差的小浮點數(shù),以避免除以零.
  • center:如果為True,則將beta的偏移量添加到標準化張量;如果為False,則忽略beta.
  • scale:如果為True,則乘以gamma;如果為False,則不使用gamma.當下一層是線性的(例如,nn.relu)時,可以禁用此操作,因為縮放可以由下一層完成.
  • beta_initializer:beta權重的初始值設定項.
  • gamma_initializer:gamma權重的初始值設定項.
  • moving_mean_initializer:移動平均值的初始值設定項.
  • moving_variance_initializer:移動方差的初始值設定項.
  • beta_regularizer:beta權重的可選正規(guī)化器.
  • gamma_regularizer:gamma權重的可選正規(guī)化器.
  • beta_constraint:由Optimizer更新后應用于beta權重的可選投影函數(shù)(例如,用于實現(xiàn)層權重的范數(shù)約束或值約束).該函數(shù)必須將未投影的變量作為輸入,并且必須返回投影變量(必須具有相同的形狀).在進行異步分布式培訓時,使用約束是不安全的.
  • gamma_constraint:由Optimizer更新后應用于gamma權重的可選投影功能.
  • renorm:是否使用批量重規(guī)范化(https://arxiv.org/abs/1702.03275).這會在培訓期間增加額外的變量;對于此參數(shù)的任一值,推斷都是相同的.
  • renorm_clipping:一個字典,可以將鍵'rmax','rmin','dmax'映射到用于剪輯重新校正的Tensors標量.校正(r, d)被用作corrected_value = normalized_value * r + d,其中,r的限幅為[RMIN,RMAX],d為[-dmax,DMAX];丟失的rmax,rmin,dmax分別設定為inf,0,inf.
  • renorm_momentum:使用renorm將動量(momentum)用于更新移動手段和標準偏差;與動量不同的是,這會影響訓練,既不會太小(會增加噪音)也不會太大(這會產(chǎn)生過時的估計);請注意,動量仍然應用于獲取推理的均值和方差.
  • fused:如果為None或者True,則盡可能使用更快,更融合的實現(xiàn);如果為False,請使用系統(tǒng)推薦的實現(xiàn).
  • trainable:Boolean,如果為True,則還將變量添加到圖集合GraphKeys.TRAINABLE_VARIABLES中(請參閱tf.Variable).
  • virtual_batch_size:一個int,默認情況下,virtual_batch_size是None,這表示在整個批次中執(zhí)行批量標準化.如果virtual_batch_size不是None,則執(zhí)行“Ghost Batch Normalization”,創(chuàng)建虛擬子批次,每個子批次分別進行標準化(具有共享的gamma,beta和移動統(tǒng)計數(shù)據(jù)).必須在執(zhí)行期間劃分實際批量大小.
  • adjustment:一個函數(shù),它采用包含輸入張量的(動態(tài))形狀Tensor并返回一對(scale, bias),以應用于標準化值(在gamma和beta之前),僅在訓練期間;例如,如果axis == - 1,adjustment = lambda shape: ( tf.random_uniform(shape[-1:], 0.93, 1.07), tf.random_uniform(shape[-1:], -0.1, 0.1)),則將標準化值向上或向下縮放7%,然后將結果移動到最多0.1(對每個特征進行獨立縮放和偏移,但在所有示例中共享),最后應用gamma或beta;如果為None,則不應用調整;如果指定了virtual_batch_size,則無法指定.
  • name:字符串,圖層的名稱.

屬性

  • activity_regularizer

    可選的正則化函數(shù)用于該層的輸出.

  • dtype
  • graph
  • input

    檢索圖層的輸入張量.

    僅適用于圖層只有一個輸入的情況,即它是否連接到一個輸入圖層.

    返回:

    輸入張量或輸入張量列表.

    可能引發(fā)的異常:

    • AttributeError:如果圖層連接到多個輸入圖層.
    • RuntimeError:如果在Eager模式下調用.
    • AttributeError:如果未找到入站節(jié)點.
  • input_shape

    檢索圖層的輸入形狀.

    僅適用于圖層只有一個輸入,即它是否連接到一個傳入層,或者所有輸入具有相同形狀的情況.

    返回:

    輸入形狀,作為整數(shù)形狀元組(或形狀元組列表,每個輸入張量一個元組).

    可能引發(fā)的異常:

    • AttributeError:如果圖層沒有定義的input_shape.
    • RuntimeError:如果在Eager模式下調用.
  • losses

    與此Layer相關的損失.

    請注意,在急切執(zhí)行時,獲取此屬性會計算正規(guī)則.使用圖形執(zhí)行時,已經(jīng)創(chuàng)建了變量正則化運算,并且只是在這里返回.

    返回:

    張量列表.

  • name
  • non_trainable_variables
  • non_trainable_weights
  • output

    檢索圖層的輸出張量.

    僅適用于圖層只有一個輸出,即它是否連接到一個輸入層.

    返回:

    輸出張量或輸出張量列表.

    可能引發(fā)的異常:

    • AttributeError:如果圖層連接到多個輸入圖層.
    • RuntimeError:如果在Eager模式下調用.
  • output_shape

    檢索圖層的輸出形狀.

    僅適用于圖層具有一個輸出,或者所有輸出具有相同形狀的情況.

    返回:

    輸出形狀,作為整數(shù)形狀元組(或形狀元組列表,每個輸出張量一個元組).

    可能引發(fā)的異常:

    • AttributeError:如果圖層沒有定義的輸出形狀.
    • RuntimeError:如果在Eager模式下調用.
  • scope_name
  • trainable_variables
  • trainable_weights
  • updates
  • variables

    返回所有圖層變量/權重的列表.

    返回:

    變量列表.

  • weights

    返回所有圖層變量/權重的列表.

    返回:

    變量列表.

方法

  • __init__
    __init__(
        axis=-1,
        momentum=0.99,
        epsilon=0.001,
        center=True,
        scale=True,
        beta_initializer=tf.zeros_initializer(),
        gamma_initializer=tf.ones_initializer(),
        moving_mean_initializer=tf.zeros_initializer(),
        moving_variance_initializer=tf.ones_initializer(),
        beta_regularizer=None,
        gamma_regularizer=None,
        beta_constraint=None,
        gamma_constraint=None,
        renorm=False,
        renorm_clipping=None,
        renorm_momentum=0.99,
        fused=None,
        trainable=True,
        virtual_batch_size=None,
        adjustment=None,
        name=None,
        **kwargs
    )

    初始化自我.

  • __call__
    __call__(
        inputs,
        *args,
        **kwargs
    )

    包裝call,應用預處理和后處理步驟.

    參數(shù):

    • inputs:輸入張量.
    • *args:要傳遞給self.call的其他位置參數(shù).
    • **kwargs:要傳遞給self.call的其他關鍵字參數(shù).注意:kwarg scope保留供圖層使用.

    返回:

    輸出張量.

    注意:- 如果圖層的call方法采用scope關鍵字參數(shù),則此參數(shù)將自動設置為當前變量范圍.- 如果圖層的call方法采用mask參數(shù)(如某些Keras圖層那樣),則其默認值將設置為inputs前一層生成的蒙版(如果input確實來自生成相應蒙版的圖層,即它是否來自具有掩蔽支持的Keras層).

    可能引發(fā)的異常:

    • ValueError:如果圖層的call方法返回None(無效值).
  • __deepcopy__
    __deepcopy__(memo)
  • add_loss
    add_loss(
        losses,
        inputs=None
    )

    添加損失張量,可能取決于圖層輸入.

    一些損失(例如,活動正則化損失)可能取決于調用層時傳遞的輸入.因此,當在不同的輸入a和b上重用同一層時,在layer.losses中的一些條目可以取決于a而另外一些取決于b.此方法自動跟蹤依賴性.

    該get_losses_for方法允許檢索與特定輸入集相關的損失.

    請注意,急切執(zhí)行時不支持add_loss.相反,可以通過add_variable添加變量正則化器.不直接支持活動正規(guī)化(但可以從Layer.call()中返回此類損失).

    參數(shù):

    • losses:損失張量,或張量/列表的張量.
    • inputs:如果傳遞了除None以外的任何內容,則表示損失是以某些層的輸入為條件的,因此它們只應在這些輸入可用的地方運行.例如,活動正規(guī)化損失就是這種情況.如果None通過,則假定損失是無條件的,并且將應用于層的所有數(shù)據(jù)流(例如,權重正則化損失).

    可能引發(fā)的異常:

    • RuntimeError:如果在Eager模式下調用.
  • add_update
    add_update(
        updates,
        inputs=None
    )

    添加更新操作,可能依賴于圖層輸入.

    權重更新(例如,BatchNormalization層中移動均值和方差的更新)可能取決于調用圖層時傳遞的輸入.因此,當在不同的輸入a和b上重用同一層時,在layer.updates中的一些條目可以取決于a而另外一些取決于b.此方法自動跟蹤依賴性.

    該get_updates_for方法允許檢索與特定輸入集相關的更新.

    在Eager模式下忽略此調用.

    參數(shù):

    • updates:更新操作,或更新操作的列表/元組.
    • inputs:如果傳遞了除None之外的任何內容,則表示更新是以某些層的輸入為條件的,因此它們只應在這些輸入可用的地方運行.例如,BatchNormalization更新就是這種情況.如果為None,則無條件地考慮更新,并且您有責任確保它們可能具有的任何依賴性在運行時可用.步數(shù)計數(shù)器可能屬于此類別.
  • add_variable
    add_variable(
        name,
        shape,
        dtype=None,
        initializer=None,
        regularizer=None,
        trainable=True,
        constraint=None,
        partitioner=None
    )

    向圖層添加新變量,或獲取現(xiàn)有變量;返回它.

    參數(shù):

    • name: 變量的名稱.
    • shape:變量的形狀.
    • dtype:變量的類型,默認為self.dtype或float32.
    • initializer:初始化程序實例(可調用).
    • regularizer:regularrizer實例(可調用).
    • trainable:變量是否應該是圖層的“trainable_variables”(例如,變量,偏差)或“non_trainable_variables”(例如,BatchNorm mean,stddev)的一部分.注意,如果當前變量范圍被標記為不可訓練,則忽略此參數(shù),并且任何添加的變量也標記為不可訓練.
    • constraint:約束實例(可調用).
    • partitioner:(可選)分區(qū)程序實例(可調用).如果提供,則在創(chuàng)建請求的變量時,它將根據(jù)partitioner分成多個分區(qū).在這種情況下,返回一個PartitionedVariable實例.可用的分區(qū)包括tf.fixed_size_partitioner和tf.variable_axis_size_partitioner.

    返回:

    創(chuàng)建的變量.通常是一個Variable或一個ResourceVariable實例.如果partitioner不是None,則返回PartitionedVariable實例.

    可能引發(fā)的異常:

    • RuntimeError:如果使用分區(qū)變量正則化調用并且啟用了急切執(zhí)行.
  • apply
    apply(
        inputs,
        *args,
        **kwargs
    )

    在輸入上應用圖層.

    這只是包裝self.__call__.

    參數(shù):

    • inputs:輸入張量.
    • *args:要傳遞給self.call的其他位置參數(shù).
    • **kwargs:要傳遞給self.call的其他關鍵字參數(shù).

    返回:

    輸出張量.

  • build
    build(input_shape)

    創(chuàng)建圖層的變量.

  • call
    call(
        inputs,
        training=False
    )

    圖層的邏輯就在這里.

    參數(shù):

    • inputs:輸入張量.
    • **kwargs:其他關鍵字參數(shù).

    返回:

    輸出張量.

  • compute_output_shape
    compute_output_shape(input_shape)

    在給定輸入形狀的情況下計算圖層的輸出形狀.

    參數(shù):

    • input_shape:一個TensorShape(可能是嵌套的元組).它不需要完全定義(例如批量大小可能是未知的).

    返回:

    一個TensorShape(可能是嵌套的元組).

    可能引發(fā)的異常:

    • TypeError:如果input_shape不是TensorShape(可能是嵌套的元組).
    • ValueError:如果input_shape不完整或與圖層不兼容.
  • count_params
    count_params()

    計算組成權重的標量總數(shù).

    返回:

    整數(shù)計數(shù).

    可能引發(fā)的異常:

    • ValueError:如果尚未構建圖層(在這種情況下,其權重尚未定義).
  • get_input_at
    get_input_at(node_index)

    檢索給定節(jié)點處的層的輸入張量.

    參數(shù):

    • node_index:Integer,從中檢索屬性的節(jié)點的索引.例如,node_index=0將對應于第一次調用圖層.

    返回:

    張量(如果圖層有多個輸入,則為張量列表).

    可能引發(fā)的異常:

    • RuntimeError:如果在Eager模式下調用.
  • get_input_shape_at
    get_input_shape_at(node_index)

    檢索給定節(jié)點處的圖層的輸入形狀.

    參數(shù):

    • node_index:Integer,從中檢索屬性的節(jié)點的索引.例如,node_index=0將對應于第一次調用圖層.

    返回:

    形狀元組(如果圖層有多個輸入,則為形狀元組??列表).

    可能引發(fā)的異常:

    • RuntimeError:如果在Eager模式下調用.
  • get_losses_for
    get_losses_for(inputs)

    檢索與特定輸入集相關的損失.

    參數(shù):

    • inputs:輸入張量或輸入張量的列表/元組.

    返回:

    依賴于inputs的層的損失張量列表.

    可能引發(fā)的異常:

    • RuntimeError:如果在Eager模式下調用.
  • get_output_at
    get_output_at(node_index)

    檢索給定節(jié)點處的圖層的輸出張量.

    參數(shù):

    • node_index:Integer,從中檢索屬性的節(jié)點的索引.例如,node_index=0將對應于第一次調用圖層.

    返回:

    張量(如果圖層有多個輸出,則為張量列表).

    可能引發(fā)的異常:

    • RuntimeError:如果在Eager模式下調用.
  • get_output_shape_at
    get_output_shape_at(node_index)

    檢索給定節(jié)點處圖層的輸出形狀.

    參數(shù):

    • node_index:Integer,從中檢索屬性的節(jié)點的索引.例如,node_index=0將對應于第一次調用圖層.

    返回:

    形狀元組(如果圖層具有多個輸出,則為形狀元組??列表).

    可能引發(fā)的異常:

    • RuntimeError:如果在Eager模式下調用.
  • get_updates_for
    get_updates_for(inputs)

    檢索與特定輸入集相關的更新.

    參數(shù):

    • inputs:輸入張量或輸入張量的列表/元組.

    返回:

    依賴于inputs的層的更新操作列表.

    可能引發(fā)的異常:

    • RuntimeError:如果在Eager模式下調用.
以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號