.. raw:: html

.. code:: python from mxnet import np, npx from mxnet.gluon import nn npx.set_np() def get_net(): net = nn.Sequential() net.add(nn.Dense(256, activation='relu')) net.add(nn.Dense(10)) return net net = get_net() .. raw:: html

.. raw:: html

.. code:: python import tensorflow as tf net = tf.keras.models.Sequential([ tf.keras.layers.Dense(256, activation=tf.nn.relu), tf.keras.layers.Dense(10), ]) .. raw:: html

.. raw:: html

mxnet tensorflow

.. raw:: html

.. code:: python print(net.collect_params) print(net.collect_params()) .. parsed-literal:: :class: output 256, Activation(relu)) (1): Dense(-1 -> 10, linear) )> sequential0_ ( Parameter dense0_weight (shape=(256, -1), dtype=float32) Parameter dense0_bias (shape=(256,), dtype=float32) Parameter dense1_weight (shape=(10, -1), dtype=float32) Parameter dense1_bias (shape=(10,), dtype=float32) ) Lưu ý rằng trong khi các đối tượng tham số tồn tại, kích thước đầu vào cho mỗi lớp được liệt kê là -1. MXNet sử dụng giá trị đặc biệt -1 để chỉ ra rằng kích thước tham số vẫn chưa được biết. Tại thời điểm này, các nỗ lực truy cập ``net[0].weight.data()`` sẽ kích hoạt lỗi thời gian chạy nói rằng mạng phải được khởi tạo trước khi các tham số có thể được truy cập. Bây giờ chúng ta hãy xem những gì xảy ra khi chúng ta cố gắng khởi tạo các tham số thông qua chức năng ``initialize``. .. code:: python net.initialize() net.collect_params() .. parsed-literal:: :class: output sequential0_ ( Parameter dense0_weight (shape=(256, -1), dtype=float32) Parameter dense0_bias (shape=(256,), dtype=float32) Parameter dense1_weight (shape=(10, -1), dtype=float32) Parameter dense1_bias (shape=(10,), dtype=float32) ) Như chúng ta có thể thấy, không có gì thay đổi. Khi không xác định kích thước đầu vào, các cuộc gọi để khởi tạo không thực sự khởi tạo các tham số. Thay vào đó, cuộc gọi này đăng ký vào MXNet mà chúng tôi muốn (và tùy chọn, theo phân phối nào) để khởi tạo các tham số. .. raw:: html

.. raw:: html

.. code:: python [net.layers[i].get_weights() for i in range(len(net.layers))] .. parsed-literal:: :class: output [[], []] Lưu ý rằng mỗi đối tượng lớp tồn tại nhưng trọng lượng trống. Sử dụng ``net.get_weights()`` sẽ gây ra lỗi vì trọng lượng chưa được khởi tạo. .. raw:: html

.. raw:: html

mxnet tensorflow

.. raw:: html

.. code:: python X = np.random.uniform(size=(2, 20)) net(X) net.collect_params() .. parsed-literal:: :class: output sequential0_ ( Parameter dense0_weight (shape=(256, 20), dtype=float32) Parameter dense0_bias (shape=(256,), dtype=float32) Parameter dense1_weight (shape=(10, 256), dtype=float32) Parameter dense1_bias (shape=(10,), dtype=float32) ) .. raw:: html

.. raw:: html

.. code:: python X = tf.random.uniform((2, 20)) net(X) [w.shape for w in net.get_weights()] .. parsed-literal:: :class: output [(20, 256), (256,), (256, 10), (10,)] .. raw:: html

.. raw:: html