.. _sec_anchor: Hộp neo ======= Thuật toán phát hiện đối tượng thường lấy mẫu một số lượng lớn các vùng trong hình ảnh đầu vào, xác định xem các vùng này có chứa các đối tượng quan tâm hay không, và điều chỉnh ranh giới của các vùng để dự đoán *hộp giới hạn đất-truth* of the objects các đối tượng more accurately chính xác. Các mô hình khác nhau có thể áp dụng các sơ đồ lấy mẫu khu vực khác nhau. Ở đây chúng tôi giới thiệu một trong những phương pháp như vậy: nó tạo ra nhiều hộp giới hạn với tỷ lệ khác nhau và tỷ lệ khung hình tập trung vào mỗi pixel. Các hộp giới hạn này được gọi là hộp neo \*. Chúng tôi sẽ thiết kế một mô hình phát hiện đối tượng dựa trên các hộp neo trong :numref:`sec_ssd`. Đầu tiên, chúng ta hãy sửa đổi độ chính xác in ấn chỉ để kết quả đầu ra ngắn gọn hơn. .. raw:: html

.. raw:: html

.. code:: python %matplotlib inline from mxnet import gluon, image, np, npx from d2l import mxnet as d2l np.set_printoptions(2) # Simplify printing accuracy npx.set_np() .. raw:: html

.. raw:: html

.. code:: python %matplotlib inline import torch from d2l import torch as d2l torch.set_printoptions(2) # Simplify printing accuracy .. raw:: html

.. raw:: html

Tạo nhiều hộp neo ----------------- Giả sử hình ảnh đầu vào có chiều cao :math:`h` và chiều rộng :math:`w`. Chúng tôi tạo ra các hộp neo với các hình dạng khác nhau tập trung vào từng pixel của hình ảnh. Hãy để *quy mô* là :math:`s\in (0, 1]` và tỷ lệ khung hình\* (tỷ lệ chiều rộng trên chiều cao) là :math:`r > 0`. Sau đó chiều rộng và chiều cao của hộp neo là :math:`ws\sqrt{r}` và :math:`hs/\sqrt{r}`, tôn trọng. Lưu ý rằng khi vị trí trung tâm được đưa ra, một hộp neo có chiều rộng và chiều cao đã biết được xác định. Để tạo ra nhiều hộp neo với các hình dạng khác nhau, chúng ta hãy đặt một loạt các thang đo :math:`s_1,\ldots, s_n` và một loạt các tỷ lệ khung hình :math:`r_1,\ldots, r_m`. Khi sử dụng tất cả các kết hợp của các thang đo và tỷ lệ khung hình này với mỗi pixel làm trung tâm, hình ảnh đầu vào sẽ có tổng cộng :math:`whnm` hộp neo. Mặc dù các hộp neo này có thể bao gồm tất cả các hộp giới hạn sự thật mặt đất, độ phức tạp tính toán dễ dàng quá cao. Trong thực tế, chúng ta chỉ có thể xem xét những kết hợp chứng :math:`s_1` hoặc :math:`r_1`: .. math:: (s_1, r_1), (s_1, r_2), \ldots, (s_1, r_m), (s_2, r_1), (s_3, r_1), \ldots, (s_n, r_1). Điều đó có nghĩa là, số lượng hộp neo tập trung vào cùng một điểm ảnh là :math:`n+m-1`. Đối với toàn bộ hình ảnh đầu vào, chúng tôi sẽ tạo tổng cộng :math:`wh(n+m-1)` hộp neo. Phương pháp tạo hộp neo trên được thực hiện trong chức năng ``multibox_prior`` sau đây. Chúng tôi chỉ định hình ảnh đầu vào, danh sách các thang đo và danh sách các tỷ lệ khung hình, sau đó chức năng này sẽ trả về tất cả các hộp neo. .. raw:: html