.. _sec_ndarray: Thao tác dữ liệu ================ Để hoàn thành bất cứ điều gì, chúng ta cần một số cách để lưu trữ và thao tác dữ liệu. Nói chung, có hai điều quan trọng chúng ta cần làm với dữ liệu: (i) có được chúng; và (ii) xử lý chúng một khi chúng ở trong máy tính. Không có điểm nào trong việc thu thập dữ liệu mà không cần một cách nào đó để lưu trữ nó, vì vậy hãy để chúng tôi làm bẩn tay trước bằng cách chơi với dữ liệu tổng hợp. Để bắt đầu, chúng tôi giới thiệu mảng :math:`n` chiều, còn được gọi là \* tensor\*. Nếu bạn đã làm việc với NumPy, gói máy tính khoa học được sử dụng rộng rãi nhất trong Python, thì bạn sẽ thấy phần này quen thuộc. Cho dù bạn sử dụng khung nào, lớp tensor\* của nó\* (``ndarray`` trong MXNet, ``Tensor`` trong cả PyTorch và TensorFlow) tương tự như ``ndarray`` của NumPy với một vài tính năng giết người. Đầu tiên, GPU được hỗ trợ tốt để tăng tốc tính toán trong khi NumPy chỉ hỗ trợ tính toán CPU. Thứ hai, lớp tensor hỗ trợ sự khác biệt tự động. Những tính chất này làm cho lớp tensor phù hợp với học sâu. Trong suốt cuốn sách, khi chúng tôi nói hàng chục, chúng tôi đang đề cập đến các trường hợp của lớp tensor trừ khi có quy định khác. Bắt đầu ------- Trong phần này, chúng tôi mong muốn giúp bạn hoạt động, trang bị cho bạn các công cụ toán học và tính toán số cơ bản mà bạn sẽ xây dựng khi bạn tiến bộ qua cuốn sách. Đừng lo lắng nếu bạn đấu tranh để grok một số khái niệm toán học hoặc chức năng thư viện. Các phần sau đây sẽ xem xét lại tài liệu này trong bối cảnh các ví dụ thực tế và nó sẽ chìm vào. Mặt khác, nếu bạn đã có một số nền tảng và muốn đi sâu hơn vào nội dung toán học, chỉ cần bỏ qua phần này. .. raw:: html

.. raw:: html

Để bắt đầu, chúng tôi nhập các mô-đun ``np`` (``numpy``) và ``npx`` (``numpy_extension``) từ MXNet. Ở đây, mô-đun ``np`` bao gồm các chức năng được hỗ trợ bởi NumPy, trong khi mô-đun ``npx`` chứa một tập hợp các phần mở rộng được phát triển để trao quyền cho việc học sâu trong một môi trường giống như NumPy-like. Khi sử dụng hàng chục, chúng tôi hầu như luôn gọi hàm ``set_np``: đây là để tương thích xử lý tensor bởi các thành phần khác của MXNet. .. code:: python from mxnet import np, npx npx.set_np() .. raw:: html

.. raw:: html

Để bắt đầu, chúng tôi nhập ``torch``. Lưu ý rằng mặc dù nó được gọi là PyTorch, chúng ta nên nhập ``torch`` thay vì ``pytorch``. .. code:: python import torch .. raw:: html

.. raw:: html

Để bắt đầu, chúng tôi nhập ``tensorflow``. Vì tên dài một chút, chúng ta thường nhập nó với một bí danh ngắn ``tf``. .. code:: python import tensorflow as tf .. raw:: html

.. raw:: html

A tensor đại diện cho một mảng (có thể đa chiều) của các giá trị số. Với một trục, một tensor được gọi là *vector*. Với hai trục, một tensor được gọi là *matri*. Với :math:`k > 2` trục, chúng tôi thả các tên chuyên biệt và chỉ cần tham khảo đối tượng dưới dạng :math:`k^\mathrm{th}` *căng đơn hàng*. .. raw:: html