Đường trung bình động tích hợp tự hồi quy (ARIMA) là gì?

Đường trung bình động tích hợp tự hồi quy, hay ARIMA, là mô hình phân tích thống kê sử dụng dữ liệu chuỗi thời gian để hiểu rõ hơn về tập dữ liệu hoặc để dự đoán xu hướng trong tương lai.

Một mô hình thống kê có tính tự hồi quy nếu nó dự đoán các giá trị trong tương lai dựa trên các giá trị trong quá khứ. Ví dụ: mô hình ARIMA có thể tìm cách dự đoán giá tương lai của cổ phiếu dựa trên hiệu suất trong quá khứ của nó hoặc dự báo thu nhập của công ty dựa trên các giai đoạn trong quá khứ.

Bài học chính

  • Các mô hình trung bình di chuyển tích hợp tự hồi quy (ARIMA) dự đoán các giá trị trong tương lai dựa trên các giá trị trong quá khứ.
  • ARIMA sử dụng các đường trung bình động có độ trễ để làm mượt dữ liệu chuỗi thời gian.
  • Chúng được sử dụng rộng rãi trong phân tích kỹ thuật để dự báo giá chứng khoán trong tương lai.
  • Các mô hình tự hồi quy ngầm cho rằng tương lai sẽ giống với quá khứ.
  • Do đó, chúng có thể tỏ ra không chính xác trong một số điều kiện thị trường nhất định, chẳng hạn như khủng hoảng tài chính hoặc thời kỳ thay đổi công nghệ nhanh chóng.

Hiểu về đường trung bình động tích hợp tự hồi quy (ARIMA)

Mô hình trung bình di chuyển tích hợp tự hồi quy là một dạng phân tích hồi quy để đo cường độ của một biến phụ thuộc so với các biến thay đổi khác. Mục tiêu của mô hình là dự đoán các chuyển động của thị trường tài chính hoặc chứng khoán trong tương lai bằng cách kiểm tra sự khác biệt giữa các giá trị trong chuỗi thay vì thông qua các giá trị thực tế.

Một mô hình ARIMA có thể được hiểu bằng cách phác thảo từng thành phần của nó như sau:

  • Tự hồi quy (AR) : đề cập đến một mô hình hiển thị một biến thay đổi hồi quy theo các giá trị trễ hoặc trước đó của chính nó.
  • Tích hợp (I) : biểu thị sự khác biệt của các quan sát thô để cho phép chuỗi thời gian trở nên dừng (nghĩa là các giá trị dữ liệu được thay thế bằng chênh lệch giữa các giá trị dữ liệu và các giá trị trước đó).
  • Đường trung bình động (MA) : kết hợp sự phụ thuộc giữa một quan sát và sai số dư từ mô hình trung bình động áp dụng cho các quan sát có độ trễ.

Thông số ARIMA

Mỗi thành phần trong ARIMA hoạt động như một tham số có ký hiệu chuẩn. Đối với các mô hình ARIMA, ký hiệu tiêu chuẩn sẽ là ARIMA với p, d và q, trong đó các giá trị nguyên thay thế cho các tham số để chỉ ra loại mô hình ARIMA được sử dụng. Các tham số có thể được định nghĩa là:

  • p : số lượng quan sát độ trễ trong mô hình hay còn gọi là thứ tự độ trễ.
  • d : số lần các quan sát thô khác nhau; còn được gọi là mức độ khác biệt.
  • q: kích thước của cửa sổ trung bình động, còn được gọi là thứ tự của đường trung bình động.

Ví dụ, mô hình hồi quy tuyến tính bao gồm số lượng và loại thuật ngữ. Giá trị bằng 0 (0), có thể được sử dụng làm tham số, có nghĩa là thành phần cụ thể đó không nên được sử dụng trong mô hình. Bằng cách này, mô hình ARIMA có thể được xây dựng để thực hiện chức năng của mô hình ARMA hoặc thậm chí là các mô hình AR, I hoặc MA đơn giản.

Vì các mô hình ARIMA phức tạp và hoạt động tốt nhất trên các tập dữ liệu rất lớn nên các thuật toán máy tính và kỹ thuật học máy được sử dụng để tính toán chúng.

ARIMA và dữ liệu cố định

Trong mô hình trung bình di chuyển tích hợp tự hồi quy, dữ liệu được thay đổi để làm cho nó đứng yên. Một mô hình cho thấy tính dừng là một mô hình cho thấy dữ liệu có tính không đổi theo thời gian. Hầu hết dữ liệu kinh tế và thị trường đều cho thấy xu hướng, vì vậy mục đích của sự khác biệt là loại bỏ mọi xu hướng hoặc cấu trúc theo mùa.

Tính thời vụ hoặc khi dữ liệu hiển thị các mô hình thường xuyên và có thể dự đoán được lặp lại trong một năm dương lịch, có thể ảnh hưởng tiêu cực đến mô hình hồi quy. Nếu một xu hướng xuất hiện và tính dừng không rõ ràng thì nhiều phép tính trong suốt quá trình không thể được thực hiện và mang lại kết quả như mong đợi.

Cú sốc một lần sẽ ảnh hưởng vô hạn đến các giá trị tiếp theo của mô hình ARIMA trong tương lai. Do đó, di sản của cuộc khủng hoảng tài chính vẫn tồn tại trong các mô hình tự hồi quy ngày nay.

Cách xây dựng mô hình ARIMA

Để bắt đầu xây dựng mô hình ARIMA cho khoản đầu tư, bạn tải xuống càng nhiều dữ liệu giá càng tốt. Khi bạn đã xác định được xu hướng của dữ liệu, bạn xác định thứ tự chênh lệch thấp nhất (d) bằng cách quan sát các mối tương quan tự động. Nếu tự tương quan lag-1 bằng 0 hoặc âm thì chuỗi đã sai phân. Bạn có thể cần phải chênh lệch chuỗi nhiều hơn nếu độ trễ-1 cao hơn 0.

Tiếp theo, xác định thứ tự hồi quy (p) và thứ tự của đường trung bình động (q) bằng cách so sánh tự tương quan và tự tương quan một phần. Sau khi có thông tin cần thiết, bạn có thể chọn kiểu máy mình sẽ sử dụng.

Ưu và nhược điểm của ARIMA

Các mô hình ARIMA có những điểm mạnh và có khả năng dự báo tốt dựa trên hoàn cảnh trong quá khứ, nhưng có nhiều lý do hơn để thận trọng khi sử dụng ARIMA. Ngược lại hoàn toàn với tuyên bố từ chối trách nhiệm đầu tư nêu rõ “hiệu suất trong quá khứ không phải là chỉ số cho hiệu suất trong tương lai…”, mô hình ARIMA giả định rằng các giá trị trong quá khứ có một số tác động còn lại đối với giá trị hiện tại hoặc tương lai và sử dụng dữ liệu từ quá khứ để dự báo các sự kiện trong tương lai.

Bảng sau liệt kê các đặc điểm ARIMA khác thể hiện các đặc điểm tốt và xấu.

Ưu điểm

  • Tốt cho dự báo ngắn hạn

  • Chỉ cần dữ liệu lịch sử

  • Mô hình dữ liệu không cố định

Nhược điểm

  • Không được xây dựng để dự báo dài hạn

  • Kém dự đoán các bước ngoặt

  • Đắt tiền

  • Các thông số mang tính chủ quan

ARIMA được sử dụng để làm gì?

ARIMA là một phương pháp dự báo hoặc dự đoán kết quả trong tương lai dựa trên chuỗi thời gian lịch sử. Nó dựa trên khái niệm thống kê về mối tương quan nối tiếp, trong đó các điểm dữ liệu trong quá khứ ảnh hưởng đến các điểm dữ liệu trong tương lai.

Sự khác biệt giữa mô hình tự hồi quy và mô hình trung bình động là gì?

ARIMA kết hợp các tính năng tự hồi quy với các tính năng của đường trung bình động. Ví dụ: quy trình tự hồi quy AR(1) là quy trình trong đó giá trị hiện tại dựa trên giá trị ngay trước đó, trong khi quy trình AR(2) là quy trình trong đó giá trị hiện tại dựa trên hai giá trị trước đó. Trung bình động là một phép tính được sử dụng để phân tích các điểm dữ liệu bằng cách tạo ra một chuỗi giá trị trung bình của các tập hợp con khác nhau của toàn bộ dữ liệu để làm giảm bớt ảnh hưởng của các giá trị ngoại lệ. Nhờ sự kết hợp các kỹ thuật này, các mô hình ARIMA có thể tính đến các xu hướng, chu kỳ, tính thời vụ và các loại dữ liệu không tĩnh khác khi đưa ra dự báo.

Dự báo ARIMA hoạt động như thế nào?

Dự báo ARIMA đạt được bằng cách cắm dữ liệu chuỗi thời gian cho biến quan tâm. Phần mềm thống kê sẽ xác định số lượng độ trễ hoặc mức độ khác biệt thích hợp để áp dụng cho dữ liệu và kiểm tra tính dừng. Sau đó, nó sẽ đưa ra kết quả, thường được hiểu tương tự như kết quả của mô hình hồi quy tuyến tính bội.

Điểm mấu chốt

Mô hình ARIMA được sử dụng như một công cụ dự báo để dự đoán điều gì đó sẽ diễn ra như thế nào trong tương lai dựa trên hiệu suất trong quá khứ. Nó được sử dụng trong phân tích kỹ thuật để dự đoán hiệu suất trong tương lai của tài sản.

Mô hình ARIMA nhìn chung không phù hợp để dự báo dài hạn, chẳng hạn như dự báo hơn sáu tháng tới, vì nó sử dụng dữ liệu và thông số trong quá khứ bị ảnh hưởng bởi suy nghĩ của con người. Vì lý do này, nó được sử dụng tốt nhất cùng với các công cụ phân tích kỹ thuật khác để có được bức tranh rõ ràng hơn về hiệu suất của tài sản.