
Độ lệch: Độ lệch dương và âm được xác định bằng công thức
Độ lệch là gì?
Độ lệch là thước đo độ biến dạng của phân bố đối xứng hoặc tính bất đối xứng trong tập dữ liệu. Độ lệch được thể hiện trên đường cong hình chuông khi các điểm dữ liệu không được phân bố đối xứng ở bên trái và bên phải của đường trung tuyến trên đường cong hình chuông. Nếu đường cong hình chuông dịch chuyển sang trái hoặc sang phải thì được gọi là bị lệch.
Độ lệch có thể được định lượng dưới dạng đại diện cho mức độ mà một phân phối nhất định thay đổi so với phân phối chuẩn. Ví dụ, một phân phối chuẩn có độ lệch bằng 0, trong khi phân phối logic chuẩn sẽ thể hiện một số độ lệch phải.
Bài học chính
- Độ lệch là mức độ bất đối xứng được quan sát thấy trong phân bố xác suất.
- Phân phối có thể thể hiện độ lệch phải (dương) hoặc độ lệch trái (âm) ở các mức độ khác nhau. Phân phối chuẩn (đường cong hình chuông) thể hiện độ lệch bằng không.
- Các nhà đầu tư lưu ý đến độ lệch phải khi đánh giá phân bổ lợi nhuận vì nó thể hiện tốt hơn các điểm cực trị của tập dữ liệu thay vì chỉ tập trung vào mức trung bình.
- Độ lệch thông báo cho người dùng về hướng của các ngoại lệ, mặc dù nó không cho người dùng biết con số xảy ra.
- Độ lệch thường được tìm thấy trong lợi nhuận thị trường chứng khoán cũng như sự phân bổ thu nhập trung bình của mỗi cá nhân.


Investopedia / Theresa Chiechi
Hiểu về độ lệch
Có một số loại phân phối và độ lệch khác nhau. Phần đuôi hoặc chuỗi các điểm dữ liệu cách xa điểm trung vị bị ảnh hưởng theo cả độ lệch dương và âm. Độ lệch âm đề cập đến phần đuôi dài hơn hoặc béo hơn ở phía bên trái của phân phối, trong khi độ lệch dương đề cập đến phần đuôi dài hơn hoặc béo hơn ở bên phải. Hai độ lệch này đề cập đến hướng hoặc trọng lượng của phân phối.
Ngoài ra, một phân phối có thể có độ lệch bằng 0. Độ lệch bằng 0 xảy ra khi biểu đồ dữ liệu đối xứng. Bất kể đuôi phân phối dài hay mập, độ lệch bằng 0 biểu thị phân phối dữ liệu bình thường. Một tập dữ liệu cũng có thể có độ lệch không xác định nếu dữ liệu không cung cấp đủ thông tin về sự phân bố của nó.
Giá trị trung bình của dữ liệu có độ lệch dương sẽ lớn hơn giá trị trung vị. Trong phân bố có độ lệch âm, trường hợp hoàn toàn ngược lại: giá trị trung bình của dữ liệu có độ lệch âm sẽ nhỏ hơn giá trị trung bình. Nếu đồ thị dữ liệu đối xứng, phân phối có độ lệch bằng 0, bất kể đuôi dài hay mập.
Ba phân bố xác suất được mô tả bên dưới bị lệch dương (hoặc lệch phải) ở mức độ ngày càng tăng. Phân phối lệch âm còn được gọi là phân phối lệch trái.


Độ lệch được sử dụng cùng với độ nhọn để đánh giá tốt hơn khả năng xảy ra các sự kiện nằm ở đuôi của phân bố xác suất.
Đo độ lệch
Có một số cách để đo độ lệch. Hệ số độ lệch thứ nhất và thứ hai của Pearson là hai phương pháp phổ biến. Hệ số độ lệch đầu tiên của Pearson, hay độ lệch của chế độ Pearson, trừ đi chế độ khỏi giá trị trung bình và chia chênh lệch cho độ lệch chuẩn. Hệ số độ lệch thứ hai của Pearson, hay độ lệch trung bình Pearson, trừ giá trị trung bình khỏi giá trị trung bình, nhân chênh lệch với ba và chia kết quả cho độ lệch chuẩn.
Công thức tính độ lệch Pearson
S k 1 = X ˉ − M ồ S S k 2 = 3 ( X − M d ) S
Ở đâu:
S k 1 = Hệ số độ lệch thứ nhất của Pearson và S k 2
thư hai
S = Độ lệch chuẩn của mẫu
X ˉ = Là giá trị trung bình
M ồ = Giá trị phương thức (chế độ)
M d = Là giá trị trung bình
begin{aligned}&qquadqquadqquadquadfrac{Sk_1=frac{bar{X}-Mo}{s}}{Sk_2=frac{3(X-Md)}{s} }&textbf{where:}&Sk_1=text{Hệ số độ lệch đầu tiên của Pearson và } Sk_2&qquadquadtext{thứ hai}&s=text{Độ lệch chuẩn của sample}&bar{X}=text{Là giá trị trung bình}&Mo=text{Giá trị phương thức (chế độ)}&Md=text{Là giá trị trung bình}end{căn chỉnh}
Sk _ 2 = S 3 ( X − Md ) _Sk _ 1 = S X ˉ − M oỞ đâu:Sk _ 1 = Hệ số độ lệch thứ nhất của Pearson và S k 2thư haiS = Độ lệch chuẩn của mẫuX ˉ = Là giá trị trung bìnhMồ _ = Giá trị phương thức (chế độ)Md _ = Là giá trị trung bình
Hệ số độ lệch đầu tiên của Pearson rất hữu ích nếu dữ liệu thể hiện chế độ mạnh. Nếu dữ liệu có chế độ yếu hoặc nhiều chế độ, hệ số thứ hai của Pearson có thể thích hợp hơn vì nó không dựa vào chế độ như thước đo xu hướng trung tâm.
Độ lệch cho bạn biết nơi xuất hiện các ngoại lệ, mặc dù nó không cho bạn biết có bao nhiêu ngoại lệ xảy ra.
Các loại độ lệch
Như đã lưu ý ở trên, độ lệch đo lường tính bất đối xứng trong tập dữ liệu và thường được hiển thị trên đường cong hình chuông. Phân phối bình thường có độ lệch bằng không. Điều này có nghĩa là sự phân phối sẽ đối xứng xung quanh giá trị trung bình. Phải nói rằng, có những trường hợp độ lệch không đối xứng. Trong những trường hợp này, nó có thể là tích cực hoặc tiêu cực. Dưới đây, chúng tôi nhấn mạnh ý nghĩa của từng loại độ lệch.
Độ lệch tích cực
Một phân phối bị lệch dương khi đuôi của nó ở bên phải rõ ràng hơn ở bên trái. Vì phân phối là dương nên giả định giá trị của nó là dương. Như vậy, hầu hết các giá trị đều nằm ngoài giá trị trung bình. Điều này có nghĩa là các giá trị cực trị nhất nằm ở phía bên phải. Với tư cách là một nhà đầu tư, bạn có thể thấy rằng mình có một số khoản lỗ nhỏ với độ lệch dương. Nhưng cuối cùng bạn cũng có thể nhận được những lợi ích lớn – mặc dù ít hơn.
Độ lệch âm
Mặt khác, độ lệch tiêu cực xảy ra khi đuôi nổi rõ ở bên trái hơn là bên phải. Ngược lại với độ lệch dương, hầu hết các giá trị được tìm thấy ở phía bên phải của giá trị trung bình khi nói đến độ lệch âm. Như vậy, các giá trị cực trị nhất được tìm thấy xa hơn về phía bên trái. Việc có độ lệch âm có thể cho thấy rằng bạn có thể mong đợi một số lợi nhuận nhỏ ở đây và ở đó. Nhưng nhìn chung, bạn có thể mong đợi sẽ thấy một vài khoản lỗ lớn ở chỗ này chỗ kia với tư cách là một nhà đầu tư.
Sự lệch lạc cho bạn biết điều gì?
Các nhà đầu tư lưu ý đến độ lệch khi đánh giá phân bổ lợi nhuận vì nó, giống như độ nhọn, xem xét các điểm cực trị của tập dữ liệu thay vì chỉ tập trung vào mức trung bình. Các nhà đầu tư ngắn hạn và trung hạn nói riêng cần phải xem xét các điểm cực đoan vì họ ít có khả năng giữ một vị thế đủ lâu để tin tưởng rằng mức trung bình sẽ tự giải quyết.
Các nhà đầu tư thường sử dụng độ lệch chuẩn để dự đoán lợi nhuận trong tương lai, nhưng độ lệch chuẩn giả định có phân phối chuẩn. Vì một số phân phối lợi nhuận gần bằng mức bình thường nên độ lệch là thước đo tốt hơn để làm cơ sở cho các dự đoán hiệu suất. Điều này là do rủi ro sai lệch.
Rủi ro về độ lệch là nguy cơ gia tăng khi xuất hiện một điểm dữ liệu có độ lệch cao trong một phân phối bị lệch. Nhiều mô hình tài chính cố gắng dự đoán hiệu quả hoạt động trong tương lai của một tài sản giả định phân phối chuẩn, trong đó thước đo xu hướng trung tâm là bằng nhau. Nếu dữ liệu bị sai lệch, loại mô hình này sẽ luôn đánh giá thấp rủi ro sai lệch trong dự đoán của nó. Dữ liệu càng sai lệch thì mô hình tài chính này sẽ càng kém chính xác.


Hình ảnh của Julie Bang © Investopedia 2020
Ví dụ về phân phối lệch
Sự thay đổi lợi nhuận thông thường đã được quan sát thấy với tần suất nhiều hơn trong hai thập kỷ qua, bắt đầu từ bong bóng internet vào cuối những năm 1990. Trên thực tế, lợi nhuận tài sản có xu hướng ngày càng lệch phải. Sự biến động này xảy ra cùng với các sự kiện đáng chú ý, chẳng hạn như vụ tấn công khủng bố ngày 11 tháng 9, vụ sụp đổ bong bóng nhà đất và cuộc khủng hoảng tài chính tiếp theo cũng như trong những năm thực hiện nới lỏng định lượng (QE).
Thị trường chứng khoán rộng thường được coi là có sự phân phối sai lệch âm. Quan niệm cho rằng thị trường thường mang lại một khoản lợi nhuận dương nhỏ thường xuyên hơn là một khoản lỗ âm lớn. Tuy nhiên, các nghiên cứu đã chỉ ra rằng vốn chủ sở hữu của một công ty riêng lẻ có thể có xu hướng bị lệch trái.
Một ví dụ phổ biến về độ lệch là sự phân bổ thu nhập hộ gia đình ở Hoa Kỳ, vì các cá nhân ít có khả năng kiếm được thu nhập hàng năm rất cao. Ví dụ: hãy xem xét số liệu thống kê thu nhập hộ gia đình năm 2020. Nhóm thu nhập thấp nhất dao động từ 0 USD đến 27.026 USD, trong khi nhóm thu nhập cao nhất dao động từ 85.077 USD đến 141.110 USD. Với nhóm ngũ vị phân cao nhất lớn hơn gấp đôi so với nhóm thấp nhất, các điểm dữ liệu của người có thu nhập cao hơn sẽ bị phân tán nhiều hơn và gây ra sự phân phối có độ lệch dương.
Sự lệch lạc cho chúng ta biết điều gì?
Độ lệch cho chúng ta biết hướng của các ngoại lệ. Ở độ nghiêng dương, đuôi của đường cong phân phối dài hơn ở phía bên phải. Điều này có nghĩa là các giá trị ngoại lệ của đường cong phân phối nằm xa hơn về phía bên phải và gần với giá trị trung bình ở bên trái hơn. Độ lệch không cho biết số lượng ngoại lệ; nó chỉ truyền đạt hướng của các ngoại lệ.
Nguyên nhân gây ra sự lệch lạc?
Độ lệch chỉ đơn giản là sự phản ánh của một tập dữ liệu trong đó hoạt động được cô đọng nhiều ở một phạm vi và ít cô đọng hơn ở phạm vi khác. Hãy tưởng tượng điểm số được đo tại một cuộc thi nhảy xa Olympic. Nhiều vận động viên nhảy cầu có thể sẽ tiếp đất ở khoảng cách xa hơn, trong khi số ít hơn sẽ có khả năng tiếp đất ở khoảng cách ngắn. Điều này thường tạo ra sự phân bố lệch phải. Do đó, mối quan hệ giữa các điểm dữ liệu và tần suất chúng xuất hiện gây ra sự sai lệch.
Độ lệch có bình thường không?
Độ lệch thường được tìm thấy khi phân tích tập dữ liệu, vì có những tình huống xảy ra trong đó độ lệch chỉ đơn giản là một thành phần của tập dữ liệu đang được phân tích. Ví dụ, hãy xem xét tuổi thọ trung bình của con người. Vì hầu hết mọi người có xu hướng chết sau khi đến tuổi già, nên tương đối ít người có xu hướng qua đời khi họ còn trẻ. Trong trường hợp này, độ lệch được mong đợi và bình thường.
Độ lệch cao có nghĩa là gì?
Độ lệch cao có nghĩa là đường cong phân phối có đuôi ngắn hơn ở một đầu, đường cong phân phối có đuôi dài ở đầu kia. Tập dữ liệu tuân theo đường cong phân phối chuẩn; tuy nhiên, dữ liệu có độ lệch cao hơn có nghĩa là dữ liệu không được phân bổ đồng đều. Các điểm dữ liệu thiên về một phía của phân phối do tính chất của dữ liệu cơ bản.
Điểm mấu chốt
Độ lệch là một thước đo thống kê được sử dụng để cho biết liệu phân phối có bị biến dạng hay không đối xứng hay không. Nếu độ lệch là đuôi phải (có nghĩa là đuôi bên phải rõ hơn đuôi bên trái) thì độ lệch là dương. Trong trường hợp này, các giá trị lớn hơn 0. Nếu điều ngược lại là đúng và phần đuôi rõ ràng hơn ở bên trái thì độ lệch là âm, trong đó các giá trị nhỏ hơn 0.