Descriptive and Inferential statistics là gì

Lĩnh vực thống kê được chia thành hai bộ phận chính: mô tả và suy luận. Mỗi phân đoạn này đều quan trọng, cung cấp các kỹ thuật khác nhau để hoàn thành các mục tiêu khác nhau. Thống kê mô tả mô tả những gì đang diễn ra trong một quần thể hoặc tập dữ liệu . Ngược lại, thống kê suy luận cho phép các nhà khoa học lấy các phát hiện từ một nhóm mẫu và tổng quát hóa chúng cho một nhóm dân số lớn hơn. Hai loại thống kê có một số khác biệt quan trọng.

Thống kê mô tả là loại thống kê có thể xuất hiện trong tâm trí hầu hết mọi người khi họ nghe từ “thống kê”. Trong nhánh thống kê này, mục tiêu là mô tả. Các thước đo số được sử dụng để cho biết về các tính năng của một tập hợp dữ liệu. Có một số mục thuộc phần này của thống kê, chẳng hạn như:

  • Giá trị trung bình hoặc số đo trung tâm của tập dữ liệu, bao gồm giá trị trung bình, trung vị, chế độ hoặc trung bình
  • Mức độ lan truyền của một tập dữ liệu, có thể được đo bằng phạm vi hoặc độ lệch chuẩn
  • Mô tả tổng thể về dữ liệu, chẳng hạn như tóm tắt năm số
  • Các phép đo như độ lệch và độ kurtosis
  • Khám phá các mối quan hệ và mối tương quan giữa các dữ liệu được ghép nối
  • Trình bày kết quả thống kê dưới dạng đồ thị

Những thước đo này rất quan trọng và hữu ích vì chúng cho phép các nhà khoa học nhìn thấy các mẫu giữa các dữ liệu và do đó hiểu được dữ liệu đó. Thống kê mô tả chỉ có thể được sử dụng để mô tả dân số hoặc tập dữ liệu đang nghiên cứu: Kết quả không thể được khái quát hóa cho bất kỳ nhóm hoặc dân số nào khác.

Có hai loại thống kê mô tả mà các nhà khoa học xã hội sử dụng:

Các thước đo về xu hướng trung tâm  nắm bắt các xu hướng chung trong dữ liệu và được tính toán và biểu thị dưới dạng giá trị trung bình, trung vị và chế độ. Một giá trị trung bình cho các nhà khoa học biết giá trị trung bình toán học của tất cả tập dữ liệu, chẳng hạn như tuổi trung bình của lần kết hôn đầu tiên; trung vị đại diện cho phần giữa của phân phối dữ liệu, như độ tuổi nằm ở giữa phạm vi độ tuổi mà mọi người kết hôn lần đầu; và, chế độ có thể là độ tuổi phổ biến nhất mà mọi người kết hôn lần đầu.

Các phép đo mức độ lan truyền mô tả cách dữ liệu được phân phối và liên quan với nhau, bao gồm:

  • Phạm vi, toàn bộ phạm vi giá trị có trong tập dữ liệu
  • Phân bố tần suất, xác định số lần một giá trị cụ thể xuất hiện trong một tập dữ liệu
  • Phần tư, nhóm con được hình thành trong tập dữ liệu khi tất cả các giá trị được chia thành bốn phần bằng nhau trong phạm vi
  • Độ lệch tuyệt đối trung bình , giá trị trung bình của mỗi giá trị sai lệch so với giá trị trung bình
  • Phương sai , minh họa mức độ chênh lệch tồn tại trong dữ liệu
  • Độ lệch chuẩn, minh họa sự trải rộng của dữ liệu so với giá trị trung bình

Các phép đo mức chênh lệch thường được biểu diễn trực quan trong bảng, biểu đồ hình tròn và thanh, và biểu đồ để hỗ trợ việc hiểu các xu hướng trong dữ liệu.

Thống kê suy luận được tạo ra thông qua các phép tính toán học phức tạp cho phép các nhà khoa học suy ra xu hướng về một dân số lớn hơn dựa trên nghiên cứu về một mẫu lấy từ nó. Các nhà khoa học sử dụng thống kê suy luận để kiểm tra mối quan hệ giữa các biến trong một mẫu và sau đó đưa ra các khái quát hóa hoặc dự đoán về cách các biến đó sẽ liên quan đến một dân số lớn hơn.

Thông thường không thể kiểm tra từng thành viên của quần thể một cách riêng lẻ. Vì vậy, các nhà khoa học chọn một tập hợp con đại diện của dân số, được gọi là mẫu thống kê, và từ phân tích này, họ có thể nói điều gì đó về dân số mà từ đó mẫu đó đến. Có hai phần chính của thống kê suy luận:

  • Khoảng tin cậy cung cấp một phạm vi giá trị cho một tham số chưa biết của tổng thể bằng cách đo một mẫu thống kê. Điều này được thể hiện dưới dạng khoảng thời gian và mức độ tin cậy rằng tham số nằm trong khoảng thời gian đó.
  • Kiểm tra ý nghĩa hoặc kiểm tra giả thuyết  trong đó các nhà khoa học đưa ra tuyên bố về dân số bằng cách phân tích một mẫu thống kê. Theo thiết kế, có một số điều không chắc chắn trong quá trình này. Điều này có thể được thể hiện ở mức độ ý nghĩa.

Các kỹ thuật mà các nhà khoa học xã hội sử dụng để kiểm tra mối quan hệ giữa các biến và do đó để tạo ra thống kê suy luận, bao gồm phân tích hồi quy tuyến tính, phân tích hồi quy logistic,  ANOVA ,  phân tích tương quan ,  mô hình phương trình cấu trúc và phân tích tỷ lệ sống sót. Khi tiến hành nghiên cứu bằng cách sử dụng thống kê suy luận, các nhà khoa học tiến hành kiểm tra mức độ quan trọng để xác định xem liệu họ có thể tổng quát hóa kết quả của mình cho một nhóm dân số lớn hơn hay không. Các phép thử phổ biến có ý nghĩa bao gồm kiểm định  chi bình phương  và  kiểm định t . Điều này cho các nhà khoa học biết xác suất mà kết quả phân tích mẫu của họ là đại diện cho toàn bộ dân số.

Mặc dù thống kê mô tả rất hữu ích trong việc tìm hiểu những thứ như mức độ lan truyền và trung tâm của dữ liệu, nhưng không có gì trong thống kê mô tả có thể được sử dụng để thực hiện bất kỳ khái quát nào. Trong thống kê mô tả, các phép đo như giá trị trung bình và độ lệch chuẩn được nêu dưới dạng số chính xác.

Mặc dù thống kê suy luận sử dụng một số phép tính tương tự - chẳng hạn như giá trị trung bình và độ lệch chuẩn - trọng tâm là khác nhau đối với thống kê suy luận. Thống kê suy diễn bắt đầu với một mẫu và sau đó tổng quát hóa thành một tập hợp. Thông tin này về dân số không được nêu dưới dạng số. Thay vào đó, các nhà khoa học biểu thị các thông số này dưới dạng một loạt các con số tiềm năng, cùng với mức độ tin cậy.

Descriptive and Inferential statistics là gì
Sự khác biệt giữa thống kê mô tả và thống kê tham khảo - Khoa HọC

Thống kê mô tả và tham khảo

Thống kê là bộ môn thu thập, phân tích và trình bày dữ liệu. Lý thuyết thống kê được chia thành hai nhánh trên cơ sở thông tin mà chúng tạo ra bằng cách phân tích dữ liệu.

Thống kê mô tả là gì?

Thống kê mô tả là nhánh thống kê mô tả các thuộc tính chính của tập dữ liệu một cách định lượng. Để biểu diễn các thuộc tính của tập dữ liệu một cách chính xác nhất có thể, dữ liệu được tóm tắt bằng cách sử dụng các công cụ đồ họa hoặc số.

Việc tóm tắt bằng đồ thị được thực hiện bằng cách lập bảng, nhóm và vẽ biểu đồ các giá trị của các biến quan tâm. Biểu đồ phân phối tần số và biểu đồ phân phối tần số tương đối là những đại diện như vậy. Chúng mô tả sự phân bố các giá trị trong toàn bộ dân số.

Việc tóm tắt số liên quan đến các thước đo mô tả tính toán như giá trị trung bình, chế độ và giá trị trung bình. Các biện pháp mô tả được phân loại thêm thành hai lớp; chúng là thước đo của xu hướng trung tâm và thước đo của sự phân tán / biến đổi. Các thước đo của xu hướng trung tâm là trung bình / trung bình, trung vị và chế độ. Mỗi loại đều có mức độ ứng dụng và hữu ích riêng. Trường hợp một cái có thể thất bại, cái kia có thể đại diện cho tập dữ liệu tốt hơn.


Như tên của nó, các phép đo phân tán liên quan đến việc đo lường sự phân bố của dữ liệu. Phạm vi, độ lệch chuẩn, phương sai, tỷ lệ phần trăm và phạm vi phần tư, và hệ số biến thiên là các thước đo phân tán. Chúng cung cấp thông tin về sự lan truyền của dữ liệu.

Một ví dụ đơn giản về việc sử dụng thống kê mô tả là tính điểm trung bình của một học sinh. Về bản chất, GPA là giá trị trung bình của kết quả học tập của học sinh và là sự phản ánh kết quả học tập tổng thể của học sinh cụ thể đó.

Thống kê tham chiếu là gì?

Thống kê tham chiếu là nhánh của thống kê, đưa ra kết luận về dân số liên quan từ tập dữ liệu thu được từ một mẫu có các biến thể ngẫu nhiên, quan sát và lấy mẫu. Nói chung, kết quả thu được từ một mẫu ngẫu nhiên của tổng thể và các kết luận thu được từ mẫu sau đó được tổng quát hóa để đại diện cho toàn bộ tổng thể.

Mẫu là một tập hợp con của tổng thể và các phép đo thống kê mô tả cho dữ liệu thu được từ mẫu được gọi đơn giản là số liệu thống kê. Các thước đo thống kê mô tả thu được từ việc phân tích mẫu được gọi là các tham số khi áp dụng cho tổng thể và chúng đại diện cho toàn bộ tổng thể.


Thống kê tham chiếu tập trung vào cách tổng quát các số liệu thống kê thu được từ một mẫu càng chính xác càng tốt để đại diện cho dân số. Một yếu tố cần quan tâm là bản chất của mẫu. Nếu mẫu bị sai lệch, thì kết quả cũng bị sai lệch và các tham số dựa trên những thông số này không đại diện chính xác cho toàn bộ tổng thể. Do đó, lấy mẫu là một trong những nghiên cứu quan trọng của thống kê suy luận. Các giả định thống kê, Lý thuyết quyết định thống kê và lý thuyết ước lượng, kiểm định giả thuyết, thiết kế thí nghiệm, phân tích phương sai và phân tích hồi quy là những chủ đề nghiên cứu nổi bật trong lý thuyết thống kê suy luận.

Một ví dụ điển hình của thống kê suy luận trong thực tế là dự đoán kết quả của một cuộc bầu cử trước khi bỏ phiếu bằng phương thức bỏ phiếu.

Sự khác biệt giữa Thống kê mô tả và Thống kê tham chiếu là gì?

• Thống kê mô tả tập trung vào việc tóm tắt dữ liệu thu thập được từ một mẫu. Kỹ thuật này tạo ra các thước đo về xu hướng trung tâm và độ phân tán thể hiện cách các giá trị của các biến được tập trung và phân tán.


• Thống kê tham chiếu tổng quát các số liệu thống kê thu được từ một mẫu thành tổng thể chung mà mẫu đó thuộc về. Các thước đo của dân số được gọi là các tham số.

• Thống kê mô tả chỉ thực hiện tóm tắt các đặc tính của mẫu mà từ đó dữ liệu được thu thập, nhưng trong thống kê suy diễn, thước đo từ mẫu được sử dụng để suy ra các thuộc tính của tổng thể.

• Trong thống kê dạng suy luận, các tham số được lấy từ một mẫu chứ không phải toàn bộ tổng thể; do đó, luôn tồn tại một số độ không đảm bảo so với giá trị thực.