Thống kê là một khoa học phức tạp về đo lường và phân tích dữ liệu khác nhau. Như trong nhiều ngành khác, khái niệm về một giả thuyết tồn tại trong ngành này. Do đó, một giả thuyết trong thống kê là một vị trí phải được chấp nhận hoặc từ chối. Hơn nữa, trong ngành công nghiệp này có một số loại giả định như vậy, tương tự theo định nghĩa, nhưng khác nhau trong thực tế. Giả thuyết khống là đối tượng nghiên cứu ngày nay.
Từ chung đến cụ thể: các giả thuyết trong thống kê
Một điều khác, không kém phần quan trọng, rời khỏi định nghĩa cơ bản của các giả định - giả thuyết thống kê là nghiên cứu về tổng thể các đối tượng quan trọng đối với khoa học, trong đó các nhà khoa học đưa ra kết luận. Nó có thể được kiểm tra bằng cách sử dụng một mẫu (một phần của dân số). Dưới đây là một số ví dụ về các giả thuyết thống kê:
1. Hiệu suất của cả lớp có thể phụ thuộc vào trình độ học vấn của từng học sinh.
2. Khóa học ban đầu của toán học được tiếp thu như nhau bởi cả hai đứa trẻ đến trường lúc 6 tuổi và những đứa trẻ lên 7.
Trong thống kê, một giả thuyết đơn giản được gọi là một giả định như vậy, đặc trưng duy nhất một tham số nhất định của một đại lượng được thực hiện bởi một nhà khoa học.
Phức tạp bao gồm một số hoặc một số lượng vô hạn của đơn giản. Chỉ ra một khu vực nhất định hoặc không phải là một câu trả lời chính xác.
Rất hữu ích để hiểu một số định nghĩa về các giả thuyết trong thống kê để không nhầm lẫn chúng trong thực tế.
Khái niệm về giả thuyết null
Giả thuyết khống là một lý thuyết cho rằng có một số hai tập hợp không khác nhau. Tuy nhiên, ở cấp độ khoa học không có khái niệm "không khác biệt", nhưng có "sự giống nhau của chúng là số không". Từ định nghĩa này, khái niệm đã được hình thành. Trong thống kê, giả thuyết null được chỉ định là H0. Hơn nữa, giá trị cực đoan của điều không thể (không thể) được coi là từ 0,01 đến 0,05 hoặc ít hơn.
Tốt hơn là nên hiểu giả thuyết null là gì, một ví dụ từ cuộc sống sẽ giúp ích. Giáo viên tại trường đại học cho rằng mức độ chuẩn bị khác nhau của sinh viên của hai nhóm đối với công việc kiểm tra là do các thông số không đáng kể, lý do ngẫu nhiên không ảnh hưởng đến trình độ học vấn chung (sự khác biệt trong chuẩn bị của hai nhóm sinh viên là bằng 0).
Tuy nhiên, đáng để đưa ra một ví dụ về một giả thuyết thay thế - một giả định bác bỏ tuyên bố của lý thuyết số không (H1). Ví dụ: giám đốc của trường đại học cho rằng mức độ khác nhau trong việc chuẩn bị cho bài kiểm tra cho sinh viên của hai nhóm là do giáo viên sử dụng các phương pháp giảng dạy khác nhau (sự khác biệt trong cách chuẩn bị của hai nhóm là có ý nghĩa và có lời giải thích).
Bây giờ bạn có thể thấy ngay sự khác biệt giữa các khái niệm về giả thuyết null null và giả thuyết thay thế khác. Các ví dụ minh họa các khái niệm này.
Kiểm định giả thuyết
Để tạo ra một giả định là một nửa rắc rối. Một thách thức thực sự cho người mới bắt đầu là kiểm tra giả thuyết null. Đây là nơi mà nhiều người mong đợi khó khăn.
Sử dụng phương pháp giả thuyết thay thế, tuyên bố ngược lại với lý thuyết bằng không, bạn có thể so sánh cả hai tùy chọn và chọn phương án đúng. Đây là cách thống kê làm việc.
Đặt giả thuyết null H0 và H1 thay thế, sau đó:
H0: c = c0;
H1: c c0.
Ở đây c là một giá trị trung bình nhất định của dân số được tìm thấy và c0 là giá trị đã cho ban đầu, liên quan đến giả thuyết được kiểm tra. Ngoài ra còn có một số X nhất định - giá trị trung bình của mẫu mà theo đó c0 được xác định.
Vì vậy, kiểm tra bao gồm so sánh X và c0, nếu X = c0, thì giả thuyết null được chấp nhận. Nếu X ≠ c0, thì bằng cách giả định phương án được coi là đúng.
Phương pháp xác minh tin cậy
Có một cách hiệu quả nhất mà giả thuyết thống kê null dễ dàng được xác minh trong thực tế. Nó bao gồm việc xây dựng một loạt các giá trị với độ chính xác tới 95%.
Trước tiên, bạn cần biết công thức tính khoảng tin cậy:
X - t * Sx ≤ c ≤ X + t * Sx,
Trong đó X là số đã cho ban đầu dựa trên giả thuyết thay thế;
t - giá trị bảng (hệ số sinh viên);
Sx là sai số trung bình tiêu chuẩn, được tính là Sx = / n, trong đó tử số là độ lệch chuẩn và mẫu số là cỡ mẫu.
Vì vậy, giả sử tình hình. Trước khi sửa chữa, băng tải đã sản xuất 32,1 kg sản phẩm cuối cùng mỗi ngày và sau khi sửa chữa, theo hiệu quả của doanh nhân, hiệu quả tăng lên và băng tải, theo kiểm tra hàng tuần, bắt đầu sản xuất trung bình 39,6 kg.
Giả thuyết khống sẽ cho rằng việc sửa chữa không ảnh hưởng đến hiệu quả của băng tải. Một giả thuyết khác sẽ nói rằng việc sửa chữa về cơ bản đã thay đổi hiệu quả của băng tải, do đó năng suất của nó đã được cải thiện.
Từ bảng ta tìm thấy n = 7, t = 2,447, từ đó công thức sẽ có dạng sau:
39,6 - 2,447 * 4.2 ≤ s ≤ 39,6 + 2,477 * 4.2;
29,3 ≤ s ≤ 49,9.
Nó chỉ ra rằng giá trị 32.1 nằm trong phạm vi và do đó, giá trị được đề xuất bởi phương án thay thế - 39.6 - không được chấp nhận tự động. Hãy nhớ rằng giả thuyết null được kiểm tra trước cho tính chính xác, và sau đó ngược lại.
Các loại từ chối
Trước đó, một lựa chọn xây dựng giả thuyết như vậy đã được xem xét, trong đó H0 yêu cầu một cái gì đó và H1 bác bỏ điều này. Một hệ thống như vậy có thể được tạo thành từ đâu:
H0: c = c0;
H1: c c0.
Nhưng có hai phương pháp bác bỏ liên quan hơn. Ví dụ, giả thuyết null nói rằng xếp hạng trung bình của một lớp là hơn 4,54 và sau đó, thay thế sẽ nói rằng điểm trung bình của cùng một lớp nhỏ hơn 4,54. Và nó sẽ trông giống như một hệ thống như thế này:
H0: s ⩾ 4,54;
H1: c <4,54.
Lưu ý rằng giả thuyết null nói rằng giá trị này lớn hơn hoặc bằng và giá trị thống kê hoàn toàn ít hơn. Mức độ nghiêm trọng của dấu hiệu bất bình đẳng là rất quan trọng!
Xác minh thống kê
Một thử nghiệm thống kê các giả thuyết null là sử dụng một tiêu chí thống kê. Các tiêu chí như vậy phải tuân theo luật phân phối khác nhau.
Ví dụ: có một tiêu chí F, được tính theo phân phối Fisher. Có một bài kiểm tra T, thường được sử dụng trong thực tế, tùy thuộc vào sự phân phối của học sinh. Tiêu chí vuông cho sự đồng ý của Pearson, v.v.
Khu vực chấp nhận giả thuyết khống
Trong đại số có khái niệm "vùng giá trị cho phép". Đây là một phân đoạn hoặc điểm trên trục X, trên đó có nhiều giá trị thống kê mà tại đó giả thuyết null là đúng. Các điểm cực đoan của phân khúc là các giá trị quan trọng. Các tia ở bên phải và bên trái của phân khúc là các khu vực quan trọng. Nếu giá trị tìm thấy được bao gồm trong chúng, thì lý thuyết zero được bác bỏ và một sự thay thế được chấp nhận.
Giả thuyết Null phản bác
Giả thuyết khống trong thống kê đôi khi là một khái niệm rất tinh ranh. Trong quá trình xác minh, nó có thể gây ra hai loại lỗi:
1. Sự bác bỏ giả thuyết null thực sự. Chúng tôi biểu thị loại đầu tiên là a = 1.
2. Chấp nhận giả thuyết null sai. Loại thứ hai được ký hiệu là a = 2.
Cần hiểu rằng đây không phải là các tham số giống nhau, kết quả của các lỗi có thể khác nhau đáng kể giữa chúng và có các mẫu khác nhau.
Một ví dụ về hai loại lỗi
Các khái niệm phức tạp dễ dàng hơn để tìm ra với một ví dụ.
Trong quá trình sản xuất một loại thuốc nhất định, các nhà khoa học cần hết sức thận trọng, vì vượt quá liều của một trong các thành phần gây ra mức độ độc tính cao của thuốc thành phẩm, từ đó bệnh nhân dùng thuốc có thể tử vong. Tuy nhiên, ở cấp độ hóa học, không thể phát hiện quá liều.
Bởi vì điều này, trước khi phát hành thuốc bán, một liều nhỏ được kiểm tra trên chuột hoặc thỏ bằng cách quản lý thuốc cho họ.Nếu hầu hết các đối tượng chết, thì thuốc không được phép bán, nếu đối tượng thử nghiệm còn sống, thì thuốc được phép bán ở các hiệu thuốc.
Trường hợp đầu tiên: trên thực tế, thuốc không độc hại, nhưng trong quá trình thí nghiệm, một sai lầm đã được thực hiện và thuốc được phân loại là độc hại và không được phép bán. A = 1.
Trường hợp thứ hai: trong một thí nghiệm khác, khi kiểm tra một lô thuốc khác, người ta đã quyết định rằng thuốc này không độc hại, và nó được phép bán, mặc dù trên thực tế thuốc này có độc. A = 2.
Tùy chọn đầu tiên sẽ đòi hỏi chi phí tài chính lớn cho nhà cung cấp-doanh nhân, vì bạn phải phá hủy toàn bộ lô thuốc và bắt đầu lại từ đầu.
Tình huống thứ hai sẽ kích động cái chết của những bệnh nhân đã mua và sử dụng thuốc này.
Lý thuyết xác suất
Không chỉ bằng không, mà tất cả các giả thuyết về thống kê và kinh tế đều được chia theo mức độ quan trọng.
Mức ý nghĩa - tỷ lệ phần trăm lỗi của loại thứ nhất (độ lệch của giả thuyết null thực sự).
• mức đầu tiên là 5% hoặc 0,05, nghĩa là xác suất xảy ra lỗi là 5 đến 100 hoặc 1 đến 20.
• mức thứ hai là 1% hoặc 0,01, nghĩa là xác suất là 1 đến 100.
• mức thứ ba là 0,1% hoặc 0,001, xác suất là 1 đến 1000.
Tiêu chí kiểm tra giả thuyết
Nếu các nhà khoa học đã kết luận rằng giả thuyết null là chính xác, thì nó phải được kiểm tra. Điều này là cần thiết để loại bỏ lỗi. Có một tiêu chí cơ bản để kiểm tra giả thuyết null, bao gồm một số giai đoạn:
1. Xác suất lỗi cho phép P = 0,05 được lấy.
2. Thống kê được chọn cho tiêu chí 1.
3. Theo phương pháp nổi tiếng là phạm vi của các giá trị được chấp nhận.
4. Bây giờ giá trị của thống kê T.
5. Nếu T (số liệu thống kê) thuộc về lĩnh vực chấp nhận giả thuyết null (như trong phương pháp tin tưởng của người dùng), thì các giả định được coi là đúng, điều đó có nghĩa là giả thuyết null vẫn đúng.
Đây là cách thống kê làm việc. Giả thuyết khống, với xác minh phù hợp, sẽ được chấp nhận hoặc từ chối.
Điều đáng chú ý là đối với các doanh nhân và người dùng thông thường, ba giai đoạn đầu tiên có thể rất khó thực hiện chính xác, vì vậy chúng được các nhà toán học chuyên nghiệp tin tưởng. Nhưng 4 và 5 giai đoạn có thể được thực hiện bởi bất kỳ người nào biết đủ phương pháp xác minh thống kê.