ISO/TR 13587:2012
BA CÁCH TIẾP CẬN THỐNG KÊ ĐÁNH GIÁ VÀ GIẢI THÍCH ĐỘ KHÔNG ĐẢM BẢO ĐO
Three statistical approaches for the assessment and interpretation of measurement uncertainty
Lời nói đầu
TCVN 12740:2019 hoàn toàn tương đương với ISO/TR 13587:2012.
TCVN 12740:2019 do Ban kỹ thuật tiêu chuẩn quốc gia TCVN/TC 69 Ứng dụng các phương pháp thống kê biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị, Bộ Khoa học và Công nghệ công bố.
Lời giới thiệu
Việc chấp nhận TCVN 9595-3 [ISO/IEC Guide 98-3 (GUM)] đã dẫn đến sự thừa nhận ngày càng tăng về sự cần thiết phải bao gồm công bố về độ không đảm bảo trong kết quả đo. Việc công nhận phòng thí nghiệm dựa trên tiêu chuẩn như TCVN ISO/IEC 17025[2] đã đẩy nhanh quá trình này. Thừa nhận rằng công bố về độ không đảm bảo là cần thiết cho việc đưa ra quyết định hiệu quả, các nhà đo lường học trong các phòng thí nghiệm thuộc mọi loại hình, từ Viện Đo lường Quốc gia đến các phòng thí nghiệm hiệu chuẩn thương mại, đang nỗ lực rất nhiều trong việc xây dựng các đánh giá độ không đảm bảo thích hợp cho các loại phép đo khác nhau, sử dụng các phương pháp nêu trong GUM.
Những điểm mạnh của các qui trình phác thảo và phổ biến trong GUM là cách tiếp cận chuẩn hóa để đánh giá độ không đảm bảo, là sự thích ứng đối với các nguồn độ không đảm bảo được đánh giá thống kê (Loại A) hoặc phi thống kê (Loại B), là sự nhấn mạnh vào việc báo cáo tất cả các nguồn độ không đảm bảo cần xem xét. Cách tiếp cận chủ yếu về lan truyền độ không đảm bảo trong GUM, dựa trên phép xấp xỉ tuyến tính của hàm đo, thường dễ thực hiện và trong nhiều tình huống thực tế sẽ cho các kết quả tương tự với các kết quả thu được một cách chính thức hơn. Nói tóm lại, kể từ khi được chấp nhận áp dụng, GUM đã tạo ra một cuộc cách mạng trong đánh giá độ không đảm bảo.
Thực tế là sẽ luôn cần làm việc nhiều hơn để cải tiến việc đánh giá độ không đảm bảo trong các ứng dụng cụ thể, đồng thời mở rộng ra để bao trùm thêm các lĩnh vực khác. Trong số những công việc này, Ủy ban phối hợp về Hướng dẫn trong đo lường học (JCGM), chịu trách nhiệm về GUM kể từ năm 2000, đã hoàn thành Phần bổ sung 1 của GUM, tiêu đề là “Lan truyền các phân bố sử dụng phương pháp Monte Carlo" (gọi là GUMS1)[3]. JCGM còn xây dựng các phần bổ sung khác cho GUM về các chủ đề như mô hình hóa và các mô hình với số lượng đại lượng đầu ra bất kỳ.
Do cần áp dụng cho tập hợp các vấn đề đo lường rộng nhất có thể nên định nghĩa về độ không đảm bảo đo trong TCVN 6165:2009 (ISO/IEC Guide 99:2007)[4] là: “tham số không âm đặc trưng cho độ phân tán của các giá trị đại lượng được quy cho đại lượng đo, trên cơ sở thông tin đã sử dụng” không thể đưa nhiều hơn mức khái niệm tương đối một cách hợp lý. Kết quả là, việc xác định và hiểu về vai trò thích hợp của các đại lượng thống kê khác nhau trong đánh giá độ không đảm bảo, thậm chí cho các ứng dụng đo lường tương đối được thông hiểu, là một chủ đề được quan tâm đặc biệt với cả nhà thống kê và nhà đo lường.
Các nghiên cứu trước đây đã tiếp cận các chủ đề từ quan điểm đo lường học, một số tác giả tập trung vào mô tả đặc trưng thuộc tính thống kê của các quy trình nêu trong GUM. Tài liệu tham khảo [5] cho thấy các quy trình này không hoàn toàn phù hợp với giải thích theo Bayes hay giải thích theo tần suất. Tài liệu tham khảo [6] đề xuất một số sửa đổi nhỏ cho quy trình GUM mà trong một số tình huống sẽ đưa ra các kết quả thống nhất hơn với giải thích Bayes. Tài liệu tham khảo [7] thảo luận về quan hệ giữa các quy trình đánh giá độ không đảm bảo đề xuất trong GUMS1 và các kết quả của phân tích Bayes cho một lớp mô hình cụ thể. Tài liệu tham khảo [8] cũng thảo luận về các giải thích xác suất khác nhau có thể có về khoảng phủ và khuyến nghị xấp xỉ các phân bố hậu nghiệm cho lớp phân tích Bayes này bằng các phân bố xác suất từ họ phân bố Pearson.
Tài liệu tham khảo [9] so sánh cách tiếp cận tần suất (“quy ước”) và Bayes để đánh giá độ không đảm bảo. Tuy nhiên, nghiên cứu chỉ giới hạn ở các hệ thống đo mà tất cả các nguồn độ không đảm bảo có thể đánh giá bằng cách sử dụng phương pháp Loại A. Ngược lại, các hệ thống đo có nguồn độ không đảm bảo được đánh giá bằng cả phương pháp Loại A và Loại B được đề cập trong tiêu chuẩn này và được minh họa bằng nhiều ví dụ, bao gồm một trong các ví dụ từ Phụ lục H của GUM.
Các nhà thống kê học đã từng rất chú trọng vào việc sử dụng các phương pháp đánh giá độ không đảm bảo có chứng minh hoặc giải thích xác suất. Thông qua công việc của họ, thường nằm ngoài lĩnh vực đo lường, nhiều cách tiếp cận khác nhau đối với suy luận thống kê liên quan đến đánh giá độ không đảm bảo đã được phát triển. Tiêu chuẩn này trình bày một số cách tiếp cận đánh giá độ không đảm bảo từ quan điểm thống kê và liên hệ chúng với các phương pháp hiện đang được sử dụng trong đo lường hoặc được phát triển trong cộng đồng đo lường. Các cách tiếp cận thống kê cụ thể trong đó các phương pháp khác nhau để đánh giá độ không đảm bảo sẽ được mô tả là cách tiếp cận tần suất, Bayes và cách tiếp cận dựa vào sự tin tưởng, được thảo luận thêm sau khi vạch ra các quy ước ký hiệu cần thiết để phân biệt các loại đại lượng khác nhau.
BA CÁCH TIẾP CẬN THỐNG KÊ ĐỂ ĐÁNH GIÁ VÀ GIẢI THÍCH ĐỘ KHÔNG ĐẢM BẢO ĐO
Three statistical approaches for the assessment and interpretation of measurement uncertainty
Tiêu chuẩn này đề cập đến ba cách tiếp cận thống kê để đánh giá và giải thích độ không đảm bảo đo: cách tiếp cận tần suất bao gồm khoảng không đảm bảo bootstrap, cách tiếp cận Bayes và cách tiếp cận lập luận dựa vào sự tin tưởng. Đặc điểm chung của ba cách tiếp cận này là giải thích xác suất phân định rõ ràng hoặc lý giải về khoảng độ không đảm bảo thu được. Đối với mỗi cách tiếp cận, phương pháp cơ bản được mô tả, các giả định cơ bản và việc giải thích xác suất về độ không đảm bảo thu được được thảo luận. Mỗi cách tiếp cận được minh họa bằng hai ví dụ, bao gồm ví dụ lấy từ TCVN 9595-3 (ISO/IEC Guide 98-3) [Độ không đảm bảo đo - Phần 3: Hướng dẫn trình bày độ không đảm bảo đo (GUM:1995)]. Ngoài ra, tiêu chuẩn này cũng thảo luận về mối quan hệ giữa các phương pháp đề xuất trong GUM phần bổ sung 1 và ba cách tiếp cận thống kê này.
Các tài liệu viện dẫn trong tiêu chuẩn này rất cần thiết cho việc áp dụng tiêu chuẩn. Đối với các tài liệu có ghi năm công bố thì áp dụng bản được nêu. Đối với các tài liệu không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi.
TCVN 8244-1:2010 (ISO 3534-1:2006), Thống kê học - Từ vựng và ký hiệu - Phần 1: Thuật ngữ chung về thống kê và thuật ngữ dùng trong xác suất
TCVN 8244-2:2010 (ISO 3534-2:2006), Thống kê học - Từ vựng và ký hiệu - Phần 2: Thống kê ứng dụng
TCVN 9595-3:2013 (ISO/IEC Guide 98-3:2008), Độ không đảm bảo đo - Phần 3: Hướng dẫn trình bày độ không đảm bảo đo (GUM:1995)
ISO/IEC Guide 98-3:2008/Suppl 1:2008, Uncertainty of measurement - Part 3: Guide to the expression of uncertainty in measurement (GUM:1995) - Supplement 1: Propagation of distributions using a Monte Carlo method [Độ không đảm bảo đo - Phần 3: Hướng dẫn trình bày độ không đảm bảo đo (GUM:1995) - Phần bổ sung 1: Lan truyền phân bố sử dụng phương pháp Monte Carlo]
Tiêu chuẩn này áp dụng các thuật ngữ và định nghĩa trong TCVN 8244-1 (ISO 3534-1), TCVN 8244-2 (ISO 3534-2) và các thuật ngữ, định nghĩa dưới đây.
3.1
Hàm phân bố thực nghiệm (empirical distribution function)
Hàm phân bố tích lũy thực nghiệm (empirical cumulative distribution function)
Hàm phân bố ấn định xác suất 1/n cho mỗi trong số n cá thể trong mẫu ngẫu nhiên, tức hàm phân bố thực nghiệm là một hàm bậc thang được xác định bởi
trong đó {x1, ..., xn} là mẫu và IAI là số phần tử trong tập A.
3.2
Phân tích độ nhạy Bayes (Bayesian sensitivity analysis)
Nghiên cứu ảnh hưởng của sự lựa chọn các phân bố tiên nghiệm cho các tham số của mô hình thống kê lên phân bố hậu nghiệm của đại lượng đo.
3.3
Thống kê đủ (sufficient statistic)
Hàm của mẫu ngẫu nhiên X1, ..., Xn từ hàm mật độ xác suất với tham số θ mà phân bố điều kiện của X1, ..., Xn cho hàm này không phụ thuộc vào θ.
CHÚ THÍCH: Thống kê đủ chứa toàn bộ thông tin về θ như X1, ..., Xn.
3.4
Mô hình quan trắc (observation model)
Quan hệ toán học giữa tập hợp các phép đo (số chỉ), đại lượng đo và sai số đo ngẫu nhiên kèm theo.
3.5
Phương trình cấu trúc (structural equation)
Mô hình thống kê liên hệ biến ngẫu nhiên quan trắc được với tham số chưa biết và biến ngẫu nhiên không quan trắc được có phân bố đã biết và không phụ thuộc vào tham số chưa biết.
3.6
Phân bố Khi-bình phương không trung tâm (non-central chi-squared distribution)
Phân bố xác suất tổng quát hóa phân bố Khi-bình phương điền hình (hoặc trung tâm).
CHÚ THÍCH 1: Đối với k biến ngẫu nhiên độc lập, phân bố chuẩn Xi có trung bình µi và phương sai , biến ngẫu nhiên là phân bố Khi bình phương không trung tâm. Phân bố Khi-bình phương không trung tâm có hai tham số: k, bậc tự do (tức là số lượng Xi) và λ, liên quan đến các trung bình của các biến ngẫu nhiên Xi bởi và được gọi là tham số không trung tâm.
CHÚ THÍCH 2: Hàm mật độ xác suất tương ứng được biểu thị như tổng hợp các hàm mật độ xác suất X2 trung tâm cho bởi
trong đó Yq có phân bố như Khi-bình phương với q bậc tự do.
Trong 4.1.1 của GUM quy định các chữ cái La tinh được sử dụng để thể hiện các đại lượng vật lý cần xác định bằng phép đo (tức là các đại lượng đo theo thuật ngữ GUM) cũng như các biến ngẫu nhiên có thể lấy các giá trị quan trắc khác nhau của một đại lượng vật lý. Việc sử dụng cùng một ký hiệu, có các ý nghĩa khác nhau chỉ được chỉ ra theo bối cảnh, có thể khó giải thích và đôi khi dẫn đến sự không rõ ràng hay hiểu nhầm không cần thiết. Để giảm thiểu nguồn gây nhầm lẫn tiềm ẩn này, cách ký hiệu truyền thống hơn thường được sử dụng trong tài liệu thống kê được áp dụng trong tiêu chuẩn này. Trong cách ký hiệu này, các chữ cái Hy Lạp được sử dụng để thể hiện các tham số trong mô hình thống kê (ví dụ như đại lượng đo), có thể là biến ngẫu nhiên hoặc hằng số tùy thuộc vào cách tiếp cận thống kê được sử dụng và tính chất của mô hình đó. Chữ cái La tinh hoa được sử dụng để thể hiện biến ngẫu nhiên có thể lấy các giá trị khác nhau của đại lượng quan trắc được (ví dụ như giá trị đo được tiềm năng), còn chữ cái La tinh thường thể hiện giá trị quan trắc cụ thể của một đại lượng (ví dụ như giá trị đo được cụ thể). Vì có thể cần ký hiệu bổ sung để chỉ thị các khái niệm vật lý, toán học hoặc thống kê khác nên sẽ luôn có khả năng có sự không rõ ràng nhất định 1). Trong những trường hợp này, bối cảnh sẽ làm rõ cách giải thích phù hợp.
5.1 Vấn đề quan tâm trong tiêu chuẩn này là mô hình đo trong đó µ1 ... µp là các đại lượng đầu vào và θ là đại lượng đầu ra:
θ = f(µ1 ..., µp) |
(1) |
trong đó f được biết là hàm đo. Hàm f được xác định theo toán học hoặc như một quy trình tính toán. Trong GUM (4.1, CHÚ THÍCH 1), một quan hệ hàm số giống hệt được đưa ra là
Y = f(X1 ..., Xp) |
(2) |
có thể không dễ dàng phân biệt với nó hàm đo được đánh giá tại giá trị của các biến ngẫu nhiên tương ứng cho từng đầu vào quan trắc được.
Bằng cách sử dụng quy trình khuyến nghị trong GUM, p đại lượng chưa biết µ1 ... µp, được ước lượng bằng các giá trị x1, ..., xp thu được từ phép đo hoặc từ các nguồn khác. Độ không đảm bảo chuẩn kèm theo của chúng cũng thu được từ dữ liệu liên quan bằng các phương pháp thống kê hoặc từ hàm mật độ xác suất dựa trên kiến thức chuyên gia mô tả đặc trưng các biến. GUM (xem thêm 4.5 trong Tài liệu tham khảo [11]) khuyến nghị rằng cùng một mô hình đo liên hệ đại lượng đo ở với các đại lượng đầu vào µ1 ..., µp được dùng để tính y từ x1, ..., xp. Do đó, giá trị đo được (hoặc, theo thuật ngữ thống kê, là ước lượng) y của θ thu được là
y = f(x1, ..., xp) |
(3) |
tức là, Y được đánh giá bởi y = f(x1, ..., xp), được lấy làm giá trị đo được của θ. Các ước lượng y, x1, ..., xp tương ứng là các thể hiện của Y, X1, ..., Xp.
5.2 Trong tiêu chuẩn này, ba cách tiếp cận thống kê được sử dụng để cung cấp (a) ước lượng tốt nhất y của θ, (b) độ không đảm bảo chuẩn kèm theo u(y), và (c) khoảng tin cậy hoặc khoảng phủ đối với θ cho một xác suất phủ quy định (thường được lấy bằng 95 %).
5.3 Khi thảo luận về độ không đảm bảo chuẩn, sự phân biệt được đưa ra giữa độ không đảm bảo chuẩn đánh giá được gắn với ước lượng của các đại lượng khác nhau và giá trị lý thuyết tương ứng của chúng. Theo đó, các ký hiệu như σµ hoặc σx sẽ ký hiệu cho độ không đảm bảo chuẩn lý thuyết và các ký hiệu như Sx và sx sẽ ký hiệu cho độ không đảm bảo chuẩn đánh giá, tương ứng với trước và sau khi được quan trắc.
6.1.1 Cách tiếp cận thống kê đầu tiên được xem xét, trong đó độ không đảm bảo có thể được đánh giá về mặt xác suất, là tiếp cận tần suất. Đôi khi, cách tiếp cận tần suất còn được gọi là “truyền thống” hay “quy ước”. Tuy nhiên, do tính chất của độ không đảm bảo trong đo lường, các phương pháp quen thuộc này thường phải được điều chỉnh để có các khoảng không đảm bảo tần suất trong điều kiện thực tế.
6.1.2 Trong cách tiếp cận tần suất, các đại lượng đầu vào µ1 ..., µp trong mô hình đo (1) và đại lượng đầu ra θ được coi là các hằng số chưa biết. Khi đó, dữ liệu liên quan đến mỗi tham số đầu vào, µi, sẽ thu được và được dùng để ước lượng giá trị của θ dựa trên mô hình đo hoặc các mô hình thống kê tương ứng. Cuối cùng, khoảng tin cậy cho θ, đối với một mức tin cậy quy định, sẽ thu được bằng cách sử dụng một trong nhiều nguyên tắc hoặc phương pháp toán học, ví dụ, bình phương tối thiểu, hợp lý cực đại hoặc bootstrap.
6.1.3 Vì θ được coi như hằng số nên công bố xác suất kèm theo khoảng tin cậy cho θ không phải là công bố xác suất trực tiếp về giá trị của nó. Thay vào đó là công bố xác suất về tần suất mà quy trình sử dụng để thu được khoảng độ không đảm bảo cho đại lượng đo có thể bao gồm giá trị của θ khi sử dụng lặp lại. “Sử dụng lặp lại” có nghĩa là đánh giá độ không đảm bảo được lặp lại nhiều lần bằng cách sử dụng dữ liệu khác nhau lấy từ cùng các phân bố. Khoảng độ không đảm bảo tần suất truyền thống cung cấp một công bố xác suất về các thuộc tính dài hạn của quy trình sử dụng để thiết lập khoảng đó dưới một tập hợp các điều kiện cụ thể được giả định để áp dụng cho quá trình đo.
6.1.4 Mặt khác, trong hầu hết các bố trí đo lường thực tế, khoảng độ không đảm bảo là để tính đến độ không đảm bảo gắn với các ước lượng của đại lượng thu được bằng các giá trị đo được (dữ liệu quan trắc được) và cả độ không đảm bảo gắn với các ước lượng của đại lượng dựa trên kiến thức chuyên gia. Để thu được khoảng độ không đảm bảo tương tự với khoảng tin cậy, các đại lượng không dựa trên giá trị đo được được coi như biến ngẫu nhiên với phân bố xác suất cho giá trị của chúng trong khi những đại lượng có giá trị có thể ước lượng bằng dữ liệu thống kê được coi như các hằng số chưa biết.
6.1.5 Quy trình tần suất truyền thống để thiết lập khoảng tin cậy sau đó được sửa đổi để có được mức tin cậy quy định sau khi lấy trung bình các giá trị có thể có của các đại lượng đánh giá bằng ý kiến chuyên gia [5]. Những khoảng phủ sửa đổi này cung cấp công bố xác suất dài hạn về quy trình sử dụng để thu được khoảng với các phân bố xác suất cho đại lượng chưa được đo, cũng giống như khoảng tin cậy truyền thống đưa ra khi tất cả các tham số được coi là hằng số.
6.1.6 Bảng 1 tổng hợp các giải thích về cách tiếp cận tần suất, Bayes và cách tiếp cận dựa vào sự tin tưởng để đánh giá độ không đảm bảo.
Bảng 1 - Giải thích các cách tiếp cận đánh giá độ không đảm bảo
Cách tiếp cận |
Mô tả đặc trưng các đại lượng trong mô hình đo θ = f(µi, ..., µp) |
Khoảng độ không đảm bảo đối với đại lượng đầu ra θ |
Chú thích |
Tần suất |
θ và µi đều là các hằng số chưa biết |
Tần suất xuất hiện dài hạn mà khoảng đó chứa θ |
Cách tiếp cận tần suất truyền thống mở rộng để tích hợp các độ không đảm bảo không được đánh giá thống kê |
Bayes |
θ và µi là các biến ngẫu nhiên. Phân bố xác suất của chúng đại diện cho sự tin tưởng về giá trị của đại lượng đầu vào và đầu ra |
Khoảng phủ chứa θ dựa trên phân bố hậu nghiệm đối với θ |
Tính không đơn nhất có thể có của khoảng là do lựa chọn các giá trị tiên nghiệm |
Tin tưởng |
µi coi là biến ngẫu nhiên có phân bố thu được từ giả định về dữ liệu quan trắc được sử dụng để ước lượng µi và kiến thức chuyên gia về µi |
Khoảng phủ chứa θ dựa trên phân bố dựa vào sự tin tưởng đối với θ |
Tính không đơn nhất là do lựa chọn phương trình cấu trúc |
Cách tiếp cận thứ hai được gọi là cách tiếp cận Bayes. Tên gọi này xuất phát từ định lý cơ bản là cơ sở của cách tiếp cận, đã được Reverend Thomas Bayes chứng minh vào giữa những năm 1700 [12]. Trong cách tiếp cận này, kiến thức về các đại lượng trong mô hình đo (1) ở Điều 5 được mô hình hóa như một tập các biến ngẫu nhiên tuân theo phân bố xác suất đồng thời đối với µ1, ..., µp và θ. Khi đó, định lý Bayes cho phép cập nhật các phân bố xác suất này dựa trên dữ liệu quan trắc được (cũng được mô hình hóa bằng các phân bố xác suất) và mối quan hệ của các tham số xác định bằng hàm f hoặc mô hình thống kê tương đương. Sau đó, phân bố xác suất thu được mô tả kiến thức về θ theo dữ liệu quan trắc được. Khoảng độ không đảm bảo chứa θ với xác suất quy định bất kỳ có thể thu được sau đó từ phân bố này. Vì kiến thức về các giá trị tham số được mô tả bởi phân bố xác suất nên các phương pháp Bayes đưa ra công bố xác suất trực tiếp về giá trị của θ và các tham số khác, bằng cách sử dụng định nghĩa xác suất như là thước đo của sự tin tưởng.
6.3 Cách tiếp cận dựa vào sự tin tưởng
6.3.1 Cách tiếp cận dựa vào sự tin tưởng được phát triển bởi R.A. Fisher [13] vào những năm 1930. Trong cách tiếp cận này, phân bố xác suất, gọi là phân bố dựa vào sự tin tưởng, đối với θ với điều kiện dữ liệu thu được dựa trên mối quan hệ giữa θ và µi mô tả bởi f và các giả định phân bố về dữ liệu dùng để ước lượng µi. Khi có được, phân bố dựa vào sự tin tưởng cho θ có thể dùng để thu được khoảng độ không đảm bảo chứa θ với xác suất quy định bất kỳ.
6.3.2 Lập luận lý giải cho quá trình dùng để thu được phân bố dựa vào sự tin tưởng được minh họa bằng một ví dụ đơn giản. Giả định các giá trị lấy bởi đại lượng Y có thể được mô tả bằng công thức Y = µ + Z, trong đó µ là đại lượng đo và Z là đại lượng đặc trưng bởi biến ngẫu nhiên phân bố chuẩn. Nếu y là giá trị thể hiện của Y tương ứng với z là giá trị thể hiện của Z thì khi đó µ = y - z. Mặc dù Z không thể quan trắc được, kiến thức về phân bố từ đó z được tạo ra cho phép xác định một tập hợp các giá trị hợp lý của µ. Phân bố xác suất đối với Z có thể dùng để suy ra phân bố xác suất của µ. Quá trình biến mối quan hệ µ = y - z sang quan hệ µ = y - Z là những gì cấu thành lập luận dựa vào sự tin tưởng. Phân bố dựa vào sự tin tưởng đối với µ là phân bố xác suất cho biến ngẫu nhiên y - Z với y cố định.
Khi mô tả các phương pháp khác nhau để đánh giá độ không đảm bảo theo từng cách tiếp cận thống kê này, các giả định cơ bản của chúng, sự kết hợp các độ không đảm bảo thu được bằng đánh giá Loại A hoặc Loại B, và việc giải thích về xác suất của các đánh giá độ không đảm bảo thu được sẽ được thảo luận. Mô tả về cách các phương pháp sử dụng trong GUM liên quan đến kết quả tần suất, Bayes hoặc dựa vào sự tin tưởng cũng sẽ được đưa ra.
7.1 Khái quát
Hai ví dụ được đưa ra để minh họa các cách tiếp cận. Ví dụ 1 liên quan đến đại lượng vật lý được hiệu chính đối với nhiễu nền. Bảng 2 nêu các ký hiệu được sử dụng và 7.2 đến 7.4 xác định các biến thể của bài toán đánh giá này. Ví dụ 2 là hiệu chuẩn độ dài của can mẫu lấy từ Phụ lục H.1 của GUM. Do phức tạp hơn nên nó được xem xét trong Điều 11, sau khi ba phương pháp đánh giá độ không đảm bảo được thảo luận và minh họa bằng Ví dụ 1.
Trong các điều sau, ba cách tiếp cận sẽ được áp dụng cho các ví dụ này.
CHÚ THÍCH: Đơn vị của các đại lượng liên quan không được cho khi chúng không quan trọng cho ví dụ.
Bảng 2 - Ký hiệu dùng cho Ví dụ 1
Đại lượng |
Ký hiệu |
Đại lượng vật lý cần quan tâm (đại lượng đo) |
θ |
Đại lượng được phát hiện bởi phương pháp đo khi đo nền (nghĩa là giá trị kỳ vọng của B) (nhiễu nền) |
β |
Đại lượng được phát hiện bời phương pháp đo khi đo đại lượng vật lý cần quan tâm (nghĩa là giá trị kỳ vọng của Y) |
= θ + β |
Độ lệch chuẩn của phương pháp đo khi đo đại lượng vật lý cần quan tâm (nghĩa là độ lệch chuẩn của Y) |
σY |
Độ lệch chuẩn của phương pháp đo khi đo nền (nghĩa là độ lệch chuẩn của B) |
σB |
7.2 Ví dụ 1a
Năm giá trị đo được thu được độc lập của tín hiệu cùng với nền được quan trắc. Mỗi giá trị đo được được giả định là thể hiện của biến ngẫu nhiên Y có phân bố Gauss với trung bình = θ + β và độ lệch chuẩn σY. Các giá trị đo được y của tín hiệu cùng với nền là
3,738, 3,442, 2,994, 3,637, 3,874.
Dữ liệu này có trung bình mẫu = 3,537 và độ lệch chuẩn mẫu Sy = 0,342.
Tương tự, có được năm giá trị nền đo được thu được độc lập. Các giá trị đo được này được giả định là các thể hiện của biến ngẫu nhiên B có phân bố Gauss với trung bình β và độ lệch chuẩn σB. Các giá trị quan trắc b của nền là
1,410, 1,085, 1,306, 1,137, 1,200.
Vì có các giá trị đo được cho mỗi đại lượng là một nguồn độ không đảm bảo, nên Ví dụ 1a có giải thích thống kê đơn giản cho mỗi cách tiếp cận.
7.3 Ví dụ 1b
Ví dụ 1b giống với Ví dụ 1a ngoại trừ việc đánh giá nền dựa vào kiến thức chuyên gia hoặc kinh nghiệm trước đó hơn là vào dữ liệu thực nghiệm mới. Trong trường hợp này, nền β được tin là tuân theo phân bố đều (hoặc chữ nhật) với các điểm đầu 1,126 và 1,329. Vì áp dụng đánh giá chuyên gia nên độ không đảm bảo gắn với giá trị của nền sẽ thu được bằng đánh giá Loại B. Do đó, Ví dụ 1b có thể được coi là gần với tình huống đo thực tế hơn Ví dụ 1 a.
7.4 Ví dụ 1c
Ví dụ 1c giống Ví dụ 1b ngoại trừ tín hiệu θ gần với nền hơn. Dữ liệu quan trắc được đối với tín hiệu cùng với nền trong trường hợp này là
1,340 1,078, 1,114, 1,256, 1,192.
Với tín hiệu chỉ cao hơn mức nền, Ví dụ 1c minh họa cách các ràng buộc vật lý có thể kết hợp như thế nào trong đánh giá độ không đảm bảo đối với từng cách tiếp cận.
8 Cách tiếp cận tần suất để đánh giá độ không đảm bảo
8.1.1 Trong bối cảnh tần suất, tham số là các hằng số chưa biết. Tuân thủ quy ước ký hiệu các biến ngẫu nhiên bằng chữ cái in hoa và giá trị quan trắc của các biến ngẫu nhiên bằng chữ cái thường, khoảng tin cậy có thể thu được từ đại lượng then chốt đối với θ, tức là hàm W(Y, θ) của dữ liệu Y (có thể là nhiều biến) và tham số θ, có phân bố xác suất không phụ thuộc tham số (với điều kiện có thể xác định được phân bố). Khi đó, khoảng tin cậy 100(1 - α) % đối với θ có thể được xác định bằng cách tính phân vị dưới và phân vị trên lα và uα để thỏa mãn Pθ (lα ≤ W(Y, θ) ≤ uα) = 1 - α.
8.1.2 Ví dụ, lấy Y = (Y1, ..., Yn) là các biến ngẫu nhiên, phân bố là N(µ, σ2), với biến ngẫu nhiên . Nếu tham số quan tâm là µ thì đối với σ chưa biết, ~ N (0, 1) là đại lượng then chốt. Khoảng tin cậy tần suất cho µ là
trong đó zβ là phân vị 100 β của phân bố chuẩn chuẩn hóa.
Nếu chưa biết σ thì có thể ước lượng bằng độ lệch chuẩn mẫu
Khi đó, đại lượng then chốt (đúng) đối với µ sẽ thu được bằng cách thay σ trong khoảng (4) bằng S:
Do đó, khoảng tin cậy 100(1 - α) % đối với µ dựa trên phân bố t-Student là
trong đó tn-i,β là phân vị 100β của phân bố t với n - 1 bậc tự do.
8.1.3 Thay vì các đại lượng then chốt đúng, chỉ tồn tại trong các tình huống đơn giản, các đại lượng then chốt xấp xỉ thường được sử dụng trong các ứng dụng. Đối với các mẫu lớn, có thể vận dụng định lý giới hạn trung tâm để thu được các khoảng tin cậy xấp xỉ dựa trên phân bố chuẩn.
8.1.4 Các phương pháp khác để có được khoảng tin cậy (lấy nghịch đảo thống kê kiểm nghiệm, lập hàm phân bố tích lũy liên tục làm then chốt, sắp xếp các giá trị mẫu rời rạc theo thứ tự xác suất của chúng, v.v). được thảo luận trong Tài liệu tham khảo [14]. Một số trong các phương pháp này được đề cập trong Ví dụ 1. Phương pháp chuyên dùng máy tính, được gọi là bootstrap, cũng được sử dụng để thiết lập khoảng tin cậy cho các đại lượng then chốt có phân bố chưa biết. Quy trình bootstrap được trình bày ở 8.2.
8.1.5 Mặc dù không có được lý giải tần suất rõ ràng từ các xem xét khoa học cơ bản, nhưng có thể sử dụng các quy trình khuyến nghị trong GUM để có khoảng tin cậy xấp xỉ cho đại lượng đo. Những khoảng tin cậy này dựa trên đại lượng then chốt xấp xỉ phân bố t giả định thu được từ mô hình đo (1). Trong quy trình này, các đại lượng chưa biết µ1, ..., µp được ước lượng bằng các giá trị x, ..., xp thu được từ phép đo vật lý hoặc từ các nguồn khác. Một số giá trị xi có thể là trung bình mẫu hoặc hàm dữ liệu khác dùng để ước lượng các đại lượng µi, i = 1, ..., m. Độ không đảm bảo chuẩn kèm theo u(xi) của chúng cũng được đánh giá từ dữ liệu bằng các phương pháp thống kê, thường sử dụng độ lệch chuẩn mẫu hoặc sử dụng quy trình dựa trên thứ hạng ổn định. Các phương pháp như vậy được gọi là đánh giá độ không đảm bảo Loại A. Bậc tự do vi kèm theo u(xi) được xác định từ cỡ mẫu dùng để ước lượng µi.
8.1.6 Vì các phép đo vật lý không phải lúc nào cũng có thể hoặc khả thi đối với một số µi, nên các ước lượng xi của µi đối với một số i, ví dụ: i = m + 1, ..., p, thu được bằng các đánh giá chủ quan (hoặc có khả năng chủ quan) và sử dụng cùng với xi, đối với i = 1,…, p, thu được từ đánh giá độ không đảm bảo Loại A. Do đó, loại thông tin phi thống kê được sử dụng để ước lượng µm+1, ..., µp, bằng cách sử dụng đánh giá độ không đảm bảo Loại B, bao gồm cả lập luận khoa học, quy định kỹ thuật của nhà sản xuất hoặc thông tin liên quan gián tiếp hoặc chưa quy định đầy đủ khác.
CHÚ THÍCH: Đôi khi độ không đảm bảo thu được bằng cả đánh giá độ không đảm bảo Loại A và Loại B.
8.1.7 GUM khuyến nghị nên sử dụng cùng một mô hình đo liên hệ đại lượng θ với các đại lượng đầu vào µ1, ..., µp để tính y từ x1, ..., xp. Do đó, giá trị đo được (hoặc ước lượng) y của θ thu được là
y = f(x1,..., xm, xm+1,..., xp),
Ý kiến bạn đọc
Nhấp vào nút tại mỗi ô tìm kiếm.
Màn hình hiện lên như thế này thì bạn bắt đầu nói, hệ thống giới hạn tối đa 10 giây.
Bạn cũng có thể dừng bất kỳ lúc nào để gửi kết quả tìm kiếm ngay bằng cách nhấp vào nút micro đang xoay bên dưới
Để tăng độ chính xác bạn hãy nói không quá nhanh, rõ ràng.