Ergonomic principles related to mental workload – Principles and requirements concerning methods for measuring and assessing mental workload
Lời nói đầu
TCVN 7113-3:2011 hoàn toàn tương đương với ISO 10075-3:2004
TCVN 7113-3:2011 do Ban kỹ thuật tiêu chuẩn quốc gia TCVN/TC 159 Ecgônômi biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị, Bộ Khoa học và Công nghệ công bố.
Bộ tiêu chuẩn TCVN 7113 bao gồm các tiêu chuẩn sau:
- TCVN 7113:2003 (ISO 10075:1991), Nguyên lý ecgônômi liên quan đến gánh nặng tâm thần – Thuật ngữ và định nghĩa chung;
- TCVN 7113-2:2002 (ISO 10075-2:1996), Nguyên lý ecgônômi liên quan đến gánh nặng tâm thần – Phần 2: Nguyên tắc thiết kế;
- TCVN 7113-3:2011 (ISO 10075-3:2004) Nguyên lý ecgônômi liên quan đến gánh nặng tâm thần – Nguyên lý và yêu cầu liên quan đến các phương pháp đo và đánh giá gánh nặng tâm thần.
Lời giới thiệu
Tiêu chuẩn này quy định thông tin kỹ thuật có liên quan trong nội dung của việc xây dựng, tính toán và lựa chọn các dụng cụ đo phục vụ việc đánh giá gánh nặng tâm thần đã được định nghĩa và đề cập trong TCVN 7113 (ISO 10075) và TCVN 7113-2 (ISO 10075-2). Để hiểu rõ tiêu chuẩn này, cần tìm hiểu kỹ về các khái niệm được đưa ra trong hai tiêu chuẩn TCVN 7113 (ISO 10075) và TCVN 7113-2 (ISO 10075-2).
Do gánh nặng tâm thần là một phần của gánh nặng tổng thể, nên người sử dụng tiêu chuẩn này cần tìm hiểu và làm quen với các khái niệm và các điều khoản được trình bày trong TCVN 7437 (ISO 6385).
Tiêu chuẩn này chủ yếu cung cấp thông tin phục vụ việc phát triển các dụng cụ đo mà các đặc điểm kỹ thuật cần được xét tới nhằm đánh giá một quy trình sẵn có liên quan đến khả năng được sử dụng như một dụng cụ đo phục vụ việc đánh giá gánh nặng tâm thần.
Tiêu chuẩn này đề cập đến những yêu cầu đối với các dụng cụ đo ở khía cạnh khác nhau của gánh nặng tâm thần, nhưng không chỉ rõ dụng cụ nào nên được sử dụng, ví dụ: xác định thang bậc tâm lý hay các phương pháp tâm sinh lý. Việc lựa chọn dụng cụ nào được sử dụng sẽ dễ dàng hơn khi được cung cấp những thông tin phù hợp và chính xác.
ECGÔNÔMI – NGUYÊN LÝ ECGÔNÔMI LIÊN QUAN ĐẾN GÁNH NẶNG TÂM THẦN – NGUYÊN LÝ VÀ YÊU CẦU LIÊN QUAN ĐẾN CÁC PHƯƠNG PHÁP ĐO VÀ ĐÁNH GIÁ GÁNH NẶNG TÂM THẦN
Ergonomic principles related to mental workload – Principles and requirements concerning methods for measuring and assessing mental workload
Tiêu chuẩn này thiết lập nguyên lý và yêu cầu đối với việc đo và đánh giá gánh nặng tâm thần, đồng thời quy định những yêu cầu đối với các dụng cụ đo. Tiêu chuẩn này cung cấp thông tin cho việc lựa chọn các phương pháp phù hợp và thông tin về những khía cạnh của việc đo và đánh giá gánh nặng tâm thần nhằm tăng cường trao đổi thông tin giữa các bên liên quan.
Tiêu chuẩn này chủ yếu phục vụ các chuyên gia thuộc lĩnh vực ecgônômi như các nhà tâm lý học, các chuyên gia về sức khỏe nghề nghiệp và/hoặc các nhà sinh lý học được trang bị các kiến thức cơ bản phù hợp, có khả năng sử dụng các phương pháp đề cập trong tiêu chuẩn, cũng như trong việc diễn giải các kết quả đo. Các nhà chuyên môn thuộc lĩnh vực ecgônômi có thể tìm thấy thông tin cần thiết khi tiến hành triển khai hoặc tính toán các phương pháp đánh giá gánh nặng tâm thần.
Với những người không phải là chuyên gia về Ecgônômi như người sử dụng lao động, người lao động và những đại diện của họ, các nhà quản lý và nhà thiết kế hệ thống và các cơ quan quản lý công cộng có thể tìm thấy những thông tin hữu ích giúp định hướng trong việc đo và đánh giá gánh nặng tâm thần, ví dụ: những phương pháp sẵn có là gì, tiêu chí nào phù hợp trong việc đánh giá các dụng cụ đo, loại thông tin nào cần được yêu cầu và theo dõi khi đưa ra quyết định dụng cụ nào phù hợp và dụng cụ nào có thể áp dụng được.
CHÚ THÍCH Báo cáo kỹ thuật với những thông tin chi tiết về thuật ngữ và cách áp dụng tiêu chuẩn này sẽ có sẵn cho đối tượng người sử dụng không phải là chuyên gia trong lĩnh vực ecgônômi.
Tiêu chuẩn này cung cấp thông tin làm cơ sở phục vụ việc lựa chọn một phương pháp phù hợp trong những tình huống khác nhau. Có rất nhiều các phương pháp phù hợp dành cho các mục đích khác nhau, tình huống và mức độ chuẩn xác khác nhau. Tuy nhiên, cần phải có các phương pháp đo hiệu quả và hiệu suất. Thông tin đưa ra trong tiêu chuẩn này cho phép người sử dụng đánh giá phương pháp tiếp cận đo phù hợp nhất phục vụ cho mục đích đặc biệt của mình.
Sự phù hợp với các điều khoản của tiêu chuẩn này cần phải được lập thành tài liệu.
Các tài liệu viện dẫn sau rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi, bổ sung (nếu có).
TCVN 7437:2010 (ISO 6385:2004), Nguyên lý ecgônômi trong việc thiết kế các hệ thống làm việc;
TCVN 7113:2003 (ISO 10075:1991), Nguyên lý ecgônômi liên quan đến gánh nặng tâm thần – Phần 1: Các thuật ngữ và định nghĩa chung;
TCVN 7113-2:2002 (ISO 10075-2:1996), Nguyên lý về ecgônômi liên quan đến gánh nặng tâm thần – Phần 2: Các nguyên lý thiết kế.
Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa có trong TCVN 7437:2010 (ISO 6385:2004), TCVN 7113:2003 (ISO 10075:1991), TCVN 7113-2:2002 (ISO 10075-2:1996) và các thuật ngữ sau:
3.1. Độ khách quan (objectivity)
Mức độ mà các kết quả thu được từ việc áp dụng một dụng cụ là độc lập với người sử dụng dụng cụ, phân tích và diễn giải số liệu
3.2. Độ tin cậy (reliability)
Độ chính xác mà một phương pháp hoặc một dụng cụ có thể đo được cái mà nó cần đo
CHÚ THÍCH Độ tin cậy có thể được đánh giá như độ đồng nhất, tính nhất quán hoặc độ ổn định của phương pháp đo, hoặc trong trường hợp có từ hai hay nhiều người đánh giá, được xem như độ tin cậy giữa những người tham gia đánh giá. Độ tin cậy có liên quan mật thiết đến độ khái quát.
3.2.1. Độ đồng nhất (homogeneity)
Mức độ mà tất cả các phần hoặc các mục của một quy trình đo cùng một đặc tính
3.2.2. Độ nhất quán (consistency)
Mức độ mà các phần khác nhau hoặc các hình thức song song của một dụng cụ đo dẫn tới các kết quả tương đồng, ví dụ: bằng cách chia nhỏ một tỷ lệ ra làm hai hay nhiều phần hoặc áp dụng cùng lúc hai hoặc nhiều các hình thức song song của cùng một dụng cụ
3.2.3. Độ ổn định (stability)
Mức độ mà (thời gian thường bị trễ) của sự tái lập một quy trình đo cho các kết quả tương đồng
3.2.4. Độ tin cậy giữa những người đánh giá (inter-rater-reliability)
Mức độ mà hai hay nhiều người đánh giá cho cùng kết quả khi tiến hành đo cùng đặc tính
3.3. Độ đúng (validity)
Mức độ mà một phương pháp hay một dụng cụ có thể đo được theo dự định
CHÚ THÍCH Độ đúng có thể được đánh giá thông qua tính đúng đắn được thừa nhận cùng lúc (ví dụ: bằng việc công nhận các kết quả với kết quả một quy trình đã biết được áp dụng đồng thời để đo một khía cạnh dự định), thẩm định tính đúng đắn liên quan theo tiêu chí (ví dụ: bằng việc thiết lập mối liên hệ với một tiêu chí liên quan), hoặc tính đúng đắn theo hệ số (ví dụ: bằng cách minh họa một quy trình đo đánh giá các khía cạnh cụ thể của một kết cấu).
3.4. Độ nhạy (sensitivity)
Mức độ mà một phương pháp hoặc dụng cụ có khả năng phân biệt giữa các mức độ khác nhau của đối tượng đo, ví dụ: mức độ khác nhau của sự căng thẳng hoặc mệt mỏi tâm thần.
3.5. Độ chẩn đoán (diagnosticity)
Mức độ mà một phương pháp hoặc một dụng cụ có khả năng phân biệt giữa các loại và các nguồn gây gánh nặng tâm thần khác nhau, ví dụ: các yêu cầu giác quan... hoặc những ảnh hưởng của nó, ví dụ: phân biệt giữa mệt mỏi, buồn tẻ, chán nản hoặc giảm sự tỉnh táo.
3.6. Độ khái quát (generalizability)
Mức độ mà một điểm đo được (đơn vị đo) có thể được khái quát thành một tập hợp các tình huống xác định (các điều kiện căng thẳng/stress) và/hoặc quần thể công nhân lao động
3.6.1. Độ khái quát tương đối (relative generalizability)
Mức độ mà những thứ bậc của các điều kiện gánh nặng công việc/con người, ví dụ: từ thấp đến cao, có thể tái lập được (như trong các quyết định liên quan đến vị trí tương đối)
3.6.2. Độ khái quát tuyệt đối (absolute generalizability)
Mức độ mà stress/căng thẳng tuyệt đối liên quan đến các điều kiện làm việc/con người cụ thể không liên quan đến stress/căng thẳng gắn với các điều kiện làm việc/con người khác có thể được tái lập (tương tự như trong những quyết định liên quan đến các giá trị tuyệt đối)
CHÚ THÍCH Xem Phụ lục A để tìm hiểu rõ hơn về độ khái quát.
3.7. Độ hữu dụng (usability)
Chừng mực mà người sử dụng một sản phẩm nhằm đạt được những mục tiêu nhất định với sự phù hợp, hiệu quả và hài lòng trong những điều kiện nhất định.
[ISO 9241-11:1998, định nghĩa 3.1]
CHÚ THÍCH Trong tiêu chuẩn này, sản phẩm được coi là một dụng cụ
3.8. Các giá trị tới hạn (critical values)
Tiêu chuẩn tham khảo để ước lượng các điểm đo và/hoặc các quyết định đạt hay không đạt
CHÚ THÍCH Việc thiết lập các giá trị tới hạn hàm ý rằng các điểm đo được của dụng cụ đo đang quan tâm làm cho các quyết định hoàn toàn mang độ chính xác cao. Ngoài ra, cần nói rõ trong điều kiện nào thì các giá trị tới hạn đúng đắn (ví dụ: các phương pháp đo sau thử nghiệm v.v...)
4. Đo và đánh giá gánh nặng tâm thần
4.1. Nguyên lý chung
Gánh nặng tâm thần không phải là một khái niệm đơn nhất và đơn chiều, do đó việc đánh giá và đo gánh nặng tâm thần không thể là một quy trình cố định. Không có một cách thức nào riêng biệt và tốt nhất để áp dụng cho việc đánh giá gánh nặng tâm thần bởi cách phù hợp nhất để tiến hành đo và đánh giá gánh nặng tâm thần lại phụ thuộc vào mục đích đánh giá, mà mục đích này có thể yêu cầu đánh giá các khía cạnh khác nhau của gánh nặng tâm thần, áp dụng các kỹ thuật đánh giá và mức độ chính xác khác nhau.
Do đó, mô hình đánh giá gánh nặng công việc trong tiêu chuẩn này là một cấu trúc ba chiều trong đó có tính đến:
– Các khía cạnh khác nhau của gánh nặng lao động tâm thần, ví dụ: stress tâm thần, căng thẳng tâm thần, mệt mỏi tâm thần v.v...
– Các kỹ thuật đo khác nhau, ví dụ: phân tích nhiệm vụ, đánh giá thực hiện, đánh giá chủ quan hoặc đo các chỉ số tâm sinh lý,
– Các mức độ chính xác khác nhau, ví dụ: đo theo mục đích, sàng lọc hoặc mức chuẩn xác của phương pháp đo.
Theo TCVN 7113:2003 (ISO 10075:1991), các khía cạnh cần được phân biệt là stress tâm thần, căng thẳng tâm thần và những ảnh hưởng của căng thẳng tâm thần trong một cá thể. Việc đánh giá và đo vì vậy phải thực hiện theo các bước khác nhau theo quy trình stress-căng thẳng ảnh hưởng, điều đó có nghĩa là:
– Đánh giá các điều kiện làm việc gây ra stress tâm thần, tương tự như trong việc thiết kế và đánh giá hệ thống làm việc;
– Đánh giá và đo căng thẳng tâm thần tạo ra bởi stress tâm thần, ví dụ: để đánh giá khả năng chịu đựng căng thẳng;
– Đo ảnh hưởng của sự căng thẳng xuất hiện ở người lao động, ví dụ: mệt mỏi, buồn tẻ, chán nản hoặc giảm sự tập trung;
Có thể ảnh hưởng tới sức khỏe và sự an toàn, phúc lợi, khả năng làm việc và năng suất của người lao động.
Các mục đích khác nhau có thể yêu cầu những hướng tiếp cận và/hoặc các mức độ chính xác khác nhau, ví dụ: sự phân tích rủi ro đối với các công nghệ nguy hiểm ngược lại với một khảo sát nhằm mục đích đưa ra cái nhìn tổng quan về các hệ thống làm việc khác nhau. Tiêu chuẩn này không quy định mức độ chính xác nào phải được áp dụng bởi đây thực chất là vấn đề về mục đích đo và điều kiện đo, phụ thuộc vào các yếu tố như các quy định pháp luật hoặc các quy định đã được nhất trí thông qua, cũng như những xem xét về chi phí-lợi ích.
Các phương pháp áp dụng cho việc đo và đánh giá gánh nặng tâm thần, không phụ thuộc vào kỹ thuật được áp dụng, sẽ được phân loại trong tiêu chuẩn này theo 3 mức độ chính xác là thấp, trung bình và cao:
– Mức độ 1: cho mục đích đo chính xác. Mục đích của việc đánh giá gánh nặng tâm thần ở mức độ chính xác cao này là thu được thông tin đáng tin cậy và đúng đắn về bản chất của nguồn gây ra gánh nặng tâm thần ở mức dưới tải nhằm đánh giá một cách tối ưu hóa về các điều kiện làm việc. Các phương pháp được áp dụng ở mức độ này chủ yếu được sử dụng bởi các chuyên gia như: các nhà tâm lý học, ecgônômi, các chuyên gia về sức khỏe nghề nghiệp và/hoặc các nhà sinh lý học được đào tạo các kiến thức cơ bản tương ứng, có khả năng sử dụng các phương pháp đề cập trong tiêu chuẩn, cũng như trong việc diễn giải các kết quả.
– Mức độ 2: cho mục đích đo sàng lọc. Phép đo thực hiện ở mức độ này đưa ra độ chính xác trung bình và hầu hết được sử dụng cho mục đích sàng lọc là mục đích đòi hỏi độ chính xác cao hơn so với các phương pháp đo mang tính định hướng, ví dụ: khi các vấn đề về gánh nặng tâm thần có thể lường trước được hoặc tại nơi mà nguyên nhân của gánh nặng tâm thần không phù hợp phải được xác định. Các quy trình được sử dụng ở mức độ này có độ tin cậy và giá trị giải thích cao hơn, và nên được chỉ rõ nếu cần sử dụng tới các phép đo tại nơi để chỉnh sửa.
– Mức độ 3: cho mục đích định hướng. Các phương pháp ở mức độ này cho phép người sử dụng thu thập thông tin liên quan đến gánh nặng tâm thần ở độ chính xác thấp hơn. Các phương pháp này cung cấp thông tin chung về điều kiện làm việc, trạng thái chủ quan và tâm sinh lý của người lao động liên quan đến gánh nặng tâm thần, mà không tập trung quá mức vào nguyên nhân. Thông tin ở mức độ này cho phép ngăn chặn những ảnh hưởng tiêu cực thông qua việc đưa ra các quyết định quản lý ở mức thực hiện như thay đổi công việc và/hoặc các phương pháp làm việc và điều kiện làm việc. Việc đo ở mức độ này thường bị giới hạn đối với các phép đo theo định hướng, ví dụ: liên quan đến việc đo thô (với độ chính xác và tin cậy ở mức vừa phải) việc phân tích công việc, đánh giá chủ quan khả năng chấp nhận điều kiện làm việc và trạng thái chủ quan về mọi khía cạnh của gánh nặng tâm thần.
Để làm rõ ở mức độ chính xác nào thì một dụng cụ có thể được sử dụng, cần xác định rõ đối tượng đo. Cần chỉ rõ đối tượng đo là người hay là một đặc trưng. Nếu đối tượng dự định đo là một cá nhân, thì các thuộc tính tâm lý phải được đánh giá và xác định rõ trong việc đánh giá con người. Trường hợp đối tượng chủ định đo là một đặc trưng mang tính chất tình huống thì các thuộc tính tâm lý sẽ liên quan đến việc đánh giá điều kiện. Điều này sẽ được mô tả chi tiết trong tình huống đánh giá độ khái quát (xem 4.2.7).
Để làm rõ ở mức độ chính xác nào thì một dụng cụ có thể được sử dụng, cần có một sự phân biệt dựa trên phương pháp đo căn cứ vào các điểm số/lần quan sát đơn lẻ hay điểm số/lần quan sát trung bình. Tất cả các quy trình đánh giá chắc chắn sẽ tạo ra một lỗi đo và lỗi này có thể được giảm thiểu bằng cách lấy mức trung bình của một lượng điểm số/lần quan sát. Một dụng cụ đạt được các yêu cầu về mức định hướng cho các điểm số/quan sát đơn lẻ có thể đạt được các yêu cầu về mức sàng lọc dành cho các điểm/quan sát trung bình nếu một số các điểm thích hợp được sử dụng. Điểm số/lần quan sát được yêu cầu để đạt được mức độ chính xác cao hơn do đó cần được xác định.
Một dụng cụ được yêu cầu đánh giá gánh nặng tâm thần sẽ phải chứng minh được độ đúng trong việc đánh giá những khía cạnh mà độ đúng được yêu cầu và các phạm trù đo có yêu cầu độ đúng phải được xác định rõ (ví dụ: mệt mỏi tâm thần hoặc sự đơn điệu). Nếu độ đúng được yêu cầu bao gồm nhiều hơn một khía cạnh đánh giá thì tài liệu của độ đúng phải bao gồm bằng chứng cho từng lĩnh vực đo.
Nhiều kỹ thuật khác nhau có thể được áp dụng trong việc đánh giá gánh nặng tâm thần, cùng với những kỹ thuật phù hợp dành riêng cho một số phạm trù đo nhất định. Các kỹ thuật sau được áp dụng trong các trường hợp riêng biệt:
– Đo sinh lý: các phương pháp này cung cấp thông tin về trạng thái sinh lý của người lao động ở một điều kiện làm việc nhất định;
– Đánh giá chủ quan theo thang điểm: các phương pháp này cung cấp thông tin về việc làm thế nào người lao động đánh giá một cách chủ quan các mặt khác nhau của gánh nặng tâm thần tại vị trí làm việc, ví dụ: sử dụng thang đo tâm lý và họ cảm thấy như thế nào về điều kiện làm việc của mình;
– Đánh giá thực hiện: các phương pháp này đưa ra khả năng đánh giá tâm thần con người và hoạt động tâm trí ở một điều kiện lao động nhất định, ví dụ: để đánh giá sự cản trở hoặc biến đổi trong hoạt động do ảnh hưởng của gánh nặng tâm thần;
– Phân tích công việc và nhiệm vụ: các phương pháp này đánh giá các yếu tố công việc, điều kiện lao động thể lực và tâm lý xã hội, các điều kiện về môi trường và cách thức tổ chức quy trình làm việc được coi như nguồn gây ra gánh nặng tâm lý.
Các phương pháp khác nhau cần phải đạt được các mức độ tin cậy khác nhau, ví dụ: một bảng hỏi ngắn có thể phù hợp đối với phương pháp đo ở mức độ định hướng, ngược lại để chứng minh rằng một hệ thống thiết kế không gây ra tình trạng đơn điệu, cần yêu cầu các tỷ lệ với độ tin cậy phù hợp với mục đích đề ra. Để đảm bảo cho các hệ thống tới hạn an toàn và hệ thống có nguy cơ chống lại bất kỳ ảnh hưởng tiêu cực nào của gánh nặng tâm thần, cần có độ tin cậy và độ đúng cao nhất. Những dụng cụ đo không đảm bảo hợp lệ cần phải được cải tiến. Từ đó, các phương pháp với chỉ tiêu đo tâm lý cao nhất sẽ được áp dụng phục vụ các mục đích kể trên. Tính chính xác không chỉ được xác định bằng kỹ thuật đo mà còn bởi các đặc điểm mở rộng và đo các thuộc tính tâm lý, cũng như ứng dụng tương ứng của phương pháp hoặc dụng cụ.
Nếu phương pháp đo phải được áp dụng không đáp ứng được hết các yêu cầu, thì cần tham khảo ý kiến chuyên môn và các phép đo liên quan tới lĩnh vực gánh nặng tinh thần:
– Để đánh giá các rủi ro liên quan đến việc sử dụng một dụng cụ không thực sự hoàn chỉnh,
– Để đạt được sự đánh giá kết quả hợp lý.
Tuy nhiên, việc chọn lựa dụng cụ phù hợp sẽ chịu ảnh hưởng của các quy định về luật pháp hoặc các quy định đã được thông qua, cũng như những cân nhắc về chi phí-lợi ích.
4.2. Các yêu cầu về quy trình
4.2.1. Khái quát
Việc đánh giá độ khách quan, độ tin cậy, độ đúng, độ nhạy và độ chẩn đoán của một phương pháp đo có thể được thực hiện bởi bất kỳ một phương pháp phù hợp mang tính khoa học và được chấp nhận. Tiêu chuẩn này không chỉ ra một cách thức được coi là phù hợp nhất để tuân theo. Tuy nhiên, cần đưa ra một báo cáo rõ ràng về chiến lược được áp dụng phục vụ việc đánh giá đặc tính tâm lý của một phương pháp đo nhằm cho phép đánh giá tương xứng quy trình được chọn lựa và kết quả đạt được. Trong thực tế, quá trình công nhận độ đúng sẽ dựa vào mô hình đo được công nhận, ví dụ: giả sử một mô hình đo xác suất sẽ yêu cầu các đo đặc tính tâm lý xác suất, ngược lại một phương pháp tiếp cận độ khái quát sẽ yêu cầu sự ước lượng tính toán các cấu phần khác nhau và sự tính toán các hệ số độ khái quát (xem 4.2.7). Không tồn tại một phương thức nào được coi là tối ưu nhất trong việc đánh giá các đặc tính tâm lý của một dụng cụ, bởi vì điều này còn phụ thuộc vào phần nguyên lý cấu tạo bên trong dụng cụ. Tuy vậy, một hướng tiếp cận độ khái quát tính đến sự phù hợp và hiệu quả của các quy trình tính toán các thông số về độ khách quan, độ tin cậy, tính hợp lệ, độ nhạy và độ chẩn đoán cùng với những nỗ lực phù hợp. Trong bất kỳ trường hợp nào, các quy trình cần được mô tả theo cách cho phép lặp lại việc đánh giá các đặc điểm đo nghiệm tinh thần.
4.2.2. Độ khách quan
Để dẫn chứng bằng tài liệu về độ khách quan của một phương pháp đo phải cung cấp bằng chứng rằng người thực hiện việc đánh giá hoặc đo không gây ảnh hưởng gì tới các điểm số/các quan sát Kết quả tốt nhất có thể đạt được nếu có nhiều hơn hai người sử dụng phương pháp đo này thực hiện các phép đo và đồng thời phân tích dữ liệu bằng các phương pháp phân tích theo phương sai thích hợp (ANOVA) đối với những ảnh hưởng chủ yếu hoặc tương tác của người sử dụng dụng cụ. Kết quả sẽ chỉ ra các ảnh hưởng tương ứng không tồn tại, lần lượt các thành phần khác nhau được tính toán không lệch nhiều so với điểm 0. Khi tiến hành kiểm tra sự hiện diện của các ảnh hưởng này, cần đảm bảo bất kỳ một ảnh hưởng thực tế đang tồn tại của người tiến hành việc đánh giá/đo sẽ không bị bỏ sót. Do đó, xác suất sai lệch b nên được đặt ở mức 0,05 và xác suất sai lệch a nên được đặt ở mức tối thiểu là 0,20. Nếu ảnh hưởng của người tiến hành đánh giá/đo không được loại bỏ thì phương pháp đo sẽ không được coi là mang độ khách quan.
4.2.3. Độ tin cậy
Độ tin cậy có thể được đánh giá bằng các phương pháp tương quan, cả người lao động và/hoặc các tình huống được xem như đối tượng của hoạt động đo, trong đó việc xác định vị trí tương đối (trong nhóm đo hoặc tổng thể) phải được mô phỏng lại chính xác.
Hệ số tương quan không cung cấp thông tin về sự khác biệt giữa các dữ liệu thiết lập ở một mức độ tuyệt đối. Có thể thu thập những thông tin này bằng cách sử dụng các phương pháp ANOVA, đồng thời cho phép tính toán các hệ số nhất quán, ví dụ: thông qua hệ số tương quan bên trong lớp. Tính toán các mối tương quan, ví dụ: giữa những người đánh giá cho một danh mục có thể dẫn tới các mối tương quan cao hơn nếu những người tham gia đánh giá nhất trí về các nhận xét mang tính tương đối của mình và cũng tương tự như vậy đối với ước lượng mang tính chính xác của độ tin cậy, mặc dù những người đánh giá này có thể đưa ra những giá trị hoàn toàn khác nhau trong quá trình tiến hành đánh giá. Sử dụng một phương pháp tiếp cận ANOVA có thể thu được cùng một mối tương quan nhưng lại chỉ ra ảnh hưởng giữa người tham gia đánh giá.
Sự đồng nhất và/hay nhất quán của một dụng cụ đo thường được đánh giá thông qua mối tương quan giữa các cá thể hoặc toàn bộ các cá thể, hoặc thông qua mối tương quan giữa các hình thức tương đương của một phương pháp đo. Các mô hình chặt chẽ hơn của phép đo có thể yêu cầu các bước kiểm tra nghiêm ngặt hơn, ví dụ: phép phân tích theo biểu đồ thang bậc (scalogram). Các phép phân tích nhân tố, cho thấy phương pháp đo đơn chiều, có thể được sử dụng để chứng minh cho sự đồng nhất của một dụng cụ.
4.2.4. Độ đúng
Độ đúng của một quy trình đo cần được chứng minh bởi độ đúng đồng thời với một quy trình khác có độ đúng được chứng minh cho việc sử dụng có mục đích.
Nếu không có các quy trình kể trên, độ đúng cần được chứng minh thử nghiệm bằng cách thay đổi điều kiện/nhiệm vụ được giao để dẫn tới hiện tượng/những ảnh hưởng được đo, ví dụ: thay đổi số lượng stress công việc là nguyên nhân dẫn tới các mức độ mệt mỏi khác nhau, nếu sự mệt mỏi là đối tượng của việc đo. Trong trường hợp này, cường độ của stress lao động (ví dụ: độ khó của thao tác lao động) và khoảng thời gian phơi nhiễm sẽ phải được thay đổi, một sự khác biệt đơn thuần của cường độ hay thời gian tiến hành không đủ để minh họa cho độ đúng. Một loạt các nhiệm vụ phù hợp (cả ở trong điều kiện thực tế hay trong phòng thí nghiệm) cần được áp dụng, cùng với số lần thực hiện nhiệm vụ tương ứng nhằm tạo ra các ảnh hưởng phụ hoặc tương tác lẫn nhau.
CHÚ THÍCH Tập hợp các nhiệm vụ tương ứng có thể tham khảo tại AGARD STRES (tập hợp nhiệm vụ đã được tiêu chuẩn hóa dùng cho nghiên cứu về các yếu tố gây stress môi trường) [1], hoặc CTS (tập hợp nhiệm vụ tiêu chuẩn) [4]. Nếu sự căng thẳng về cảm xúc hoặc những ảnh hưởng gây căng thẳng thuộc phạm vi đo thì các nhóm với những mức độ khác nhau về stress công việc liên quan đến cảm xúc có thể được áp dụng để chứng minh cho độ đúng.
4.2.5. Độ nhạy
Độ nhạy của một dụng cụ cần được chứng minh bằng cách thử nghiệm tái hiện lại những biến đổi có kiểm soát trong gánh nặng tâm thần có tính đến cường độ, thời gian kéo dài và sự tương tác giữa chúng, ví dụ: số đề mục được ghi nhớ, số thao tác tâm thần được thực hiện hoặc giới hạn thời gian nhiệm vụ phải thực hiện. Ở điều kiện thực tế, sự khác biệt này có thể được tạo ra bằng cách chọn lựa các điều kiện đã chứng minh hoặc đã được đánh giá bởi một số chuyên gia với sự nhất trí cao nhằm tạo ra các mức độ khác biệt của stress tâm thần liên quan đến công việc.
Các cấp độ được áp dụng trong nghiên cứu độ nhạy sẽ đại diện cho tình huống sử dụng đã định của dụng cụ đo.
4.2.6. Độ chẩn đoán
Độ chẩn đoán của một dụng cụ cần được chứng minh thông qua sự phân biệt giữa các dạng gánh nặng tâm thần khác nhau, ví dụ: trong phạm vi hiệu quả của căng thẳng tâm thần phân biệt giữa mệt mỏi, buồn tẻ, nhàm chán và mất cảnh giác. Tương tự như vậy cũng được áp dụng có tính đến những yêu cầu hoặc các điều kiện stress công việc đặc thù. Việc kiểm tra độ chẩn đoán có thể được tiến hành thử nghiệm thông qua các điều kiện khác nhau hoặc dưới các điều kiện thực tế khác nhau bằng cách chọn lựa những điều kiện được biết sẽ tạo ra các dạng khác nhau của stress tâm thần liên quan đến công việc như đã được chỉ ra bởi các chuyên gia giàu kinh nghiệm khi tiến hành các phương pháp phân tích nhiệm vụ hoặc đánh giá phù hợp.
Các dạng gánh nặng được áp dụng trong nghiên cứu độ chẩn đoán cần đại diện cho tình huống chủ định sử dụng dụng cụ đo.
4.2.7. Độ khái quát
Nếu phương pháp tiếp cận khái quát hóa được áp dụng, thì độ khái quát cần được chứng minh thông qua việc sử dụng các phương pháp tiếp cận thử nghiệm hoặc giống như thử nghiệm, trong điều kiện phòng thí nghiệm và/hoặc tại thực địa, cùng với sự thay đổi của các điều kiện khác nhau, những biến đổi điển hình trong lĩnh vực quan tâm của phép đo (ví dụ: các điểm đo stress tâm thần liên quan đến công việc), cũng như trong các điều kiện được biết đến nhằm mục đích đại diện hoặc góp phần tạo ra sai số tiềm tàng của phép đo liên quan, ví dụ: thời gian trong ngày, số người tham gia, điều kiện trước khi chịu gánh nặng, kinh nghiệm. Việc đánh giá độ khái quát thường bao gồm việc ước tính các thành phần biến đổi của một phép phân tích phương sai, tùy vào mô hình cấu trúc của điểm số, ví dụ: sự phân chia thành các nguồn biến đổi khác nhau. Do vậy, mô hình đo trước tiên phải xác định được cái gì được coi là sai số và cái gì là biến động về mục tiêu. Các hệ số của độ khái quát sau đó có thể được tính toán bằng cách liên hệ biến động về mục tiêu với biến động về sai số liên quan.
4.2.8. Độ hữu dụng
4.2.8.1. Khái quát
Các phương pháp đo phải phù hợp và có hiệu quả, đáp ứng được các nhu cầu của người sử dụng, có nghĩa là đạt được mức độ chính xác trong phạm vi đo dự định, với nguồn lực tối thiểu hoặc các yêu cầu về năng lực và hướng đến những kết quả như mong đợi.
4.2.8.2. Sự phù hợp
Sự phù hợp của dụng cụ đo được xác định thông qua phép đo các thuộc tính tâm lý, đặc biệt là độ tin cậy, độ đúng, độ nhạy và độ chẩn đoán của dụng cụ đó.
4.2.8.3. Độ hiệu quả
Độ hiệu quả của một quy trình đo là một khái niệm mang tính tương đối, phụ thuộc vào độ hiệu quả và nguồn lực cần thiết để tiến hành phép đo, phân tích và diễn giải kết quả. Các quy trình đo với độ hiệu quả có thể so sánh được do vậy phải được so sánh theo nỗ lực được yêu cầu để thực hiện phép đo theo các quy trình này. Theo đó không có yêu cầu định lượng chung nào có thể được quy định.
4.2.8.4. Sự thỏa mãn
Ngoài việc phải phù hợp và độ hiệu quả thì một quy trình đo phải thỏa mãn các yêu cầu của người sử dụng. Những phàn nàn về quy trình đo là dấu hiệu về sự không thỏa mãn trong khi đó nếu không có sự phàn nàn nào thì chưa hẳn được hiểu là thỏa mãn. Do đó, việc đánh giá các quy trình đo là rất quan trọng đối với những yêu cầu của người sử dụng và để lưu hồ sơ kết quả với mục đích từng bước hoàn thiện dụng cụ đo. Tuy nhiên, không thể xác định được các yêu cầu về định lượng do chúng phụ thuộc vào mong muốn của người sử dụng (khác nhau) trong những tình huống khác nhau.
4.3. Các yêu cầu về định lượng đối với dụng cụ đo
4.3.1. Khái quát
Nói chung, những dụng cụ này phải được lựa chọn để thỏa mãn các tiêu chuẩn đo thuộc tính tâm lý được thiết lập trong tiêu chuẩn này với một mục đích cho trước và nhu cầu sử dụng đã định.
4.3.2. Các yêu cầu liên quan đến độ khách quan
Kết quả đo phải hoàn toàn độc lập với bất kỳ tác động đáng kể nào của người tiến hành đo, phân tích và báo cáo kết quả thực hiện đánh giá. Điều này phải được chứng minh trong nghiên cứu độ đúng, ví dụ: bằng phép phân tích phương sai khi không có tác động hoặc có các ảnh hưởng qua lại đối với người tiến hành đánh giá.
4.3.3. Các yêu cầu liên quan đến độ tin cậy
Ít nhất phải đạt được các hệ số đồng nhất hoặc nhất quán (ví dụ: khi được xác định bởi hệ số Cronbach α đối với độ đồng nhất hoặc một sự tương quan giữa các dạng thức song song cho tính nhất quán) tại Bảng 1 về các mức độ khác nhau của phép đo.
CHÚ THÍCH Yêu cầu về độ tin cậy là 0,7 (khi được đo bởi một hệ số tương quan) tương đương với một tỷ lệ của khoảng 50% sai số và 50% biến động về mục tiêu, được đặt ra như một yêu cầu tối thiểu đối với quy trình đo đủ tin cậy.
Độ tin cậy giữa người tiến hành đánh giá yêu cầu cùng các giá trị như độ tin cậy đồng nhất.
Độ ổn định phụ thuộc vào khoảng thời gian tạm ngưng giữa các phép đo và các sự kiện/chuyển biến xen kẽ. Do vậy độ ổn định giữa các phép đo trong những khoảng thời gian đo kế tiếp nhau phải so sánh được với các yêu cầu nêu trên đối với độ đồng nhất và nhất quán (ngoại trừ đối với thang điểm chủ quan, khi những yêu cầu trên chỉ áp dụng cho các dạng song song).
4.3.4. Các yêu cầu liên quan đến độ đúng
Trong việc xác định độ đúng đồng thời (có nghĩa là hai hoặc nhiều hơn cách đo song song độc lập, ví dụ: hai thang đo tâm lý khác nhau) phải đạt được các hệ số hợp lệ đưa ra tại Bảng 1. Những giá trị này liên quan đến những số liệu đo trong cùng một bước của quá trình ảnh hưởng- căng thẳng-stress (xem TCVN 7113 :2003 [ISO 10075 :1991]) và trong cùng một kỹ thuật đo.
Việc tính toán các hệ số hợp lệ qua các bước trong quá trình ảnh hưởng-căng thẳng-stress là một hình thức của độ đúng dự báo và sẽ luôn cho kết quả hệ số hợp lệ thấp hơn so với việc tính trong cùng một bước. Tuy nhiên, áp dụng cùng giới hạn đối với độ đúng.
Nếu yêu cầu độ đúng giữa các yếu tố (factorial) đối với một dụng cụ đa chiều thì tương quan giữa yếu tố/thang yếu tố phải < 0,4 .
Nếu độ đúng yêu cầu nhiều hơn một bước trong quy trình ảnh hưởng-stress-căng thẳng, thì phải được chứng minh cho toàn bộ các bước kể trên với các giá trị hợp lệ riêng biệt cho trước.
4.3.5. Các yêu cầu về độ nhạy
Các phương pháp đo phải có khả năng phân biệt được càng nhiều càng tốt những mức độ khác nhau của gánh nặng công việc thuộc một phạm vi dự định trong quy trình ảnh hưởng-stress-căng thẳng, ví dụ: các mức độ khác nhau về độ khó của nhiệm vụ từ CTS [4] hay bộ dụng cụ AGARD STRES [1], và không chỉ giữa các trạng thái cực đoan.
Một quy trình có thể phân biệt được số lượng lớn các mức của phạm vi đo dự định sẽ cho độ nhạy cao hơn (có nghĩa là độ nhạy cao hơn sẽ cho phép phân biệt được nhiều trạng thái hơn). Bảng 1 cho thấy số mức được phân biệt ở mỗi độ chính xác.
4.3.6. Các yêu cầu về độ chẩn đoán
Các phương pháp đo phải có khả năng phân biệt được các nguồn stress khác nhau và các loại tác động khác nhau của căng thẳng tâm thần, ví dụ: các nhiệm vụ khác nhau trong bộ dụng cụ AGARD STRES. Do vậy, một quy trình đo phải đặc trưng cho phạm vi đo dự định và không bị ảnh hưởng bởi các phạm vi khác. Tương quan với các phạm vi khác phải ở mức thấp nhất có thể (ví dụ: mệt mỏi do sự chán nản). Các tương quan > 0,40 cho thấy sự chồng chéo đáng kể và do đó thiếu đi độ chẩn đoán. Bảng 1 cho thấy các tương quan được yêu cầu cho mỗi mức độ chính xác.
Đối với việc chứng minh độ chẩn đoán, dụng cụ phải được áp dụng trong các trường hợp có nhiều loại gánh nặng lao động khác nhau (ví dụ: nhiều loại điều kiện gây stress khác nhau, nhiều loại ảnh hưởng khác nhau), và cũng phải cho thấy dụng cụ chỉ ra những khía cạnh gánh nặng lao động chỉ được dự định áp dụng.
Một quy trình phổ biến để chứng minh độ chẩn đoán là phép tiếp cận đa đặc điểm, đa phương pháp, gồm nhiều phương pháp đo được áp dụng cho những phạm vi đo đa dạng và độ chẩn đoán được thể hiện bằng các mối tương quan cao hơn trong cùng một phạm vi đo so với tương quan giữa các phạm vi đo khác.
4.3.7. Các yêu cầu liên quan đến độ khái quát
Nếu sử dụng cách tiếp cận lý thuyết–G, thì các nghiên cứu về độ khái quát (các nghiên cứu-G) phải là đại diện có thể cho tình huống sử dụng dự định, có nghĩa là tất cả các điều kiện có thể có liên quan đến tình huống đo phải đại diện trong nghiên cứu để có thể cho phép ước tính những sai lệch liên quan và tương tự như vậy đối với độ khái quát của điểm số mục tiêu.
Độ tin cậy theo phương pháp quan điểm-G đòi hỏi độ khái quát cao cho điểm số tổng thể, có tính đến các điều kiện đo khác nhau (về thời gian, hạng mục, tính lặp lại...). Do vậy, những hệ số G đưa ra trong Bảng 2 cho điểm tổng thể phải đạt được cho các mức tương ứng từ mức 3 đến mức 1.
Sự xác nhận tính đúng đắn đồng thời sử dụng các phương pháp khác nhau dự định đo cùng đối tượng theo phương pháp quan điểm-G, yêu cầu chứng minh hệ số tải cao của tất cả các dụng cụ với đối tượng đo (điểm số tổng thể và/hoặc điểm số hỗn hợp) trong phép phân tích đa biến. Tính đúng đắn giả định có thể được chứng minh bằng các hệ số -G cao, áp dụng cách tiếp cận thử nghiệm nghiêm ngặt. Các hệ số G như thể hiện ở Bảng 2 sẽ phải đạt được vì mục tiêu này.
Để chứng minh độ nhạy, phải phân biệt số lượng các mức cho trong Bảng 2. Điều này đòi hỏi độ khái quát cao trên tất cả các mức độ được phân biệt. Ngoài ra, nó phải được chứng minh rằng mọi mức độ có thể được phân biệt một cách chính xác (không chỉ đối với các mức độ cực đoan, khi từ 2 mức độ trở lên được tiến hành phân biệt) bằng cách đưa ra các khoảng tin cậy 95% cho từng mức độ.
Đối với việc chứng minh độ chẩn đoán, dụng cụ đo nên được áp dụng theo nhiều tình huống đa dạng khác nhau hoặc dưới những điều kiện khác nhau trong từng dạng gánh nặng lao động riêng biệt. Sẽ phải có các hệ số G như xác định tại Bảng 2 nếu dụng cụ đo được áp dụng trong tình huống hay trong các điều kiện thí nghiệm dạng gánh nặng lao động mà dụng cụ đó sẽ đo. Nếu dụng cụ được áp dụng dưới các điều kiện khác thì các hệ số G phải thấp hơn (ví dụ: gần điểm 0). Sử dụng một thiết kế đa phương pháp và một phép phân tích đa chiều, sẽ đạt được các gánh nặng hệ số cao trên những phạm vi dự định đo đối với tất cả các dụng cụ dự định hoặc đã biết để đo các phạm vi này, ngược lại sẽ đạt được các gánh nặng gần điểm 0 đối với các dụng cụ dự định để đo các phạm vi khác cũng như đối với dụng cụ liên quan đến những phạm vi mà nó không được dự định sử dụng để đo.
4.3.8. Tóm tắt các yêu cầu định lượng
Bảng 1 đưa ra tóm tắt về các yêu cầu định lượng, sử dụng lý thuyết kiểm tra kinh điển và Bảng 2 đưa ra thông tin về yêu cầu này cho cách tiếp cận lý thuyết -G.
Bảng 1 – Yêu cầu định lượng đối với quy trình đo mức chính xác khác nhau sử dụng các cách tiếp cận mang tính lý thuyết kiểm tra kinh điển
Mức chính xác | Độ khách quan | Độ tin cậy | Độ đúng | Độ nhạy | Độ chẩn đoán |
1 phục vụ mục đích đo chính xác | Không có tác động | ≥ 0,9 | ≥ 0,5 | ≥ 5 mức | < 0,10 |
2 phục vụ mục đích sàng lọc | Không có tác động | ≥ 0,8 | ≥ 0,4 | ≥ 3 mức | < 0,20 |
3 phục vụ mục đích định hướng | Không có tác động | ≥ 0,7 | ≥ 0,3 | ≥ 2 mức | < 0,40 |
Bảng 2 – Yêu cầu định lượng đối với các quy trình đo mức chính xác khác nhau sử dụng một cách tiếp cận - G mang tính lý thuyết
Mức chính xác | Các hệ số G | ||||
Độ khách quan | Độ tin cậy | Độ đúng | Độ nhạy | Độ chẩn đoán | |
1 phục vụ mục đích đo chính xác | 0 | ≥ 0,9 | ≥ 0,9 | ≥ 5 mức | ≥ 0,90 |
2 phục vụ mục đích sàng lọc | 0 | ≥ 0,8 | ≥ 0,8 | ≥ 3 mức | ≥ 0,80 |
3 phục vụ mục đích định hướng | 0 | ≥ 0,7 | ≥ 0,7 | ≥ 2 mức | ≥ 0,70 |
Trường hợp không có sẵn những dụng cụ đo có thể đạt được các tiêu chí trên, cần phải nghiên cứu phát triển các dụng cụ đó. Trước đó, những phương pháp bảo đảm các chỉ tiêu đo tâm lý cao nhất cần được sử dụng (xem 4.1). Trong bất kỳ trường hợp nào, các dụng cụ với độ tin cậy < 0,5 sẽ không được sử dụng.
CHÚ THÍCH Yêu cầu ở Bảng 1 và Bảng 2 không áp dụng cho các hoạt động đánh giá rủi ro theo quy định.
4.4. Các yêu cầu về hồ sơ tài liệu
4.4.1. Các yêu cầu hồ sơ tài liệu về việc xây dựng (thiết kế) một dụng cụ đo gánh nặng tâm thần
Hồ sơ tài liệu đề cập đến việc xây dựng một dụng cụ nhằm mục đích đo gánh nặng tâm thần phải bao gồm các thông tin sau:
- Năm xây dựng;
- Tên và tư cách người xây dựng (thiết kế) dụng cụ;
- Phạm vi đo dự kiến (ví dụ: stress tâm thần, căng thẳng tâm thần, mệt mỏi tâm thần, xem TCVN 7113 :2003 [ISO 10075 :1991]);
- Mức độ chính xác của dụng cụ và chỉ tiêu liên quan đến độ tin cậy, độ đúng, độ nhạy và độ chẩn đoán;
- Cơ sở lý thuyết của phương pháp tiếp cận đo;
- Số người tham gia/điều kiện/những vấn đề chung mà phương pháp đo dự định thực hiện;
- Số người tham gia/điều kiện/những vấn đề chung mà các chỉ tiêu đo tâm lý đã được xác định;
- Các đặc điểm đo tâm lý của dụng cụ, ví dụ: độ tin cậy, hợp lệ, các hệ số-tính khái quát;
- Thiết kế nội dung nghiên cứu để xác định các đặc tính đo tâm lý;
- Các nhiệm vụ/điều kiện (và sự biến đổi của chúng) được áp dụng để xác định độ đúng;
- Quá trình làm việc và giờ nghỉ giải lao (và trình tự của chúng) được sử dụng để xác định độ đúng;
- Các yêu cầu/bắt buộc liên quan đến những điều kiện tiến hành đo;
- Các yêu cầu/bắt buộc liên quan đến thiết bị được sử dụng;
- Các yêu cầu/bắt buộc liên quan đến việc đào tạo và trình độ nhân lực tiến hành đo (ví dụ: nhà tâm lý học, ecgônômi, sinh lý học, người quản lý, chuyên gia sức khỏe nghề nghiệp v.v…);
- Các tiêu chuẩn viện dẫn, nếu có, dành cho người tham gia, nhiệm vụ hoặc toàn bộ các điều kiện;
- Các quy trình/điều kiện phải tuân theo khi tiến hành đo;
- Các quy trình/điều kiện phải tuân theo khi phân tích dữ liệu;
- Các quy trình/điều kiện phải tuân theo khi diễn giải dữ liệu;
- Ước tính về nguồn lực (thời gian, con người, thiết bị) cần thiết để tiến hành phép đo;
- Tỷ lệ trả lời mẫu thử trong các bảng hỏi ;
- Mô tả quy trình phát triển, bao gồm cả kết quả từ việc đánh giá nghiên cứu về hiệu suất của dụng cụ và sự thỏa mãn của người sử dụng dụng cụ đó;
- Cung cấp thông tin yêu cầu điền đầy đủ vào danh mục kiểm tra tại Phụ lục A.
4.4.2. Các yêu cầu hồ sơ tài liệu về báo cáo các số liệu đo và đánh giá gánh nặng tâm thần
Báo cáo đo phải bao gồm những thông tin sau:
- Mục đích đo;
- Mô tả các dụng cụ đo [bao gồm một mô tả tóm tắt về cơ sở lý thuyết, phạm vi đo (ví dụ: stress tâm thần, căng thẳng tâm thần, mệt mỏi tâm thần), mức độ chính xác];
- Tên và bằng cấp chính thức của người chịu trách nhiệm tiến hành đo;
- Ngày, tháng tiến hành đo;
- Số lượng, độ tuổi, giới tính và kinh nghiệm của người tham gia hoặc người lao động là đối tượng được coi là điều kiện của hoạt động đo (mô tả mẫu kiểm tra);
- Mô tả tỷ lệ trả lời và đại diện của (các) nhóm trả lời trong bảng hỏi;
- Các biện pháp đảm bảo độ khách quan của quy trình đo;
- Các biện pháp đảm bảo giấu tên/giữ bí mật (khi có thể áp dụng được);
- Các biện pháp để được phép công bố thông tin;
- Hoàn thiện danh mục kiểm tra tại Phụ lục B;
- Mô tả quy trình đo;
- Mô tả điều kiện gánh nặng lao động (nơi làm việc, nhiệm vụ v.v…);
- Những bắt buộc liên quan đến phép đo;
- Nhận xét từ người tham gia hoặc người lao động;
- Những khác thường trong quá trình đo;
- Mô tả kết quả, nếu có thể áp dụng với từng dụng cụ;
- Thảo luận và giải thích kết quả và kết luận cho hoạt động tiếp theo;
- Chữ ký và ngày tháng.
Thông tin bổ trợ liên quan đến độ khái quát
Độ khái quát đề cập đến độ tin cậy mà các phép đo có thể được khái quát để áp dụng cho một nhóm người và/hoặc một hay nhiều điều kiện tổng thể. Một nhóm tổng thể bao gồm tất cả các điều kiện mà phép đo được xem như có liên quan (ví dụ: các khoảng thời gian khác nhau trong ngày, các phương án thiết kế thông số hiển thị), và đối với các điều kiện có trong thiết kế nơi làm việc được coi như một mẫu đại diện.
Điển hình là chỉ số đo được trên một dụng cụ hoặc phương pháp được sử dụng để đưa ra quyết định về chất lượng của thiết kế nơi làm việc hoặc sự cần thiết hoàn thiện các phương pháp hiệu chỉnh. Có thể tồn tại hai loại quyết định, quyết định tương đối và quyết định tuyệt đối. Quyết định tương đối dự đoán một nghiên cứu so sánh, ví dụ: các trình bày thiết kế khác nhau. Trong trường hợp này, quyết định căn cứ theo vị trí và thứ bậc tương đối của các phương án thiết kế. Điều này có nghĩa là những giải thích mang tính tương đối đưa ra quyết định về việc một phương án thiết kế tốt hơn như thế nào so với các phương án thiết kế khác. Nếu không có thiết kế nào khác tồn tại, có nghĩa là chỉ có duy nhất một giải pháp, và quyết định đưa ra dựa trên mức độ tuyệt đối của của chỉ số đo được. Do vậy, các diễn giải tuyệt đối đưa ra những quyết định về một chỗ làm việc được thiết kế tốt ra sao liên quan đến gánh nặng tâm thần, không tính tới các phương án thiết kế khác. Lý thuyết về độ khái quát cung cấp hai hệ số xác thực tương tự, mô tả tính chính xác của mỗi loại quyết định, được gọi là:
a) hệ số G- tương đối;
b) F hoặc hệ số G- tuyệt đối.
Các hệ số G mô tả sự chính xác mà với nó ta có thể khái quát hóa từ một kết quả đo được của một mẫu đo thành một kết quả tổng thể.
Lý thuyết về độ khái quát vượt quá lý thuyết kiểm tra thông thường bởi
a) Khả năng xử lý lỗi các nguồn phức tạp của sai số đo;
b) Khả năng xử lý các yếu tố có tính hệ thống của sai số đo;
c) đề xuất các hệ số tin cậy được điều chỉnh cho dự kiến sử dụng các số liệu đo;
d) Phân biệt giữa quyết định tương đối và quyết định tuyệt đối.
Ngoài ra, nhiều thông số đề cập trên, như tính nhất quán nội tại, sự ổn định và độ khách quan, có thể được xác định trong một nghiên cứu, nếu một thiết kế phù hợp được sử dụng chẳng hạn như các đầu mục và các thời điểm tiến hành đo và người thực hiện việc đo được xem như những nhân tố mang tính thử nghiệm. Tương tự như vậy, lý thuyết về độ khái quát có thể được áp dụng để điều tra độ nhạy và độ chẩn đoán của một dụng cụ đo, bắt đầu từ thiết lập thử nghiệm, tính đến cả những loại và mức độ gánh nặng lao động khác nhau.
Danh mục kiểm tra cho việc chọn lựa dụng cụ
Khi tiến hành chọn lựa một dụng cụ, danh mục kiểm tra tại Bảng B.1 có thể hỗ trợ trong việc đưa ra một quyết định có căn cứ.
Điền thông tin yêu cầu từ thông tin được cung cấp từ sách hướng dẫn sử dụng hoặc những ấn phẩm liên quan đến dụng cụ. Khoanh tròn các yêu cầu liên quan và kiểm tra xem yêu cầu này có thỏa mãn không. Khi không có yêu cầu về định lượng, kiểm tra sự phù hợp của mục đích dự định đo.
Bảng B.1 - Danh mục kiểm tra cho việc chọn lựa dụng cụ
Mục | Điều của tiêu chuẩn TCVN 7113-3 (ISO 10075-3) | Yêu cầu tại | Yêu cầu được thỏa mãn | Không phù hợp | Nhận xét | ||||
Mức độ chính xác 1 | Mức độ chính xác 2 | Mức độ chính xác 3 | Có | Không | |||||
1 | Lý thuyết kiểm tra kinh điển |
|
|
|
|
|
|
|
|
1.1 | Độ khách quan | 4.3.2 | Không có tác động | Không có tác động | Không có tác động |
|
|
|
|
1.2 | Độ tin cậy | 4.3.3 | ≥ 0,9 | ≥ 0,8 | ≥ 0,7 |
|
|
|
|
1.3 | Độ đúng | 4.3.4 | ≥ 0,5 | ≥ 0,4 | ≥ 0,3 |
|
|
|
|
1.4 | Độ nhạy | 4.3.5 | ≥ 5 mức | ≥ 3 mức | ≥ 2 mức |
|
|
|
|
1.5 | Độ chẩn đoán | 4.3.6 | < 0,10 | < 0,20 | < 0,40 |
|
|
|
|
2 | Độ khái quát | 4.3.7 |
|
|
|
|
|
|
|
2.1 | Độ khách quan | 0 | 0 | 0 |
|
|
|
| |
2.2 | Độ tin cậy | ≥ 0,9 | ≥ 0,8 | ≥ 0,7 |
|
|
|
| |
2.3 | Độ đúng | ≥ 0,9 | ≥ 0,8 | ≥ 0,7 |
|
|
|
| |
2.4 | Độ nhạy | ≥ 5 mức | ≥ 3 mức | ≥ 2 mức |
|
|
|
| |
2.5 | Độ chẩn đoán | ≥ 0,90 | ≥ 0,80 | ≥ 0,70 |
|
|
|
| |
3 | Độ hữu dụng | 4.2.8 |
|
|
|
|
|
|
|
3.1 | Độ hiệu quả | 4.2.8.2 |
|
|
|
|
|
|
|
3.2 | Hiệu năng | 4.2.8.3 |
|
|
|
|
|
|
|
3.3 | Độ thỏa mãn | 4.2.8.4 |
|
|
|
|
|
|
|
THƯ MỤC TÀI LIỆU THAM KHẢO
[1] AGARD, Human performance assessment methods, AGARD-AGARDograph-308, Neuilly sur Seine: NATO-AGARD, 1989;
[2] BRENNAN, R.L., Generalizability theory, New York, Springer, 2001;
[3] CROCKER, L., & ALGINA, J., Introduction to classical and modern test theory. Chicago, III.: Holt, Rinehart and Winston, 1986;
[4] Shingeldecker, C.A., A task battery for applied human performance assessment research. AFAMRL Techniacal Report 84-071; Dayton: Air Force Aerospace Medical Research Laboratory, 1984;
[5] ISO 9241-11:1998, Ergonomic requirement for office work with visual display terminals (VDTs) – Part 11: Guidance on usability.
Ý kiến bạn đọc
Nhấp vào nút tại mỗi ô tìm kiếm.
Màn hình hiện lên như thế này thì bạn bắt đầu nói, hệ thống giới hạn tối đa 10 giây.
Bạn cũng có thể dừng bất kỳ lúc nào để gửi kết quả tìm kiếm ngay bằng cách nhấp vào nút micro đang xoay bên dưới
Để tăng độ chính xác bạn hãy nói không quá nhanh, rõ ràng.