Documentation - Methods for examining documents, determining their subjects, and selecting indexing terms
Lời nói đầu
TCVN 10669:2014 hoàn toàn tương đương ISO 5963:1985.
TCVN 10669:2014 do Vụ Thư viện biên soạn, Bộ Văn hóa,Thể thao và Du lịch đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.
Lời giới thiệu
Tiêu chuẩn quốc gia TCVN 10669:2014 được biên soạn theo phương thức hoàn toàn tương đương tiêu chuẩn quốc tế ISO 5963:1985 Documentation - Methods for examining documents, determining their subject and selecting indexing terms.
Tiêu chuẩn Quốc tế ISO 5963:1985 do Ban Kỹ thuật Tiêu chuẩn Quốc tế ISO/TC 46, Thông tin và Tư liệu biên soạn. ISO 5963:1985 đã được xem xét và phê duyệt lại vào năm 2013. Sau khi tiến hành xem xét, ISO 5963:1985 đã được bỏ phiếu tán thành vẫn tiếp tục sử dụng.
Định chỉ mục là một dạng xử lý thông tin được áp dụng rộng rãi trong các thư viện và cơ quan thông tin với mục đích tạo ra các điểm truy cập thông tin theo nội dung tài liệu, tạo lập các công cụ tra cứu, xây dựng cơ sở dữ liệu phục vụ cho việc truy tìm thông tin.
Phân loại tài liệu, định tiêu đề chủ đề và định từ khóa là các khâu định chỉ mục cụ thể được nhiều thư viện và cơ quan thông tin thực hiện. Tiêu chuẩn này không hướng dẫn đến từng dạng định chỉ mục cụ thể nêu trên mà chỉ đưa ra những hướng dẫn chung liên quan đến quy trình và các yếu tố cần đảm bảo nhằm kiểm soát chất lượng định chỉ mục tài liệu.
Một số chú thích bổ sung trong nội dung tiêu chuẩn được nêu tại Phụ lục B.
THÔNG TIN VÀ TƯ LIỆU - PHƯƠNG PHÁP PHÂN TÍCH TÀI LIỆU, XÁC ĐỊNH CHỦ ĐỀ VÀ LỰA CHỌN CÁC THUẬT NGỮ ĐỊNH CHỈ MỤC
Documentation - Methods for examining documents, determining their subjects, and selecting indexing terms
1.1. Tiêu chuẩn này mô tả các cách thức được khuyến cáo áp dụng khi phân tích tài liệu, xác định chủ đề của các tài liệu và lựa chọn các thuật ngữ định chỉ mục thích hợp. Tiêu chuẩn chỉ tập trung vào các giai đoạn ban đầu của việc định chỉ mục và không đề cập tới cách thực hiện của bất kỳ một hệ thống định chỉ mục cụ thể nào, dù là tiền kết hợp hay hậu kết hợp. Tiêu chuẩn cũng mô tả các kỹ thuật chung để phân tích tài liệu nên áp dụng ở mọi tình huống định chỉ mục. Tuy nhiên, các phương pháp này đặc biệt hướng tới những hệ thống định chỉ mục trong đó chủ đề của tài liệu được thể hiện ở dạng tóm tắt và các khái niệm được diễn đạt bằng thuật ngữ của một ngôn ngữ định chỉ mục có kiểm soát. Trong ngữ cảnh này, một ngôn ngữ được kiểm soát thường là một tập con của các thuật ngữ được lựa chọn từ ngôn ngữ tự nhiên và được điều chỉnh bởi công cụ quy ước, ví dụ: từ điển từ chuẩn. Tuy nhiên, các phương pháp này cũng có thể áp dụng với những hệ thống trong đó các khái niệm được trình bày với mục đích truy tìm thông tin theo các ký hiệu được lựa chọn từ các bảng của một khung phân loại.
1.2. Các kỹ thuật được mô tả trong tiêu chuẩn có thể được sử dụng bởi bất kỳ cơ quan nào trong đó người định chỉ mục phân tích các chủ đề của tài liệu và thể hiện các chủ đề này bằng các thuật ngữ định chỉ mục. Các kỹ thuật này không áp dụng với những cơ quan sử dụng các kỹ thuật định chỉ mục tự động, trong đó những thuật ngữ ở dạng văn bản được tổ chức thành các tập hợp hoặc các lớp theo các tiêu chí có thể do máy tính thiết lập, ví dụ, định chỉ mục theo số lần xuất hiện và/hoặc vị trí liền kề trong văn bản, mặc dù mục đích của các hệ thống này là như nhau.
1.3.Tiêu chuẩn này chủ yếu được biên soạn như là một bản hướng dẫn dành cho những người định chỉ mục trong các giai đoạn phân tích tài liệu và nhận dạng các khái niệm. Tiêu chuẩn này cũng có thể hữu ích cho việc phân tích yêu cầu của người dùng tin và chuyển dịch các yêu cầu đó thành các thuật ngữ được kiểm soát của một ngôn ngữ định chỉ mục với mục đích truy tìm thông tin. Tiêu chuẩn này còn có thể sử dụng như một tài liệu tham khảo cho người làm tóm tắt. Tuy nhiên, cần phải lưu ý rằng các công việc này là không giống nhau mặc dù chúng có vẻ tương tự như nhau.
1.4. Tiêu chuẩn này nhằm thúc đẩy thực hiện tiêu chuẩn:
a) Trong một cơ quan hay một mạng lưới các cơ quan;
b) Giữa các cơ quan định chỉ mục khác nhau, đặc biệt là những nơi thực hiện trao đổi biểu ghi thư mục.
Các tài liệu viện dẫn sau rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các bản sửa đổi, bổ sung (nếu có).
ISO 2788Documentation - Guidelines for the establishment and development of monolingual thesauri (Tư liệu - Hướng dẫn biên soạn và phát triển các từ điển từ chuẩn đơn ngữ);
ISO 5964Documentation - Guidelines for the establishment and development of multilingual thesauri (Tư liệu - Hướng dẫn biên soạn và phát triển các từ điển từ chuẩn đa ngữ).
Tiêu chuẩn này áp dụng các định nghĩa sau đây.
3.1. Tài liệu (document)
Bất kỳ vật mang tin nào được in hay ở dạng khác, cần phải biên mục hay định chỉ mục.
CHÚ THÍCH Định nghĩa này không chỉ xét đến tài liệu được viết hoặc in trên giấy hay ở dạng thu nhỏ (ví dụ: sách, tạp chí, biểu đồ, bản đồ) mà còn gồm cả các phương tiện không in (ví dụ: biểu ghi đọc máy, phim, bản ghi âm thanh) và đồ vật ba chiều hoặc đồ vật được sử dụng như vật mẫu.
3.2. Khái niệm (concept)
Một đơn vị tư duy.
Nội dung ngữ nghĩa của một khái niệm có thể được thể hiện bằng một tập hợp các khái niệm khác nhau. Điều này có thể có những thể hiện khác nhau giữa các ngôn ngữ hoặc các nền văn hóa khác nhau.
3.3. Chủ đề (subject)
Một khái niệm hoặc tập hợp khái niệm thể hiện vấn đề trong nội dung một tài liệu.
3.4. Thuật ngữ định chỉ mục (indexing term)
Sự thể hiện một khái niệm dưới dạng:
- thuật ngữ được lấy từ ngôn ngữ tự nhiên, tốt nhất là danh từ hoặc cụm danh từ hoặc;
- ký hiệu phân loại.
CHÚ THÍCH Thuật ngữ định chỉ mục có thể gồm nhiều hơn một từ. Trong ngôn ngữ định chỉ mục có kiểm soát, một thuật ngữ có thể được xác định là thuật ngữ ưu tiên hoặc thuật ngữ không ưu tiên.
3.5. Thuật ngữ ưu tiên (preferred term)
Thuật ngữ được sử dụng ổn định khi định chỉ mục để thể hiện một khái niệm nào đó; đôi khi còn được gọi là “từ mô tả”.
CHÚ THÍCH Thuật ngữ định chỉ mục của một từ điển từ chuẩn được quy ước sử dụng thay cho thuật ngữ không ưu tiên đồng nghĩa, gần nghĩa hoặc trái nghĩa với nó.
3.6. Thuật ngữ không ưu tiên (non-preferred term)
Thuật ngữ đồng nghĩa hoặc giả đồng nghĩa với một thuật ngữ ưu tiên.
Một thuật ngữ không ưu tiên không được sử dụng để định chỉ mục cho các tài liệu nhưng được quy định như một mục từ trong bảng chỉ mục, nhờ đó người dùng được chỉ dẫn (ví dụ: Sử dụng hoặc Xem) tới thuật ngữ ưu tiên; đôi khi còn được gọi là “từ không mô tả”.
3.7. Bảng chỉ mục (index)
Danh sách các chủ đề xếp theo thứ tự chữ cái hoặc theo hệ thống nhằm chỉ dẫn tới vị trí của mỗi chủ đề trong một tài liệu hoặc một bộ sưu tập tài liệu.
3.8. Định chỉ mục (indexing)
Việc mô tả hoặc nhận dạng một tài liệu bằng các thuật ngữ thể hiện nội dung chủ đề của tài liệu đó.
CHÚ THÍCH Việc thể hiện nội dung hoặc hình thức của một tài liệu bằng các từ, cụm từ hoặc hệ thống ký hiệu theo quy tắc của ngôn ngữ định chỉ mục. Định chỉ mục được thực hiện phổ biến với các quy trình: phân loại, định tiêu đề chủ đề, định từ khóa. Công cụ được sử dụng trong định chỉ mục là các khung phân loại và từ điển từ chuẩn. Từ điển từ chuẩn thường được biên soạn dưới dạng danh mục từ khóa, hoặc danh mục tiêu đề chủ đề.
4. Hoạt động và mục đích của định chỉ mục
4.1. Định chỉ mục không liên quan đến việc mô tả một tài liệu như một thực thể vật lý (ví dụ mô tả hình thức, nhà xuất bản, ngày tháng...), mặc dù các yếu tố này có thể bao hàm trong chỉ mục nếu thông tin này làm cho người dùng tin xác định chính xác hơn liệu một tài liệu cụ thể nào đó có phù hợp với yêu cầu của mình hay không.
4.2. Trong khi định chỉ mục, các khái niệm được rút ra từ các tài liệu theo một quá trình phân tích bằng tư duy, sau đó được chuyển đổi thành các thuật ngữ định chỉ mục. Việc phân tích và chuyển đổi đều nên thực hiện với sự hỗ trợ của các công cụ định chỉ mục như từ điển từ chuẩn và khung phân loại.
4.3. Về cơ bản, định chỉ mục gồm 3 bước dưới đây, mặc dù khi thực hiện có thể trùng lặp nhau:
a) Phân tích tài liệu và xác định nội dung chủ đề;
b) Nhận dạng các khái niệm chính được thể hiện trong chủ đề;
c) Thể hiện các khái niệm này dưới dạng ngôn ngữ định chỉ mục.
Mỗi bước kể trên, cùng với một phần về kiểm soát chất lượng sẽ được xem xét trong các điều từ 5 đến 8 dưới đây.
5.1. Mức độ kỹ lưỡng khi phân tích một tài liệu phụ thuộc chủ yếu vào dạng vật lý của nó. Hai trường hợp khác nhau có thể phân biệt là tài liệu in và tài liệu không in.
5.2. Tài liệu in thường có trong các thư viện và các trung tâm thông tin, nơi lưu trữ các chuyên khảo, tạp chí, báo cáo, kỷ yếu hội nghị… Để hiểu tài liệu một cách đầy đủ, tốt nhất là phải xem xét bao quát văn bản. Tuy nhiên, việc đọc toàn văn thường khó thực hiện và không phải lúc nào cũng cần thiết nhưng người định chỉ mục phải đảm bảo rằng không có thông tin hữu ích nào bị bỏ sót. Các phần quan trọng của văn bản cần được xem xét cẩn thận và đặc biệt chú ý những yếu tố sau:
a) Nhan đề;
b) Phần tóm tắt, nếu có;
c) Mục lục;
d) Phần giới thiệu, phần mở đầu các chương, mục và phần kết luận;
e) Các hình minh họa, bảng biểu và chú thích;
f) Các từ hoặc cụm từ được gạch dưới hoặc được in bằng phông chữ khác biệt.
Khi phân tích tài liệu, người định chỉ mục cần xem xét và đánh giá tất cả các yếu tố kể trên. Định chỉ mục không nên chỉ đơn thuần căn cứ vào nhan đề tài liệu. Và không nên coi phần tóm tắt (nếu có) có thể thay thế hoàn toàn cho việc khảo sát văn bản. Nhan đề có thể gây nhầm lẫn; cả nhan đề và phần tóm tắt đều có thể không đầy đủ; trong nhiều trường hợp cả hai yếu tố này chưa chắc đã là nguồn thông tin đáng tin cậy đối với người định chỉ mục.
CHÚ THÍCH Trong trường hợp các yếu tố nêu trên chưa cung cấp đủ thông tin để định chỉ mục, người định chỉ mục cần đọc toàn văn tài liệu để có thể nhận dạng đầy đủ về nội dung tài liệu. Các yếu tố chính xác cần xem xét khi phân tích tài liệu thay đổi tùy theo loại tài liệu cần định chỉ mục (ví dụ, chuyên khảo khác so với bài báo).
5.3. Tài liệu không in như các phương tiện nghe nhìn, hình ảnh và âm thanh, gồm cả vật mẫu v.v…, cần tiến hành định chỉ mục theo thủ tục khác. Trên thực tế, không phải lúc nào cũng có thể khảo sát một tài liệu dạng này ở trạng thái trọn vẹn (ví dụ: một bộ phim). Việc định chỉ mục khi đó thường được thực hiện từ nhan đề và/hoặc bản tóm tắt. Trong trường hợp phần mô tả bằng văn bản không đủ hoặc không chính xác, người định chỉ mục cần xem hoặc nghe nội dung của phương tiện thông tin đó.
6.1. Sau khi phân tích tài liệu, người định chỉ mục cần tiếp cận một cách có hệ thống để nhận dạng các khái niệm vốn là những yếu tố thiết yếu trong bản mô tả chủ đề của tài liệu. Các cơ quan nên thiết lập một danh mục các yếu tố được coi là quan trọng trong lĩnh vực bao quát của chỉ mục.
Các câu hỏi dưới đây có thể sử dụng để thiết lập một danh mục các yếu tố nhận dạng nội dung tài liệu:
a) Tài liệu có đề cập tới đối tượng chịu sự tác động của hoạt động không?
b) Chủ đề có bao hàm khái niệm hoạt động nào không (ví dụ: một hành động, một hoạt động, một quy trình…)?
c) Đối tượng nghiên cứu có bị ảnh hưởng bởi một hành động được xác định hay không?
d) Tài liệu có đề cập đến tác nhân của hành động này không?
e) Tài liệu có đề cập đến phương tiện cụ thể để thực hiện hành động hay không (ví dụ: các công cụ, kỹ thuật hoặc phương pháp cụ thể.)?
f) Các yếu tố này có được xem xét trong bối cảnh ở một địa điểm hay môi trường cụ thể nào không?
g) Có bất kỳ yếu tố phụ thuộc hay độc lập nào được xác định hay không?
h) Chủ đề đó có được xem xét từ một quan điểm cụ thể vốn thường không liên quan đến lĩnh vực nghiên cứu hay không (ví dụ: nghiên cứu xã hội học về tôn giáo)?
Đây chỉ là những ví dụ về các yếu tố chung có thể áp dụng được ở bất kỳ lĩnh vực chủ đề nào. Các câu hỏi khác có thể cần phải điều chỉnh theo quy tắc riêng.
CHÚ THÍCH Trong những trường hợp cần thiết, người định chỉ mục có thể xem xét thêm các phương diện nghiên cứu và đặc điểm hình thức của tài liệu.
6.2.Trong quá trình phân tích tài liệu, người định chỉ mục không nhất thiết phải thể hiện tất cả các khái niệm được nhận dạng bằng thuật ngữ định chỉ mục. Việc lựa chọn hay loại bỏ các khái niệm phụ thuộc vào mục đích sử dụng của các thuật ngữ định chỉ mục. Có thể có những mục đích khác nhau, ví dụ, để in ra danh mục hay lưu trữ các yếu tố dữ liệu để có thể truy tìm thông tin bằng máy tính hoặc bằng các phương tiện khác. Việc nhận dạng các khái niệm này cũng có thể bị ảnh hưởng bởi các yếu tố trong tài liệu được sử dụng để định chỉ mục (như đã đề cập ở trên). Ví dụ, việc định chỉ mục từ toàn văn cuốn sách, bài báo… chắc chắn sẽ khác với định chỉ mục từ bài tóm tắt nội dung. Vấn đề này ảnh hưởng nhiều nhất đến tính toàn diện và tính chi tiết của việc định chỉ mục.
6.3. Tính toàn diện đề cập đến số lượng các yếu tố (ví dụ các yếu tố liên quan đến các câu hỏi nêu trong 6.1) được thể hiện bởi các thuật ngữ do người định chỉ mục gán cho một tài liệu.
6.3.1. Khi thực hiện theo các thủ tục nêu trên, người định chỉ mục cần nhận dạng được mọi khái niệm trong một tài liệu có thể có giá trị tiềm năng cho người sử dụng hệ thống thông tin. Trong một số trường hợp, trong cùng một tài liệu có thể xuất hiện nhiều đề tài độc lập cùng một lĩnh vực. Những khái niệm này phải được xử lý tách biệt và nếu cần sẽ nhờ sự trợ giúp của các chuyên gia khác nhau thuộc lĩnh vực đó.
6.3.2. Không nên hiểu phạm vi sử dụng của một chỉ mục một cách hạn hẹp. Với sự phát triển của các mạng lưới thông tin, cần lưu ý rằng các dữ liệu chỉ mục ban đầu được tạo cho một nhóm người dùng tin (ví dụ các nhà khoa học hoặc các chuyên gia công nghệ) có thể lại được các nhóm người dùng tin khác nghiên cứu (ví dụ các nhà kinh tế học). Với việc lưu ý tới khả năng sử dụng nêu trên, người định chỉ mục các tài liệu khoa học và kỹ thuật được khuyến cáo không nên bỏ sót các khía cạnh khác của một chủ đề, ví dụ khía cạnh xã hội và kinh tế của của chủ đề đó.
6.3.3. Khi lựa chọn các khái niệm, tiêu chí chủ yếu người định chỉ mục luôn phải chú trọng là xem xét giá trị tiềm năng của một khái niệm với vai trò là một yếu tố trong quá trình thể hiện chủ đề của tài liệu và quá trình truy tìm thông tin sau này. Khi lựa chọn các khái niệm, người định chỉ mục luôn phải ghi nhớ các câu hỏi, trong phạm vi chúng được biết đến, có thể được đặt vào hệ thống thông tin. Trên thực tế, tiêu chí này minh chứng cho chức năng chủ đạo của việc định chỉ mục. Trong bối cảnh này, người định chỉ mục nên:
a) Chọn các khái niệm được một cộng đồng người dùng tin cụ thể coi là thích hợp nhất, đồng thời luôn nhớ rõ mục đích của chỉ mục;
b) Nếu cần thiết, khi có ý kiến phản hồi từ các yêu cầu của người dùng tin, có thể chỉnh sửa cả các công cụ lẫn thủ tục định chỉ mục. Tuy nhiên, những chỉnh sửa này không nên mở rộng đến mức phải biến đổi cấu trúc hoặc tính logic của ngôn ngữ định chỉ mục.
6.3.4. Không nên đặt một giới hạn tùy tiện về số lượng các thuật ngữ hoặc từ mô tả có thể được gán cho một tài liệu. Giới hạn này cần được xác định trên cơ sở căn cứ vào lượng thông tin chứa trong tài liệu có liên quan đến nhu cầu của người sử dụng chỉ mục. Việc áp đặt một giới hạn tùy tiện chắc chắn sẽ làm mất đi ít nhiều tính khách quan khi định chỉ mục và làm biến đổi các thông tin có giá trị trong quá truy tìm thông tin. Nếu trong một cơ quan nào đó cần phải giới hạn số lượng các thuật ngữ, thì việc lựa chọn các khái niệm nên dựa vào đánh giá của người định chỉ mục về vai trò của mỗi khái niệm trong việc thể hiện chủ đề bao quát của tài liệu.
6.4. Tính chi tiết đề cập đến mức độ một khái niệm cụ thể xuất hiện trong tài liệu được chi tiết hóa một cách chính xác qua ngôn ngữ định chỉ mục. Tính chi tiết sẽ không được đảm bảo khi một khái niệm cụ thể được thể hiện bằng một thuật ngữ rộng nghĩa hơn.
Các khái niệm nên được xác định càng chi tiết càng tốt. Các khái niệm khái quát hơn có thể được ưu tiên trong một số trường hợp, phụ thuộc vào các yếu tố sau:
a) Mức độ mà người định chỉ mục cho rằng việc quá chi tiết có thể ảnh hưởng không tốt đến chất lượng của hệ thống định chỉ mục. Ví dụ, người định chỉ mục có thể quyết định rằng các phiên bản rất cụ thể của một sản phẩm có thể được thay thế bằng các thuật ngữ khái quát hơn như tên của nhà sản xuất và của dòng sản phẩm, đặc biệt khi các khái niệm này chỉ xuất hiện ở các lĩnh vực ngoại vi của lĩnh vực chủ đề mà chỉ mục đề cập tới.
b) Mức độ quan trọng mà tác giả gán cho khái niệm. Nếu người định chỉ mục cho rằng một ý tưởng không được phát triển đầy đủ hoặc chỉ được tác giả nhắc đến một cách ngẫu nhiên thì có thể định chỉ mục với mức độ khái quát hơn, nếu thấy điều đó là hợp lý.
7. Lựa chọn các thuật ngữ định chỉ mục
7.1. Khi chuyển đổi các khái niệm thành các thuật ngữ định chỉ mục, người định chỉ mục phải xem xét các cách thực hiện sau (xem thêm Phụ lục A):
a) Các khái niệm đã được thể hiện bằng ngôn ngữ định chỉ mục phải được chuyển đổi thành các thuật ngữ ưu tiên, nói một cách khác là thuật ngữ được quy ước sử dụng trong từ điển từ chuẩn.
b) Các thuật ngữ thể hiện các khái niệm mới cần được kiểm tra về độ chính xác và khả năng được chấp nhận bằng các công cụ tra cứu như:
- Các loại từ điển và bách khoa thư đã được công nhận là chuẩn mực trong từng lĩnh vực;
- Các từ điển từ chuẩn, đặc biệt là những từ điển từ chuẩn được xây dựng theo ISO 2788 hoặc ISO 5964;
- Các khung phân loại.
Nên tham vấn các chuyên gia trong ngành, đặc biệt là những người có hiểu biết về định chỉ mục hoặc làm tư liệu.
CHÚ THÍCH: Đối với tên người, địa danh, tên cơ quan tổ chức khi mô tả nên tham khảo các tiêu chuẩn quốc gia (TCVN) và các quy định liên quan. Ví dụ: đối với địa danh Việt Nam khi mô tả tham khảo TCVN 7587:2007 Thông tin và Tư liệu - Tên và mã địa danh Việt Nam dùng trong lưu trữ và trao đổi thông tin khoa học và công nghệ.
7.2. Người định chỉ mục cần làm quen với các công cụ đã nêu trên cũng như các quy định và thủ tục khi sử dụng chúng. Đặc biệt, người định chỉ mục cần lưu ý các công cụ này cũng có thể tạo ra những rào cản nhất định. Ví dụ, một danh sách đã quy định trước như bộ tiêu đề chủ đề hoặc các bảng của một khung phân loại có thể không cho phép thể hiện chính xác một khái niệm xuất hiện trong tài liệu. Khi các khái niệm được thể hiện bằng các ký hiệu phân loại, cần hiểu rằng các ký hiệu này thường biểu thị một ngữ cảnh rộng hơn hoặc hẹp hơn (so với nội dung tài liệu) và trong ngữ cảnh đó, có thể các thuật ngữ định chỉ mục đã được quy ước không hoàn toàn thích hợp cho nội dung tài liệu hiện có.
7.3. Nếu một ngôn ngữ định chỉ mục được hợp nhất thành một từ điển từ chuẩn thì số lượng các thuật ngữ được gán cho tài liệu và nhiều mục từ có thể được giảm bớt mà không bị mất đi nhờ các tham chiếu quan hệ giống - loài và quy định về thuật ngữ ưu tiên có thể được tạo lập trực tiếp từ chính các từ điển từ chuẩn đó. Khi sử dụng một từ điển từ chuẩn để thể hiện một khái niệm, nên lựa chọn thuật ngữ cụ thể nhất để thể hiện một khái niệm đã đưa ra.
7.4. Một số hệ thống định chỉ mục sử dụng các vai trò, mối liên kết, mức độ quan trọng v.v… Người định chỉ mục cần làm quen với bất kỳ quy định đặc biệt nào liên quan đến các cơ chế này.
7.5. Trong thực tế, người định chỉ mục sẽ thường xuyên gặp phải các khái niệm không có trong từ điển từ chuẩn hoặc khung phân loại hiện có. Tùy vào hệ thống đang sử dụng, các khái niệm này có thể được xử lý theo nhiều cách, ví dụ như:
a) Thể hiện bằng các thuật ngữ hoặc từ mô tả mà những từ này sẽ được bổ sung vào ngôn ngữ định chỉ mục ngay sau đó;
b) Thể hiện tạm thời bằng các thuật ngữ có ý nghĩa khái quát hơn, đồng thời được đề xuất để đưa vào các công cụ định chỉ mục sau này.
8.1. Chất lượng và tính nhất quán của việc định chỉ mục phụ thuộc vào các yếu tố như:
a) Năng lực và trình độ chuyên môn của người định chỉ mục;
b) Chất lượng của các công cụ định chỉ mục.
Ở điều kiện lý tưởng, cần đảm bảo tính nhất quán đối với các thuật ngữ định chỉ mục được gán cho một tài liệu và mức độ toàn diện đạt được trong quá trình định chỉ mục ngay cả trong trường hợp có nhiều người định chỉ mục khác nhau. Bên cạnh đó, các yếu tố này cần ổn định một cách tương đối trong suốt quá trình hình thành và phát triển của một hệ thống định chỉ mục. Trên thực tế, tiêu chuẩn về tính nhất quán này không phải lúc nào cũng có thể thực hiện được, nhưng mục đích của tính nhất quán và theo đó là khả năng dự báo là một yếu tố quan trọng trong chất lượng của hệ thống định chỉ mục, đặc biệt khi thông tin được trao đổi giữa các cơ quan khác nhau trong một mạng lưới.
CHÚ THÍCH: Khi định tiêu đề chủ đề và định từ khóa không có công cụ kiểm soát từ vựng, người định chỉ mục nên tạo lập các quy ước về việc sử dụng thuật ngữ định chỉ mục để đảm bảo tính nhất quán trong quá trình xử lý tài liệu.
8.2. Tính khách quan của người định chỉ mục là một yếu tố cần thiết nhằm đạt được tính nhất quán trong định chỉ mục. Sự đánh giá chủ quan trong việc nhận dạng khái niệm và lựa chọn thuật ngữ định chỉ mục chắc chắn sẽ ảnh hưởng đến chất lượng của hệ thống định chỉ mục. Tính nhất quán sẽ khó đạt được hơn khi việc định chỉ mục được thực hiện bởi nhiều người và làm việc ở các địa điểm khác nhau. Trong các trường hợp đó, cần phải có một khâu kiểm tra, hiệu đính tập trung và cung cấp phản hồi cho những người định chỉ mục.
8.3. Người định chỉ mục cần có kiến thức đầy đủ về lĩnh vực được đề cập trong tài liệu cần định chỉ mục. Họ phải hiểu được các thuật ngữ xuất hiện trong các tài liệu cũng như các quy định và thủ tục của ngôn ngữ định chỉ mục đang sử dụng.
Các cơ quan xử lý tài liệu tiếng nước ngoài cần có mối liên hệ với các chuyên gia ngôn ngữ.
8.4. Chất lượng định chỉ mục có thể đạt được hiệu quả hơn nếu người định chỉ mục có liên hệ trực tiếp với người dùng tin. Ví dụ, người định chỉ mục có thể xác định xem liệu một số thuật ngữ hoặc từ mô tả nào đó có chắc chắn dẫn đến sự kết hợp không đúng và tạo ra các kết quả đầu ra không phù hợp hay không.
8.5. Chất lượng của việc định chỉ mục cũng phụ thuộc vào mức độ phổ biến của ngôn ngữ định chỉ mục được sử dụng. Ngôn ngữ định chỉ mục cần được bổ sung các thuật ngữ mới hoặc các thay đổi về thuật ngữ một cách tự do và đáp ứng các nhu cầu mới của người dùng tin. Chính sách cập nhật thường xuyên được coi là một điều tất yếu.
8.6. Nếu có thể, chất lượng định chỉ mục cần được kiểm tra thông qua phân tích các kết quả truy tìm thông tin, ví dụ bằng cách tính mức độ đầy đủ và mức độ chính xác.
Quy trình định chỉ mục có sử dụng từ điển từ chuẩn (TĐTC)
Các chú thích bổ sung của tiêu chuẩn
Số điều | Các chú thích bổ sung |
3.5 | Bổ sung: CHÚ THÍCH Thuật ngữ định chỉ mục của một điển từ chuẩn được quy ước sử dụng thay cho thuật ngữ không ưu tiên đồng nghĩa, gần nghĩa hoặc trái nghĩa với nó. |
3.8 | Bổ sung: CHÚ THÍCH Việc thể hiện nội dung hoặc hình thức của một tài liệu bằng các từ, cụm từ hoặc hệ thống ký hiệu theo quy tắc của ngôn ngữ định chỉ mục. Định chỉ mục được thực hiện phổ biến với các quy trình: phân loại, định tiêu đề chủ đề, định từ khóa. Công cụ được sử dụng trong định chỉ mục là các khung phân loại, từ điển từ chuẩn thường được biên soạn dưới dạng bộ từ khóa, từ điển từ khóa, hoặc bộ tiêu đề chủ đề. |
5.2 | Bổ sung: CHÚ THÍCH Trong trường hợp các phần nêu trên chưa cung cấp đủ thông tin để định chỉ mục, người định chỉ mục cần đọc toàn văn tài liệu để có thể nhận dạng đầy đủ về nội dung tài liệu. |
6.1 | Bổ sung: CHÚ THÍCH Trong những trường hợp cần thiết, người định chỉ mục có thể xem xét thêm các phương diện nghiên cứu và đặc điểm hình thức của tài liệu |
7.1 | Bổ sung: CHÚ THÍCH Đối với tên người, địa danh, tên cơ quan tổ chức khi mô tả tham khảo các TCVN và các quy định liên quan. Ví dụ: đối với địa danh Việt Nam khi mô tả tham khảo TCVN 7587:2007 Thông tin và Tư liệu - Tên và mã địa danh Việt Nam dùng trong lưu trữ và trao đổi thông tin khoa học và công nghệ. |
8.1 | Bổ sung: CHÚ THÍCH Khi định tiêu đề chủ đề và định từ khóa không có công cụ kiểm soát vựng, người định chỉ mục cần tạo lập công cụ công vụ, trong đó đặt ra các quy ước về việc sử dụng thuật ngữ định chỉ mục để đảm bảo tính nhất quán trong quá trình xử lý tài liệu. |
Thư mục tài liệu tham khảo
[1] ISO 25964-1:2011 Information and documentation - Thesauri and interoperability with other vocabularies - Part 1: Thesauri for information retrieval (Thông tin và Tư liệu - Từ điển từ chuẩn và khả năng tương tác với các từ vựng khác - Phần 1: Từ điển từ chuẩn cho truy tìm thông tin)
[2] Report of the secretariat ISO TC46/SC 9 for the 8 May 2014 plenary meeting in Washington, DC (Báo cáo của Ban thư ký ISO TC46 / SC 9 của phiên họp toàn thể ngày 08 tháng 5 năm 2014 tại Washington, DC)
[3] TCVN 5453:2009 (ISO 5721:2001) Thông tin và Tư liệu-Từ vựng
[4] TCVN 7587:2007 Thông tin và Tư liệu - Tên và Mã địa danh Việt Nam dùng trong lưu trữ và trao đổi thông tin khoa học và công nghệ.
[5] Vũ Dương Thúy Ngà (2008) Phân loại tài liệu. Đại học Quốc gia Hà Nội
[6] Vũ Dương Thúy Ngà (2006) Định chủ đề và định từ khóa tài liệu. NXB Văn hóa Thông tin, Hà Nội.
MỤC LỤC
Lời nói đầu
Lời giới thiệu
1. Phạm vi áp dụng
2. Tài liệu viện dẫn
3. Thuật ngữ và định nghĩa
4. Hoạt động và mục đích của định chỉ mục
5. Phân tích tài liệu
6. Nhận dạng các khái niệm
7. Lựa chọn các thuật ngữ định chỉ mục
8. Kiểm soát chất lượng
Phụ lục A (tham khảo) Quy trình định chỉ mục có sử dụng từ điển từ chuẩn
Phụ lục B (tham khảo) Các bổ sung sửa đổi của tiêu chuẩn
Thư mục tài liệu tham khảo
Ý kiến bạn đọc
Nhấp vào nút tại mỗi ô tìm kiếm.
Màn hình hiện lên như thế này thì bạn bắt đầu nói, hệ thống giới hạn tối đa 10 giây.
Bạn cũng có thể dừng bất kỳ lúc nào để gửi kết quả tìm kiếm ngay bằng cách nhấp vào nút micro đang xoay bên dưới
Để tăng độ chính xác bạn hãy nói không quá nhanh, rõ ràng.