Phân loại câu hỏi kiểu “what” sử dụng nhiều loại đặc trưng - Nguyễn Văn Tú

Tài liệu Phân loại câu hỏi kiểu “what” sử dụng nhiều loại đặc trưng - Nguyễn Văn Tú: 81 TẠP CHÍ KHOA HỌC Khoa học Tự nhiên và Công nghệ, Số 6 (9/2016) tr 81 - 89 PHÂN LOẠI CÂU HỎI KIỂU “WHAT” SỬ DỤNG NHIỀU LOẠI ĐẶC TRƯNG Nguyễn Văn Tú Khoa Toán - Lý - Tin, Trường Đại học Tây Bắc Tóm tắt: Phân loại câu hỏi là một thành phần quan trọng trong các hệ thống hỏi đáp tự động. Nhiệm vụ chính của phân loại câu hỏi là dự báo kiểu thực thể của câu trả lời của các câu hỏi viết bằng ngôn ngữ tự nhiên. Trong các hệ thống hỏi đáp tự động, các câu hỏi với từ để hỏi What chiếm phần lớn, nhưng việc phân loại các câu hỏi này lại có nhiều khó khăn hơn so với việc phân loại các câu hỏi khác. Trong bài báo này chúng tôi đề xuất việc trích rút các đặc trưng phù hợp nhằm phân loại câu hỏi What đạt độ chính xác cao. Chúng tôi cũng đề xuất sử dụng mẫu câu hỏi như là một đặc trưng mới để kết hợp với các đặc trưng khác trong phân loại câu hỏi. Chúng tôi đã kiểm tra những đề xuất của mình bằng cách sử dụng bộ phân loại Support Vector Machine trên bộ dữ liệu TREC và đã đ...

9 trang | Chia sẻ: quangot475 | Lượt xem: 347 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Phân loại câu hỏi kiểu “what” sử dụng nhiều loại đặc trưng - Nguyễn Văn Tú, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

81 TẠP CHÍ KHOA HỌC Khoa học Tự nhiên và Công nghệ, Số 6 (9/2016) tr 81 - 89 PHÂN LOẠI CÂU HỎI KIỂU “WHAT” SỬ DỤNG NHIỀU LOẠI ĐẶC TRƯNG Nguyễn Văn Tú Khoa Toán - Lý - Tin, Trường Đại học Tây Bắc Tóm tắt: Phân loại câu hỏi là một thành phần quan trọng trong các hệ thống hỏi đáp tự động. Nhiệm vụ chính của phân loại câu hỏi là dự báo kiểu thực thể của câu trả lời của các câu hỏi viết bằng ngôn ngữ tự nhiên. Trong các hệ thống hỏi đáp tự động, các câu hỏi với từ để hỏi What chiếm phần lớn, nhưng việc phân loại các câu hỏi này lại có nhiều khó khăn hơn so với việc phân loại các câu hỏi khác. Trong bài báo này chúng tôi đề xuất việc trích rút các đặc trưng phù hợp nhằm phân loại câu hỏi What đạt độ chính xác cao. Chúng tôi cũng đề xuất sử dụng mẫu câu hỏi như là một đặc trưng mới để kết hợp với các đặc trưng khác trong phân loại câu hỏi. Chúng tôi đã kiểm tra những đề xuất của mình bằng cách sử dụng bộ phân loại Support Vector Machine trên bộ dữ liệu TREC và đã đạt được độ chính xác phân loại câu hỏi What cao hơn so với những nghiên cứu trước đó trên cùng nguyên tắc phân loại và tập dữ liệu. Từ khóa: Phân loại câu hỏi, hệ thống hỏi đáp, mẫu câu hỏi, máy hỗ trợ vectơ. 1. Tổng quan Hệ thống hỏi đáp tự động đã trở thành hướng nghiên cứu quan trọng trong xử lý ngôn ngữ tự nhiên [4,9]. Mục đích của các hệ thống hỏi đáp tự động là tìm kiếm câu trả lời chính xác và ngắn gọn cho những câu hỏi viết bằng ngôn ngữ tự nhiên thay vì trả về một danh sách các tài liệu liên quan đến câu hỏi như trong các máy tìm kiếm. Phân loại câu hỏi là một thành phần quan trọng trong các hệ thống hỏi đáp tự động. Nhiệm vụ chính của phân loại câu hỏi là dự báo kiểu thực thể của câu trả lời của các câu hỏi viết bằng ngôn ngữ tự nhiên. Có nhiều cách tiếp cận khác nhau để phân loại câu hỏi như: tiếp cận dựa trên luật [2,3], tiếp cận dựa trên học máy [1,7,10]. Trong nghiên cứu của mình, chúng tôi sử dụng tiếp cận dựa trên học máy với việc sử dụng nhiều đặc trưng và sử dụng mẫu câu hỏi (Question pattern) như là một đặc trưng mới để kết hợp với các đặc trưng đã có. Chúng tôi nhận thấy rằng khi sử dụng mẫu câu hỏi như là một đặc trưng và kết hợp với các đặc trưng từ vựng, cú pháp, ngữ nghĩa khác có thể cải thiện đáng kể độ chính xác của phân loại câu hỏi. Chúng tôi đã kiểm tra những đề xuất của mình bằng cách sử dụng bộ phân loại Support Vector Machine trên bộ dữ liệu TREC và đã đạt được độ chính xác phân loại câu hỏi What cao hơn so với những nghiên cứu trước đó trên cùng nguyên tắc phân loại và tập dữ liệu. 2. Một số vấn đề cơ bản về phân loại câu hỏi 2.1. Nguyên tắc phân loại câu hỏi Ngày nhận bài: 22/3/2016. Ngày nhận đăng: 25/9/2016 Liên lạc: Nguyễn Văn Tú, e - mail thuandhtb@gmail.com 82 Một tập các loại câu hỏi (các lớp) thường được đại diện như là nguyên tắc phân loại câu hỏi. Các nguyên tắc phân loại câu hỏi khác nhau được đề xuất trong các công trình nghiên cứu khác nhau, nhưng hầu hết trong các nghiên cứu gần đây đều dựa trên nguyên tắc phân loại hai lớp được đề xuất bởi Li và Roth (2002)1 [6]. Nguyên tắc phân loại này bao gồm 6 lớp thô và 50 lớp mịn. Bảng 1 là danh sách các lớp theo nguyên tắc phân loại này. Bảng 1. Các lớp câu hỏi thô và mịn Lớp câu hỏi thô Lớp câu hỏi mịn ABBREVIATION Abbreviation, expression ENTITY Animal, body, color, creative, currency, dis.med, event, food, instrument, lang, letter, other, plant, product, religion, sport, substance, symbol, technique, term, vehicle, word DESCRIPTION Definition, description, manner, reason HUMAN Group, individual, title, description LOCATION City, country, mountain, other, state NUMERIC Code, count, date, distance, money, order, other, period, percent, speed, temperature, size, weight 2.2. Thuật toán phân loại câu hỏi Có nhiều bộ phân loại khác nhau đã được sử dụng trong phân loại câu hỏi như: Support Vector Machine, Naive Bayesian, Maximum Entropy Models, Sparse Network of Winnows, Tuy nhiên trong các bộ phân loại đó thì Support Vector Machine với hàm nhân tuyến tính được xem là hiệu quả hơn cả [1,3,8] vì trong vấn đề phân loại câu hỏi các câu hỏi được biểu diễn trong không gian có số chiều rất lớn, điều này có thể được phân loại tốt bởi Support Vector Machine. Chính vì vậy trong nghiên cứu của mình, chúng tôi sử dụng bộ phân loại Support Vector Machine với hàm nhân tuyến tính. 2.3. Hiệu suất trong phân loại câu hỏi Thông thường hiệu suất của bộ phân loại câu hỏi được đo bằng việc tính toán chính xác trong đó phân loại vào một tập kiểm tra cụ thể. Độ chính xác (accuracy) của bộ phân loại câu hỏi được định nghĩa như sau: Ngoài ra còn có độ chính xác của bộ phân loại trên một lớp cụ thể precision. Precision của một bộ phân loại trên một lớp cụ thể c được định nghĩa như sau: Đối với các hệ thống trong đó một câu hỏi chỉ có thể thuộc về một lớp, một câu hỏi được phân loại đúng nếu như nhãn dự báo là tương tự như nhãn đúng. Nhưng đối với các hệ thống mà cho phép một câu hỏi được phân loại vào nhiều hơn một nhãn lớp 1 83 [9,10], một câu hỏi được phân loại đúng nếu một trong các nhãn lớp dự đoán là tương tự với nhãn đúng. 3. Trích rút các đặc trưng cho phân loại câu hỏi Các đặc trưng trong phân loại câu hỏi có thể được phân thành 3 loại khác nhau: các đặc trưng về từ vựng, các đặc trưng về cú pháp và các đặc trưng về ngữ nghĩa. 3.1 Trích rút các đặc trưng từ vựng Các đặc trưng từ vựng của một câu hỏi thường được trích rút dựa trên ngữ cảnh các từ của câu hỏi, nghĩa là, các từ đó xuất hiện trong một câu hỏi. Trong phân loại câu hỏi, một câu hỏi được biểu diễn giống như sự biểu diễn tài liệu trong mô hình không gian vectơ. Một câu hỏi q có thể được biểu diễn như sau: q = {(t1, f1), , (tp, fp)} trong đó ti là từ thứ i trong câu hỏi q và fi là tần số xuất hiện của ti trong câu hỏi q. Bảng 2 là danh sách các đặc trưng từ vựng của câu hỏi “Who was elected president of South Africa in 1994 ?”. Bảng 2. Ví dụ về các đặc trưng từ vựng Tên đặc trưng Đặc trưng Unigram {(Who, 1) (was, 1) (elected, 1) (president, 1) (of, 1) (South, 1) (Africa, 1) (in, 1) (1994, 1) (?, 1)} Bigram {(Who-was, 1), (was-elected, 1), (elected-president, 1), (president-of, 1), (of-South, 1), (South-Africa, 1), (Africa-in, 1), (in-1994, 1), (1994-?, 1)} Trigram {( Who-was-elected, 1), (was-elected-president, 1), , (in-1994-?, 1)} Word-Shapes {(lowercase, 5) (mix, 3) (digit, 1) (other, 1)} 3.2 Trích rút các đặc trưng cú pháp Các đặc trưng cú pháp có thể được trích rút dựa vào việc phân tích cấu trúc cú pháp của câu hỏi. Tagged Unigrams Tagged Unigrams cho biết thẻ từ loại của mỗi từ trong câu hỏi như NN (Noun - danh từ), NP (Noun Phrase - cụm danh từ), VP (Verb Phrase - cụm động từ), JJ (adjective - tính từ), Ví dụ câu hỏi sau “Who was elected president of South Africa in 1994 ?” với đặc trưng Tagged Unigrams của nó: {Who_WP, was_VBD, elected_VBN, president_NN, of_IN, South_NNP, Africa_NNP, in_IN, 1994_CD, ?_.} Head Word Một head wor thường được định nghĩa như là các từ khóa hoặc từ trung tâm trong một câu. Nó được xác định dựa trên cây phân tích cú pháp của câu đầu vào. Như đã đề cập trong [3], head word là những từ chứa thông tin quan trọng cho việc xác định các đối tượng mà câu hỏi đó đang tìm kiếm. Do đó, việc xác định head word một cách chính xác có thể cải thiện đáng kể độ chính xác phân loại vì nó là từ thông tin nhất trong câu hỏi. Ví dụ cho câu hỏi “What is the oldest city in Spain ?” head word là “city”. Từ “city” trong câu hỏi này có thể có đóng góp cao cho bộ phân loại để phân loại câu hỏi 84 này là “LOCATION: city”. Bảng 3 là danh sách một số câu hỏi từ tập dữ liệu TREC cùng với nhãn lớp của chúng. Bảng 3. Danh sách các câu hỏi từ tập dữ liệu TREC cùng các nhãn lớp của nó. Head word của mỗi câu hỏi là từ được gạch chân Câu hỏi Nhãn lớp What city has the zip code of 35824 ? LOCATION: city Who developed the vaccination against polio ? HUMAN: individual Who invented the slinky ? HUMAN: individual George Bush purchased a small interest in which baseball team ? HUMAN: group Mẫu câu hỏi (Question Pattern) Qua nghiên cứu tập dữ liệu TREC chúng tôi nhận thấy một số câu hỏi không có đặc trưng head word. Ví dụ đối với câu hỏi “What is biosphere ?” không có đặc trưng head word nào phù hợp. Để định nghĩa một đặc trưng thay thế cho head word của câu hỏi chúng tôi đề xuất sử dụng mẫu câu hỏi như một kiểu đặc trưng từ vựng. Mỗi câu hỏi sẽ được ánh xạ tới một mẫu câu hỏi và sau đó sử dụng mẫu tương ứng như là một đặc trưng dùng để phân loại. Bảng 4 liệt kê danh sách một số mẫu câu hỏi2. Bảng 4. Ví dụ về một số mẫu câu hỏi Mẫu câu hỏi Nhãn lớp What (causes|caused) DESCRIPTION:reason How is .* defined DESCRIPTION:definition Where .* (M|m)ountai(n|ns) LOCATION:mountain How much .* weight NUMERIC:weight 3.3. Trích rút các đặc trưng ngữ nghĩa Các đặc trưng ngữ nghĩa là hữu ích cho các trường hợp dữ liệu thưa thớt. Từ khái niệm ngữ nghĩa mức độ cao hơn chúng ta có thể có được mối quan hệ giữa các từ khác nhau hay nói cách khác chúng ta có thể có được sự giống nhau giữa các từ. Có một số cách để trích xuất thông tin ngữ nghĩa và thiết kế đặc trưng ngữ nghĩa, như dưới đây. Hypernyms WordNet là một cơ sở dữ liệu từ vựng của các từ trong tiếng Anh, nó cung cấp một hệ thống thứ bậc của từ vựng mà kết hợp một từ với các khái niệm ngữ nghĩa mức cao hơn gọi là hypernyms. Ví dụ hypernyms của từ “city” là “municipality”. Related Words Đặc trưng ngữ nghĩa khác mà chúng tôi sử dụng là related words dựa trên ý tưởng của Li và Roth [7]. Họ định nghĩa một nhóm các từ, mỗi nhóm từ biểu diễn bởi một tên. Nếu một từ trong câu hỏi xuất hiện trong một hoặc nhiều nhóm, loại tương ứng của nó sẽ được bổ sung vào vectơ đặc trưng. Cho ví dụ nếu một trong số các từ {birthday, birthdate, day, decade, hour, week, month, year} xuất hiện trong câu hỏi, sau đó tên loại của nó, date sẽ được thêm vào vectơ đặc trưng. 2 https://qa.l2f.inesc-id.pt/wiki/images/6/6a/QuestionPatterns.txt 85 Question Category Sử dụng hệ thống phân cấp WordNet để tính toán độ tương tự của head word của câu hỏi với mỗi lớp. Lớp với độ tương tự cao nhất sẽ được xem xét như là một đặc trưng và được bổ sung vào vectơ đặc trưng. Xét câu hỏi: “What American composer wrote the music for “West Side Story” ?”. Head word của câu hỏi này là “composer”. Để tìm đặc trưng question category, xem sét sự giống nhau của từ “composer” với tất cả các lớp câu hỏi. Lớp nào với sự giống nhau cao nhất sẽ được thêm vào vectơ đặc trưng. Trong ví dụ này, lớp giống nhau cao nhất là “individual” và do đó đặc trưng loại câu hỏi sẽ là {(individual, 1)}. Query Expansion Đặc trưng query expansion mà về cơ bản rất giống đặc trưng hypernym. Như chúng tôi đã trình bày trước đó, chúng ta thêm hypernym của head word vào vectơ đặc trưng với các từ lấy từ hệ thống phân cấp WordNet. Để đánh giá vai trò của các từ mới thêm này, người ta định nghĩa một tham số trọng số cho các từ mới thêm này. Bảng 5 liệt kê danh sách các đặc trưng ngữ nghĩa được thảo luận trong phần này cho câu hỏi “What river flows between Fargo, North Dakota and Moorhead, Minnesota ?”. Bảng 5. Ví dụ về các đặc trưng ngữ nghĩa Tên đặc trưng Đặc trưng Hypernyms {(river, 1) (stream, 1) (body-of-water, 1) (thing, 1) (physical-entity, 1) (entity, 1)} Related Words {(rel:What, 1) (rel:list.tar, 2) (rel:loca, 2)} Question Category {(other, 1)} Query Expansion {(river, 1) (stream, 0.6) (body-of-water, 0.36) (thing, 0.22) (physical-entity, 0.13) (entity, 0.08)} 4. Các thực nghiệm 4.1 Tập dữ liệu Để thực hiện các thực nghiệm của mình, chúng tôi sử dụng bộ dữ liệu chuẩn TREC3 và trích rút các đặc trưng cơ bản từ mỗi câu hỏi bao gồm: Unigrams (U), Bigrams (B), Trigram (Tri), Word-Shapes (WS), Tagged Unigrams (TgU), Head-Word (H), Hypernyms (HY), Query-Expansion (QE), Question-Category (QC), Related- Words (R), Question-Pattern (QP). Tập dữ liệu huấn luyện bao gồm 5500 câu hỏi đã gán nhãn. Tập dữ liệu dùng để kiểm tra gồm 343 câu hỏi với từ để hỏi What trong tổng số 500 câu hỏi độc lập đã gán nhãn. Chúng tôi cũng sử dụng nguyên tắc phân loại của Li và Roth (2002) đã được giới thiệu trong phần 2.1. Bảng 6 trình bày các loại câu hỏi trong tập dữ liệu kiểm tra và độ chính xác của chúng trong phân loại khi chỉ sử dụng đặc trưng Unigram. 3 86 Bảng 6. Số lượng mỗi loại câu hỏi và độ chính xác phân loại trong tập dữ liệu kiểm tra TREC Câu hỏi với từ để hỏi Số lượng Độ chính xác phân loại lớp mịn (%) What 343 75,80 Which 6 100 Where 26 92,31 When 26 100 Why 4 100 Who 47 93,62 How 33 87,88 Câu hỏi khác 15 53,33 Từ Bảng 6 cho thấy số lượng câu hỏi với từ để hỏi What chiếm phần lớn (68.6%) nhưng độ chính xác phân loại lại chỉ đạt 75.8%, thấp hơn nhiều so với các câu hỏi với các từ để hỏi khác. Chính vì vậy để nâng cao độ chính xác trong phân loại câu hỏi trước tiên cần nâng cao độ chính xác trong phân loại câu hỏi với từ để hỏi What. 4.2. Các thực nghiệm Trong thực nghiệm thứ nhất chúng tôi muốn kiểm tra sự đóng góp của đặc trưng từ vựng mà chúng tôi đã trình bày trong mục 3.1. Các kết quả của thực nghiệm này được cho trong Bảng 7. Bảng 7. Độ chính xác phân loại câu hỏi What khi sử dụng các đặc trưng từ vựng Tập đặc trưng Độ chính xác phân loại Lớp thô (%) Lớp mịn (%) Unigrams (U) 83,67 75,80 Bigrams (B) 82,22 69,68 Trigram (Tri) 59,18 52,77 Word-Shapes (WS) 44,32 36,44 U + B + Tri 85,71 74,64 U + B + WS 87,46 75,51 U + B + Tri + WS 88,05 75,22 Trong thực nghiệm thứ hai chúng tôi muốn kiểm tra sự đóng góp của đặc trưng cú pháp mà chúng tôi đã trình bày trong mục 3.2. Các kết quả của thực nghiệm này được cho trong bảng 8. Bảng 8. Độ chính xác phân loại câu hỏi What khi sử dụng các đặc trưng cú pháp Tập đặc trưng Độ chính xác phân loại Lớp thô (%) Lớp mịn (%) Tagged Unigrams (TgU) 82,80 76,09 Head-Word (H) 45,48 41,69 Question-Pattern (QP) 50,44 40,23 87 H + QP 77,84 72,89 TgU + H + QP 85,13 78,43 Trong thực nghiệm thứ ba chúng tôi muốn kiểm tra sự đóng góp của đặc trưng ngữ nghĩa mà chúng tôi đã trình bày trong mục 3.3. Các kết quả của thực nghiệm này được cho trong Bảng 9. Bảng 9. Độ chính xác phân loại câu hỏi What khi sử dụng các đặc trưng ngữ nghĩa Tập đặc trưng Độ chính xác phân loại Lớp thô (%) Lớp mịn (%) H + Hypernyms (HY) 79,01 43,44 H + Query-Expansion (QE) 78,43 44,32 H + Question-Category (QC) 78,40 55,39 H + Related-Words (R) 83,97 79,3 H + HY + QE + QC + R 82,80 82,80 H + QE + QC + R 83,67 82,81 Trong thực nghiệm thứ tư chúng tôi muốn kiểm tra sự đóng góp của sự kết hợp các tập đặc trưng từ vựng, cú pháp và ngữ nghĩa nhằm đạt được kết quả phân loại tốt nhất. Các kết quả của thực nghiệm này được cho trong Bảng 10. Bảng 10. Độ chính xác phân loại câu hỏi What khi sử dụng sự kết hợp của các đặc trưng từ vựng, cú pháp, ngữ nghĩa Tập đặc trưng Độ chính xác phân loại Lớp thô (%) Lớp mịn (%) U + B + WS + H + QP 87,46 78,43 U + B + WS + H + QE + QC + R 90,67 88,05 U + B + WS + H + QE + QC + R + QP 92,25 89,21 Từ các thực nghiệm trên chúng tôi nhận thấy đề xuất của chúng tôi coi mẫu câu hỏi như là một đặc trưng để phân loại sẽ cho hiệu quả cao hơn trong phân loại câu hỏi với từ để hỏi What trong cả lớp thô và lớp mịn. 5. So sánh với các nghiên cứu khác Bây giờ chúng tôi so sánh các kết quả nghiên cứu của mình với các kết quả nghiên cứu của các tác giả trước đó. Bảng 11. Bảng so sánh độ chính xác của các nghiên cứu khác nhau về phân loại câu hỏi. Các đặc trưng: Unigrams (U), Bigrams (B), Word-Shapes (WS), POS- tags (P), Head-Word (H), Hypernyms (HY),Query-Expansion (QE), Question- Category (QC), Synonyms (S), Name-Entities (NE), Related-Words (R), Question- Pattern (QP). Tác giả Bộ phân loại Đặc trưng Độ chính xác phân loại Lớp thô Lớp mịn Li and Roth (2004) [7] SEM U+P+HC+NE+R +S 85,79% Fangtao Li et al.(2008) CRF U+P+NE+HY 82,05% 88 [5] +Length Loni et al. (2011) [8] Linear SVM U+WS+B+H+QE +R+ QC 90,50% 86,20% Nghiên cứu của chúng tôi Linear SVM U+WS+B+H+R +QE+QC+QP 92,25% 89,21% Từ Bảng so sánh 11 cho thấy cách tiếp cận của chúng tôi cho độ chính xác phân loại cao nhất cho phân loại lớp thô và lớp mịn lần lượt là 92,25% và 89,21%. 6. Kết luận và hướng phát triển Chúng tôi đã trình bày một tiếp cận dựa trên học máy để phân loại câu hỏi với từ để hỏi What. Để huấn luyện một thuật toán học, chúng tôi đã trích rút một tập các đặc trưng tốt từ vựng, cú pháp và ngữ nghĩa. Chúng tôi cũng đề xuất sử dụng mẫu câu hỏi như một đặc trưng mới để kết hợp với các đặc trưng từ vựng, cú pháp và ngữ nghĩa. Các kết quả thực nghiệm đã chứng minh rằng các đề xuất của chúng tôi cho hiệu quả phân loại cao hơn so với các công trình nghiên cứu trước đó trên cùng nguyên tắc phân loại và tập dữ liệu. Chúng tôi cũng nhận thấy rằng việc kết hợp của tất cả các đặc trưng từ vựng, cú pháp và ngữ nghĩa của câu hỏi để phân loại là không cần thiết. Chính vì vậy trong nghiên cứu tiếp theo chúng tôi sẽ nghiên cứu làm thế nào để kết hợp các đặc trưng tốt hơn nhằm đạt được sự phân loại có độ chính xác cao hơn. TÀI LIỆU THAM KHẢO [1] Zhiheng Huang, Marcus Thint, and Zengchang Qin, 2008, Question classification using head words and their hypernyms, In Proceedings of the Conference on Empirical Methods in Natural Language Processing, (EMNLP ’08), pp 927-936. [2] David A. Hull, 199, Xerox TREC-8 question answering track report, In In Voorhees and Harman. [3] Vijay Krishnan, Sujatha Das, and Soumen Chakrabarti, 2005, Enhanced answer type inference from questions using sequential models, In Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing, HLT ’05, pp 315-322. [4] Wendy G. Lehnert, 1977, A conceptual theory of question answering, In Proceedings of the 5th international joint conference on Artificial intelligence, Volume 1, pp158-164. [5] Fangtao Li, Xian Zhang, Jinhui Yuan, and Xiaoyan Zhu, 2008, Classifying what-type questions by head noun tagging, In Proceedings of the 22nd International Conference on Computational Linguistics - Volume 1, COLING ’08, pp 481-488. [6] Xin Li and Dan Roth, 2002, Learning question classifiers, In Proceedings of the 19th international conference on Computational linguistics, COLING ’02, pp 1-7. [7] Xin Li and Dan Roth, 2004, Learning question classifiers: The role of semantic information, In Proc. International Conference on Computational Linguistics (COLING), pp 556-562. 89 [8] Babak Loni, Gijs van Tulder, Pascal Wiggers, David M.J. Tax, and Marco Loog, 2011, Question classification with weighted combination of lexical, syntactical and semantic features, In Proceedings of the 15th international conference of Text, Dialog and Speech, pp 243-250. [9] Dan Moldovan, Marius Pasca, Sanda Harabagiu, and Mihai Surdeanu, 2003, Performance issues and error analysis in an open-domain question answering system, ACM Trans, Inf. Syst., pp 133-154. [10] João Silva, Luísa Coheur, Ana Mendes, and Andreas Wichert, 2011, From symbolic to subsymbolic information in question classification, Artificial Intelligence Review, 35(2): pp 137-154. CLASSIFYING WHAT-TYPE QUESTIONS BY USING MULTIPLE FEATURE TYPES Nguyen Van Tu Faculty of Mathematic, Physics and Informatics, Tay Bac University Abstract: Question classification plays an important role in automatic question answering systems. The task of question classification is to predict the entity type for answering a natural language question. In automatic question answering systems, the questions with question word “What” accounts for the majority, but the classification of these questions is a lot more difficult than this of other questions. In this paper, we propose to extract the appropriate features to classify questions What-type with high accuracy. We also suggest a new feature type which we call question pattern and combining with other different features to question classification. We tested our proposed approach using a Support Vector Machines as the classifier and using TREC dataset and achieved classification what-type questions with higher accuracy than the previous studies on the same question taxonomy and dataset. Keywords: question classification, question answering systems, question pattern, support vector machines.

Các file đính kèm theo tài liệu này:

6_3769_2136080.pdf