Đề xuất mô hình tổ chức quản lý kho dữ liệu công trình khoa học và công nghệ tại trường Đại học Giao thông vận tải thành phố Hồ Chí Minh

Tài liệu Đề xuất mô hình tổ chức quản lý kho dữ liệu công trình khoa học và công nghệ tại trường Đại học Giao thông vận tải thành phố Hồ Chí Minh: TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016 3 ĐỀ XUẤT MÔ HÌNH TỔ CHỨC QUẢN LÝ KHO DỮ LIỆU CÔNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ TẠI TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI THÀNH PHỐ HỒ CHÍ MINH PROPOSED ORGANIZATIONAL MODEL DATA STORAGE MANAGEMENT PROJECTS THE SCIENCE AND TECHNOLOGY IN HO CHI MINH CITY UNIVERSITY OF TRANSPORT Vũ Ngọc Bích(1), Đặng Nhân Cách(2), Hồ Hải Vinh(3) (1), (3)Phòng Khoa học công nghệ - Nghiên cứu và Phát triển (2) Trung tâm Dữ liệu và Công nghệ thông tin Tóm tắt: Trong những năm qua, công tác nghiên cứu khoa học, xuất bản tạp chí, viết giáo giáo trình của Trường Đại học Giao thông vận tải Thành phố Hồ Chí Minh đã có những đóng góp đáng kể vào giải quyết các nhu cầu thực tiễn của Nhà trường, địa phương cũng như Bộ - Ngành. Tuy nhiên, việc tổ chức quản lý và vận hành chưa hiệu quả. Chúng ta đang lưu trữ bằng file và rải rác ở các đơn vị khác nhau. Bài viết đề xuất một giải pháp đề xây dựng kho dữ liệu tập trung về quản lý kh...

pdf4 trang | Chia sẻ: quangot475 | Lượt xem: 267 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Đề xuất mô hình tổ chức quản lý kho dữ liệu công trình khoa học và công nghệ tại trường Đại học Giao thông vận tải thành phố Hồ Chí Minh, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016 3 ĐỀ XUẤT MÔ HÌNH TỔ CHỨC QUẢN LÝ KHO DỮ LIỆU CÔNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ TẠI TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI THÀNH PHỐ HỒ CHÍ MINH PROPOSED ORGANIZATIONAL MODEL DATA STORAGE MANAGEMENT PROJECTS THE SCIENCE AND TECHNOLOGY IN HO CHI MINH CITY UNIVERSITY OF TRANSPORT Vũ Ngọc Bích(1), Đặng Nhân Cách(2), Hồ Hải Vinh(3) (1), (3)Phòng Khoa học công nghệ - Nghiên cứu và Phát triển (2) Trung tâm Dữ liệu và Công nghệ thông tin Tóm tắt: Trong những năm qua, công tác nghiên cứu khoa học, xuất bản tạp chí, viết giáo giáo trình của Trường Đại học Giao thông vận tải Thành phố Hồ Chí Minh đã có những đóng góp đáng kể vào giải quyết các nhu cầu thực tiễn của Nhà trường, địa phương cũng như Bộ - Ngành. Tuy nhiên, việc tổ chức quản lý và vận hành chưa hiệu quả. Chúng ta đang lưu trữ bằng file và rải rác ở các đơn vị khác nhau. Bài viết đề xuất một giải pháp đề xây dựng kho dữ liệu tập trung về quản lý khoa học và đề xuất một hệ thống để quản lý và vận hành công tác quản lý khoa học công nghệ. Tác giả cũng đề xuất một số giải pháp để phân tích khai phá kho dữ liệu đề xuất ở trên để nhằm nâng cao chất lượng công tác nghiên cứu khoa học trong Nhà trường phù hợp với nhu cầu thực tiễn. Từ khóa: Kho dữ liệu, khai phá dữ liệu, hệ hỗ trợ ra quyết định, hệ tư vấn. Abstract: Scientific research in universities is among the criteria for assessing the quality of higher education, especially in the current context. Over the years, the scientific research activity of Ho Chi Minh City University of Transport has made a significant contribution to solving the practical needs of The university, locality as well as ministries - sectors. However, the quantity of research works hasn’t been corresponding to the potential of our teaching staff, students, and graduate students. Also, the quality of the studies doesn’t satisfy our desire. The paper outlines the current status of the scientific research activity at Ho Chi Minh City University of Transport, analyze the causes, and propose some solutions in order to improve the quality of the scientific research activity at the university in accordance with practical needs. Keywords: Data warehouse, data mining, making a decision system, recommender system. 1. Giới thiệu Trong những năm qua, công tác nghiên cứu khoa học, xuất bản tạp chí, viết giáo trình của Trường Đại học Giao thông vận tải Thành phố Hồ Chí Minh đã có những đóng góp đáng kể vào giải quyết các nhu cầu thực tiễn của Nhà trường, địa phương cũng như Bộ - Ngành. Chiến lược phát triển dài hạn (2010 - 2020) và tầm nhìn đến năm 2030 [1] và bài báo [2] cũng đã xác định Nhà trường cần tăng cường công tác nghiên cứu khoa học (NCKH) và quản lý khoa học. Tuy nhiên, hiện này, việc tổ chức quản lý và vận hành là chưa hiệu quả. Bài viết đề xuất một giải pháp để xây dựng kho dữ liệu tập trung về quản lý khoa học và đề xuất một hệ thống để quản lý - vận hành công tác quản lý khoa học công nghệ. Tác giả cũng đề xuất một số giải pháp để phân tích khai phá kho dữ liệu đề xuất ở trên để nhằm nâng cao chất lượng công tác nghiên cứu khoa học trong Nhà trường phù hợp với nhu cầu thực tiễn. 2. Cơ sở lý thuyết và các vấn đề liên quan 2.1. Kho dữ liệu Kho dữ liệu (Data Warehouse - DW) là hệ thống cơ sở dữ liệu (kho dữ liệu) máy tính được thiết kế, sắp xếp có mục đích và định hướng rõ ràng của một tổ chức nhằm mục đích quản lý, cung cấp thông tin một cách kịp thời, chính xác, đồng thời là nền tảng cho việc xây dựng các ứng dụng phân tích dữ liệu, hỗ trợ ra quyết định [3]. Theo John Ladley [4], Công nghệ kho dữ liệu (Data Warehouse Technology) là tập các phương pháp, kỹ thuật và các công cụ có thể kết hợp, hỗ trợ nhau để cung cấp thông tin cho người sử dụng trên cơ sở tích hợp từ 4 Journal of Transportation Science and Technology, Vol 20, Aug 2016 nhiều nguồn dữ liệu, nhiều môi trường khác nhau. Trong những năm qua, đặc biệt trong giai đoạn 2011 - 2015, công tác NCKH của Nhà trường đã đạt được những kết quả đáng khích lệ cả về số lượng và chất lượng (bảng 1, 2, 3, 4 và 5), phần nào đáp ứng được nhu cầu của ngành giao thông vận tải, mặt khác đã góp phần giải quyết một số vấn đề trong công tác giảng dạy và học tập cũng như hợp tác, liên kết quốc tế trong đào tạo của Nhà trường. Bảng 1. Số lượng đề tài NCKH giai đoạn 2011-2015. Năm Loại đề tài NCKH/Dự án Cấp Bộ Cấp Cơ sở Sinh viên 2011 07 14 14 2012 07 15 16 2013 08 24 17 2014 06 12 24 2015 05 39 16 Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT. Bảng 2. Số cán bộ giảng viên, người học tham gia NCKH giai đoạn 2011-2015. Năm Loại đề tài NCKH/Dự án Cấp Bộ Cấp Cơ sở Sinh viên 2011 85 70 56 2012 80 75 62 2013 96 120 66 2014 76 36 70 2015 68 103 58 Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT. Bảng 3. Số bài báo khoa học công bố trên các Tạp chí/Hội nghị, hội thảo khoa học giai đoạn 2011-2015. Năm Số bài báo khoa học đăng trên tạp chí khoa học chuyên ngành Số bài báo khoa học đăng trong kỷ yếu hội nghị, hội thảo Quốc tế Quốc gia Quốc tế Quốc gia 2011 08 46 14 05 2012 08 51 8 13 2013 13 89 18 68 2014 17 102 13 79 2015 23 91 15 105 Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT. Bảng 4. Số giáo trình, bài giảng đăng ký biên soạn giai đoạn 2011-2015. Năm Loại giáo trình/bài giảng Giáo trình Bài giảng Tài liệu tham khảo/bài tập 2011 10 02 01 2012 08 05 - 2013 04 07 - 2014 14 28 01 2015 13 18 01 Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT. TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016 5 Bảng 5. Số lượng bài báo đăng trên tạp chí, ấn phẩm xuất bản có chỉ số, giai đoạn 2011-2015. Năm Loại ấn phẩm Tạp chí Kỷ yếu hội nghị có chỉ số ISBN Kỷ yếu hội nghị không có chỉ số ISBN 2011 19 - - 2012 101 - - 2013 118 - 81 2014 106 - - 2015 76 45 - Nguồn: Báo cáo thống kế - phòng KHCN-NC&PT. Việc quản lý các đề tài, bài báo, giáo trình, tài liệu tham khảo hiện nay chủ yếu là trên bản cứng, các thông tin đăng tải trên mạng nội bộ mới chỉ dừng lại ở mức thống kê. Với tốc độ phát triển ngày càng nhiều đề tài, công trình nghiên cứu, thì việc quản lý và triển khai, khai thác như hiện tại là không đáp ứng được nhu cầu thực tiễn, mặt khác việc truy xuất dữ liệu phục vụ báo cáo về khoa học công nghệ là tốn khá nhiều thời gian, bất tiện, không khoa học. Vì vậy, việc xây dựng kho dữ liệu tập trung về quản lý KHCN là nhu cầu tất yếu để khắc phục những hạn chế ở trên. 2.2. Khai phá dữ liệu Khai phá dữ liệu (Data mining) [5] là quá trình khám phá các tri thức mới và các tri thức có ích ở dạng tiềm năng trong nguồn dữ liệu đã có. Khai phá dữ liệu là một bước của quá trình khai thác tri thức (Knowledge Discovery Process), bao gồm: - Xác định vấn đề và không gian dữ liệu để giải quyết vấn đề (Problem understanding and data understanding). - Chuẩn bị dữ liệu (Data preparation), bao gồm các quá trình làm sạch dữ liệu (data cleaning), tích hợp dữ liệu (Data integration), chọn dữ liệu (Data selection), biến đổi dữ liệu (Data transformation). - Khai thác dữ liệu (Data mining): Xác định nhiệm vụ khai thác dữ liệu và lựa chọn kỹ thuật khai thác dữ liệu. Kết quả cho ta một nguồn tri thức thô. - Đánh giá (Evaluation): Dựa trên một số tiêu chí tiến hành kiểm tra và lọc nguồn tri thức thu được. - Triển khai (Deployment). Quá trình khai thác tri thức không chỉ là một quá trình tuần tự từ bước đầu tiên đến bước cuối cùng mà là một quá trình lặp và có quay trở lại các bước đã qua. 3. Mô hình quản lý khoa học công nghệ 3.1. Kho dữ liệu Kho dữ liệu Chúng tôi đã thiết kế mô hình kho dữ liệu KHCN có cấu trúc, dựa trên những dữ liệu đang có sẵn của Nhà trường và đưa tất cả tập trung vào kho dữ liệu này. Tất cả những yêu cầu truy xuất đến dữ liệu của kho dữ liệu sẽ cho kết nối theo chuẩn quy định. Ngoài bốn mô đun chức năng đã được thiết kế để luôn phục vụ cho công tác quản lý khoa học chúng tôi còn tạo ra những cổng giao tiếp riêng cho phép những ứng dụng khác có thể kết nối vào để truy vấn dữ liệu. Hình 1. Mô hình kho dữ liệu KHCN. 3.2. Hệ thống quản lý KHCN - Quản lý đề tài: Cho phép quản lý tất cả các loại đề tài của CB - CNV trong trường như: Đề tại cấp sơ cở; đề tại cấp bộ; đề tài cấp nhà nước.Chức năng này hỗ trợ rất tốt 6 Journal of Transportation Science and Technology, Vol 20, Aug 2016 cho phép chọn lọc những đề tài đã nghiệm thu, hay chưa nghiệm thu - Quản lý tạp chí: Tất cả các bài báo trong các số tạp chí đều được tổ chức quản lý theo từng số xuất bản của tạp chí theo định kỳ. Từ đó, dễ dàng tìm kiếm các bài báo cho những lúc cần thiết. - Quản lý bài báo: Tất cả các bài báo hội nghị, bài báo tạp chí trong nước hay quốc đề đều được tổ chức cập nhật thường xuyên thông qua chức năng này. - Quản lý giáo trình: Quản lý tất cả bài giảng chi tiết hay giáo trình của Nhà trường nhằm phục vụ sinh viên 3.3. Phân tích dữ liệu Trên cơ sở các mô đun được thiết kế ở trên cho phép chúng ta tương tác qua kho dữ liệu như: Thêm, xóa sửa, cập nhật thông tin. Với dữ liệu ngày càng được cập nhật và thêm vào, trên cơ sở đó, chúng ta có thể trích xuất và khai phá, phân tích dữ liệu để hỗ trợ ra quyết định hay đưa ra tư vấn cho những vấn đề liên quan đến công tác KHCN. Có thể dựa trên những thuật toán và đưa ra những thống kê phân tích tự động nhanh chóng. Hoặc cũng có thể trích xuất ra và xử dụng những công cụ hỗ trợ phân tích như Weka [6] để phân tích. 4. Kết luận Trong bài báo này, tác giả đã giới thiệu được mô hình tổng quan trong việc quản lý và hoạt động KHCN của Nhà trường. Như: Xây dựng được kho dữ liệu KHCN tập trung; giới thiệu được hệ thống kết nối đến kho dữ liệu tập trung này và đưa ra một số giải pháp để phân tích khai phá dữ liệu khoa học nhằm phục vụ trong công tác của Nhà trường. Nếu chúng ta thực hiện đồng bộ các giải pháp như đã nêu thì chắc chắn, bức tranh KHCN của Trường ta sẽ ngày càng sáng nét hơn; những kết quả mà NCKH và chuyển giao công nghệ tạo ra sẽ chắc chắn có chất lượng cao, đủ khả năng ứng dụng, góp phần giải quyết các vấn đề quan trọng của địa phương, ngành, của quốc gia, mà trước mắt là góp phần đắc lực nâng cao công tác quản lý KH CN của Nhà trường Tài liệu tham khảo [1] Kế hoạch chiến lược phát triển dài hạn (2010-2020) và tầm nhìn đến năm 2030, Trường Đại học Giao thông vận tải Thành phố Hồ Chí Minh. [2] Vũ Ngọc Bích, Hồ Hải Vinh, Nguyễn Hải Dương, .Nâng cao chất lượng công tác nghiên cứu khoa học trong trường đại học Giao thông vận tải Tp. Hồ Chí Minh, Tạp chí khoa học công nghệ giao thông vận tải, số 13, tháng 11/2014, trang 03-06. [3] Nguyễn Vân Anh, Lê Vũ Toàn (2012), Tạp chí hoạt động khoa học –Bộ KH&CN, số ISSN 1859-4794, số 635, tháng 4/2012, trang 57-60. [4] Bischoff, J. and T. Alexander, Data warehouse: practical advice from the experts1997: Prentice-Hall, Inc. [5] https://vi.wikipedia.org/wiki/Khai_phá_dữ_lliệu [6] https://en.wikipedia.org/wiki/Weka_(machine_lea rning). Ngày nhận bài: 25/07/2016 Ngày chuyển phản biện: 29/07/2016 Ngày hoàn thành sửa bài: 16/08/2016 Ngày chấp nhận đăng: 23/08/2016

Các file đính kèm theo tài liệu này:

  • pdf77_1_219_1_10_20170717_2727_2202520.pdf