Kết hợp mạng nơron FIR và mô hình arima theo hình thức động để nâng cao hiệu quả dự báo chuỗi thời gian - Nguyễn Chí Thành

Tài liệu Kết hợp mạng nơron FIR và mô hình arima theo hình thức động để nâng cao hiệu quả dự báo chuỗi thời gian - Nguyễn Chí Thành: Công nghệ thông tin N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 170 KẾT HỢP MẠNG NƠRON FIR VÀ MÔ HÌNH ARIMA THEO HÌNH THỨC ĐỘNG ĐỂ NÂNG CAO HIỆU QUẢ DỰ BÁO CHUỖI THỜI GIAN Nguyễn Chí Thành*1, Hà Gia Sơn2 Tóm tắt: Nội dung bài báo viết về một giải pháp để nâng cao hiệu quả dự báo chuỗi thời gian bằng việc kết hợp giữa mạng nơron FIR và mô hình ARIMA, các trọng số sẽ được biến đổi theo thời gian. Kết quả dự báo được đánh giá dựa trên tiêu chí MAE. Phần ứng dụng dựa vào dữ liệu về giá 5 mặt hàng cơ bản bán ra của thị trường tài chính Forex (Foreign Exchange). Kết quả cho thấy, việc kết hợp này có hiệu xuất cao hơn việc kết hợp thông thường. Từ khóa: Mô hình dự báo, ARIMA, Chuỗi thời gian, Mạng nơron FIR. 1. ĐẶT VẤN ĐỀ Dự báo đó chính là dự kiến, tiên đoán về những sự kiện, hiện tượng, trạng thái nào đó có thể sẽ xảy ra trong tương lai. Dự báo có thể là một dự đoán chủ quan hoặc trực giác về tương lai. Nhưng để dự báo được h...

pdf10 trang | Chia sẻ: quangot475 | Lượt xem: 467 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Kết hợp mạng nơron FIR và mô hình arima theo hình thức động để nâng cao hiệu quả dự báo chuỗi thời gian - Nguyễn Chí Thành, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Công nghệ thông tin N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 170 KẾT HỢP MẠNG NƠRON FIR VÀ MÔ HÌNH ARIMA THEO HÌNH THỨC ĐỘNG ĐỂ NÂNG CAO HIỆU QUẢ DỰ BÁO CHUỖI THỜI GIAN Nguyễn Chí Thành*1, Hà Gia Sơn2 Tóm tắt: Nội dung bài báo viết về một giải pháp để nâng cao hiệu quả dự báo chuỗi thời gian bằng việc kết hợp giữa mạng nơron FIR và mô hình ARIMA, các trọng số sẽ được biến đổi theo thời gian. Kết quả dự báo được đánh giá dựa trên tiêu chí MAE. Phần ứng dụng dựa vào dữ liệu về giá 5 mặt hàng cơ bản bán ra của thị trường tài chính Forex (Foreign Exchange). Kết quả cho thấy, việc kết hợp này có hiệu xuất cao hơn việc kết hợp thông thường. Từ khóa: Mô hình dự báo, ARIMA, Chuỗi thời gian, Mạng nơron FIR. 1. ĐẶT VẤN ĐỀ Dự báo đó chính là dự kiến, tiên đoán về những sự kiện, hiện tượng, trạng thái nào đó có thể sẽ xảy ra trong tương lai. Dự báo có thể là một dự đoán chủ quan hoặc trực giác về tương lai. Nhưng để dự báo được hiệu quả hơn, người ta cố loại trừ những tính chủ quan việc dùng các giải pháp kỹ thuật có độ chính xác cao. Việc nâng cao hiệu quả dự báo là việc làm cần thiết trong một xã hội hiện đại. Chính vì vậy, ở nước ngoài , có nhiều công trình nghiên cứu về vấn đề này, đã có 1 hệ thống lý thuyết gồm nhiều phương pháp, qui trình cũng như nhiều mô hình để dự báo tương lai như tài liệu [12-13], [15]. Hiện tại, trong lĩnh vực này, đã có xu hướng kết hợp các lý thuyết hiện đại vào dự báo như ứng dụng các loại mạng nơron đặc biệt là nơron lai (sự kết hợp của mạng nơron thông thường với các mô hình khác) như các tài liệu [7-11]. Điều này chứng tỏ sự kết hợp các mô hình, các công cụ có vai trò rất lớn trong việc dự báo. Trong thời gian gần đây, ở trong nước, chúng ta đã quan tâm nhiều hơn tới lĩnh vực dự báo, đã có nhiều đề tài các cấp, với những mục đích và cách tiếp cận khác nhau về dự báo, điển hình là các công trình [1-4]. Tổng hợp các công trình nghiên cứu cho thấy, ngày càng xuất hiện những mô hình có hiệu quả cao, tuy nhiên, khi dự báo, có nhiều mô hình được thiết lập và người ta thường chọn mô hình có hiệu quả cao nhất và bỏ qua các mô hình khác, điều này gây ra một sự lãng phí, rõ ràng là việc kết hợp các giá trị dự báo cũng phải được quan tâm. Có một số công trình đã chú ý tới điều này, ví dụ như các công trình [5-6]. Tuy nhiên, hiệu quả dự báo vẫn chưa được nâng cao do các trọng số kết hợp giữa các mô hình là một hằng số, không phù hợp với sự biến động của chuỗi thời gian. Để nâng cao hơn nữa hiệu quả dự báo, tác giả bài viết này sẽ đưa ra giải pháp kết hợp giữa kết quả dự báo của mạng nơron FIR với mô hình ARIMA mà các trọng số sẽ thay đổi để thích nghi với sự biến đổi của chuỗi thời gian, nhằm đạt hiệu quả cao nhất. Trong bài viết, phần đầu là cơ sở lý thuyết chung và các mô hình về dự báo, ở mục tiếp theo, tác giả đưa ra giải pháp để phối hợp 2 mô hình FIR và ARIMA theo hình thức động. Phần sau là một ứng dụng dựa vào dữ liệu của thị trường tài chính Forex . Kết quả cho thấy, giải pháp phối hợp các mô hình dự báo mà tác giả đưa ra có hiệu quả cao hơn các mô hình dự báo thông thường mà bài báo [5,6] đã trình bày. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 171 2. NỘI DUNG CẦN GIẢI QUYẾT 2.1. Xây dựng lý thuyết 2.1.1. Các giá trị thích hợp, dự báo kiểm định và tiên nghiệm Theo ([15]) trong môi trường dự báo có ba thời đoạn là dùng dữ liệu trong thời đoạn n1 đến n2 để ước lượng một vài mô hình, các thời đoạn từ n2 + 1 đến n3 để kiểm định các mô hình, lựa chọn mô hình tốt nhất, hay cũng có thể dùng để kết hợp các mô hình; và thời đoạn n3 + 1 trở đi được gọi là các giá trị dự báo tiên nghiệm. 2.1.2. Tiêu chuẩn sai số trung bình để đánh giá mô hình Theo ([15]), tiêu chuẩn sai số trung bình MAE để đánh giá mô hình dự báo là: Sai số trung bình:     n i ii yy n MAE 1 1 (2.1) Trong đó, yi là giá trị thực tế và iy  là giá trị được dự báo, n là số các quan sát 2.1.3. Các phương pháp thường sử dụng trong dự báo Theo ([15]), có hai phương pháp dự báo: dự báo định tính, dự báo định lượng. -Dự báo định tính: Là dự báo dựa trên phán đoán chủ quan, trực giác của người ra quyết định. Phương pháp phổ biến là lấy phiếu thăm dò và thu thập ý kiến như lấy ý kiến các nhà phân phối, người tiêu dùng, chuyên gia Nhược điểm chung của phương pháp này là mang tính chủ quan, kinh nghiệm và cảm tính. -Dự báo định lượng: Các mô hình này sẽ khắc phục được tính chủ quan và cảm tính trong dự báo bằng cách sử dụng các công cụ toán học. Phương pháp dự báo định lượng thường dùng phổ biến là dự báo chuỗi thời gian sử dụng các mô hình tự hồi quy. Theo [13], [14] và [15] ta có mô hình chuỗi thời gian tự hồi quy hoàn toàn có cấu trúc như sau: Yt = α1Yt-1+ α2Yt-2 + + αpYt-p+ ut (2.2) Trong đó, Yt là quan sát thứ t đối với biến phụ thuộc và ut là thành phần sai số. + Mô hình trung bình trượt MA (Moving Average- Trung bình trượt) : Yt = νt – β1νt-1– β2 νt-2– – βq νt-q (2.3) Với νt là chuỗi sai số nhiễu trắng. Do đó, Yt là tổ hợp tuyến tính của các biến ngẫu nhiên nhiễu trắng. Hình 1. Mạng nơron truyền thẳng, hình trái là một tế bào nơron và bên phải là mạng truyền thẳng. + Các mô hình ARMA (Auto Regressive Moving Average - Trung bình trượt kết hợp tự hồi qui), phối hợp giữa các công thức tự hồi quy và trung bình trượt tạo ra mô hình ARMA. Do đó, mô hình ARMA (p, q) có dạng tổng quát: Yt = α1Yt-1+ α2Yt-2 + + αpYt-p+ ut + νt – β1νt-1– β2 νt-2– – βq νt-q ( 2.4) Công nghệ thông tin N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 172 + Mô hình ARIMA: Giả sử rằng, một chuỗi thời gian không dừng có thể được chuyển thành một chuỗi dừng bằng cách lấy sai phân d sau đó sẽ có thể được mô hình hoá theo ARMA (p, q). Tích hợp MA và mô hình ARMA được mô hình ARIMA. + Sử dụng mạng nơron trong dự báo: - Mạng nơ ron: Mạng nơron nhân tạo, gọi tắt là mạng nơron, là một mô hình xử lý thông tin phỏng theo cách thức của các hệ nơron sinh học (hình 1). Xét một tế bào nơron duy nhất được trích từ lớp l của một mạng L lớp . Đầu vào lix tới nơron sẽ được nhân với 1 hệ số l ijw gọi là trọng số đại diện cho các kết nối khớp thần kinh giữa nơron i trong lớp trước đó và nơron j trong lớp l. Và đầu ra của nơron , 1ljx , là một hàm sigmoid là tổng trọng số đầu vào của nó: )(1  i l i l i l j xwfx (2.5) - Mạng nơron FIR (Finite impulse response- mạng đáp ứng xung hữu hạn) : theo [8-9], trong tế bào nơron của mạng này, khớp tĩnh thay bằng một bộ lọc tuyến tính FIR. Bộ lọc này có thể được mô hình hóa với một đường trễ phân nhánh như minh họa trong hình 2. Trong bộ lọc này, đầu ra y(k) sẽ tương ứng với tổng trọng số giá trị trễ của đầu vào.    T n nkxnwky 0 )()()( (2.6) Điều này tương ứng với các thành phần trung bình trượt của mô hình tự hồi qui (ARMA-công thức 2.4). Bộ lọc FIR, trên thực tế, là một trong số mạng nơron tốt nhất có phần tử thích nghi cơ bản để áp dụng vào mô hình ARMA này. Hình 2. mô hình bộ lọc FIR. Đầu ra )(1 kxlj  của lớp l tại thời điểm k bây giờ được tính bằng hàm sigmoid của tổng của tất cả các kết quả đầu ra l của bộ lọc cung cấp cho nơron (Hình 3): ))(.()( , 1 kxwfkx li i l ji l j  (2.7) Hình 3. Nơron FIR và mạng nơron FIR. FIR là một trong những sự lựa chọn tốt nhất trong việc dự báo chuỗi thời gian vì kích thước nhỏ gọn, lại mang ưu điểm của mạng nơron lai, và đặc biệt đầu ra sẽ Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 173 tương ứng với tổng trọng số giá trị của đầu vào và tương ứng với các thành phần của mô hình tự hồi quy ARIMA (Theo [8-10]). 2.1.4. Phối hợp các mô hình dự báo Giả sử ta đã có kết quả dự báo từ các mô hình FIR và ARIMA, nhiệm vụ đặt ra là phải kết hợp 2 mô hình này. Theo [6], việc kết hợp được làm như sau: Đầu tiên, dùng dữ liệu trong thời kỳ mẫu để ước lượng các mô hình, sau đó, dự báo các giá trị của biến phụ thuộc, dùng các giá trị này để xây dựng tập các trọng số, tạo các giá trị dự báo ngoài mẫu từ các mô hình riêng biệt và sử dụng các trọng số đã tìm được. Nếu gọi tY là giá trị thực tại thời điểm t của biến phụ thuộc, và tktt fff ......,,, 21 là các giá trị dự báo được tạo ra bởi k mô hình khác nhau. Phương pháp đương nhiên là tạo ra giá trị trung bình có trọng số của các giá trị dự báo này. Do vậy, giá trị dự báo kết hợp sẽ là: tkkttt ffff    .....22110 (2.8) Trong đó, 0ˆ , 1ˆ , .. kˆ - Các trọng số cần xác định. Xác định các trọng số bằng phương pháp Ước lượng tham số của mô hình hồi qui bội, cụ thể như sau: Theo[15] và [6], trong thực tế chúng ta thường chỉ có dữ liệu từ mẫu. Từ số liệu mẫu chúng ta ước lượng hồi qui tổng thể. Hàm hồi qui mẫu: iikkiii eXXXY  ,,33,221 ˆ...ˆˆˆ  (2.9)  ikkiiiiii XXXYYYe ,,33,221 ˆ...ˆˆˆˆ   (2.10) Hay viết dưới dạng ma trận eXY  ˆ trong đó:                k    ˆ. ... ˆ ˆ ˆ 2 1 ;                ke e e e . ... 2 1 = ˆXY  Với các mˆ là ước lượng của tham số m . Chúng ta trông đợi mˆ là ước lượng không chệch của m , hơn nữa phải là một ước lượng hiệu quả. Áp dụng phương pháp bình phương tối thiểu, chọn k ...,, 21 sao cho:   2 1 ,,33,221 1 2 ˆ...ˆˆˆ   n i ikkiii n i i XXXYe  (2.11) đạt cực tiểu. Điều kiện cực trị của (2.10) là:       0ˆ...ˆˆˆ2 ... 0ˆ...ˆˆˆ2 0ˆ...ˆˆˆ2 , 1 ,,33,221 1 2 ,2 1 ,,33,221 2 1 2 1 ,,33,221 1 1 2                      ik n i iKKiii k n i i i n i iKKiii n i i n i iKKiii n i i XXXXY e XXXXY e XXXY e       (2.12) Hệ phương trình (2.11) được gọi là hệ phương trình chuẩn của hồi qui mẫu (2.8). Viết hệ dưới dạng ma trận là: Công nghệ thông tin N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 174   YXXX TT ˆ )()(ˆ 1 YXXX TT   (2.13)                       iki i i T YX iYX Y YX . . . 2                         kikiikiikiki kiiiiiii kiii T XXXXXXX XXXXXXX XXXn XX ...... . . ...... .... 32 232222 32 (2.14) Giải thuật hồi qui bội (theo [6]) để xác định các hệ số này là: Input matran(n,k) // bảng kết quả trên Ouput mangbeta // mangbeta chứa các giá trị n ...., 10 . Giải thuật: 1. Xây dựng ma trận XTY //theo công thức (2.14) 2. Xây dựng ma trận XTX //theo công thức (2.14) 3. Tính giá trị định thức XTX 4. Tính ma trận nghịch đảo của (XTX) 5. Tính tích )()(ˆ 1 YXXX TT  để xác định hệ số n ...., 10 Có 1 ý tưởng mà bài viết đưa ra là kết hợp FIR với 1 mô hình dự báo chuỗi thời gian khác (đơn giản nhất là ARIMA), tuy nhỉên, sự kết hợp này cần phải “động”. Cụ thể: thông thường, các hệ số 110 ,......, nn  khi tìm đuợc luôn là một hằng số, tuy nhiên, trong trường hợp “động”, các hệ số này sẽ thay đổi theo thời gian. Theo [15], trong dự báo kinh tế, người ta thường sử dụng 10 hàm thông dụng là: bậc một, bậc hai, logarit – tuyến tính, nghịch đảo, tương tác, tuyến tính-logarit, nghịch đảo – logarit, bậc hai – logarit, log-hai lần, logistic. Để đơn giản, ta sẽ sử dụng hàm bậc nhất trong phần ứng dụng minh họa. Giả định rằng trong mô hình trên, tiii 10   với t thể hiện thời gian từ 1 đến n, và i = 0, 1,..., k (k là các mô hình phối hợp). Điều này dẫn đến mô hình cải biến: ttkktkkottt utfftfftY  )(.....)( 11111100100  (2.15) Nếu đặt : kkkkk AAAAAt 21111111000100 ....,.....,    Và ktkt FfFf  ,....11 , ktkkt FtfFtf 211 ),...()(   ta sẽ có phương trình: kkkkkkt FAFAFAFAFAAY 221122110 ..............   Nếu đặt kn 2 ta có phương trình : nnt FAFAAY .....110  . (2.16) Đây chính là phương trình hồi qui cơ bản (2.8), có thể dùng giải thuật trên để xác định các hệ số nAAA ....,, 10 này. 2.2. Ứng dụng: Dự báo giá bán ra của 5 mặt hàng cơ bản trên thị trường tài chính Forex - Dữ liệu: Trong ứng dụng này, luận án lấy dữ liệu về giá 5 mặt hàng cơ bản là dầu thô WTI, khí tự nhiên, vải Cotton Hoa kỳ loại 2, cà phê Luân Đôn, thóc bán ra ở trang web trang của thị trường tài chính Forex. Dữ liệu bắt đầu từ 17/06/2010 đến 10/05/2017, gồm 1780 trường hợp. Biểu đồ dữ liệu như hình 4. - Dự báo bằng việc sử dụng mạng nơron FIR và sử dụng mô hình chuỗi thời gian (dùng mô hình ARIMA) cho từng biến. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 175 + Dự báo bằng ARIMA: Sau khi đã thử nghiệm, các thông số về mô hình tối ưu lựa chọn theo tiêu chuẩn MAE của các biến là: Dầu có mô hình ARIMA(1,1,2), Khí có mô hình ARIMA(1,1,1), Vải có mô hình ARIMA(1,2,1), Cà phê có mô hình ARIMA(1,1,2) và Thóc có mô hình ARIMA(2,1,2). Hình 4. Biểu đồ biến động giá 5 mặt hàng cơ bản. + Dự báo bằng mạng nơron FIR: Dữ liệu huấn luyện là tập các cặp (Xh, Dh), Xh trong đó là thông số giá vàng lúc mở, lúc cao nhất và thấp nhất của ngày h, Dh là thông số giá vàng của ngày h+1. Tức là Dh =Xh1. Quá trình huấn luyện thực hiện theo giải thuật lan truyền ngược. Do số nơron đầu vào và đầu ra là 1 nên kích thước của FIR rất nhỏ gọn, tuy nhiên, phải chọn số lớp ẩn là 2, kính thước mạng đã thử nghiệm là 1x3x4x1, 1x4x5x1, 1x5x6x1 nhận được để dự báo các biến, thông số mạng nơron sau khi đã thử nghiệm có MAE nhỏ nhất là 1x3x4x1, Áp dụng mạng nơron FIR để dự báo các biến, thông số mạng nơron sau khi đã thử nghiệm có MAE nhỏ nhất là 1x3x4x1, Số mẫu trong thời kỳ ước lượng từ 1-1100, kiểm định là 1101 tới 1400 và tiên nghiệm là 1401-1580. - Kết hợp giữa dự báo bằng FIR và dự báo bằng mô hình ARIMA: + Phân bố dữ liệu: Với 580 dữ liệu còn lại, ta sẽ phân bổ như sau:  400 dữ liệu đầu, dùng trong thời kỳ ước lượng dự báo trong mẫu: sử dụng dữ liệu trong thời đoạn này để ước lượng một hoặc một vài mô hình.  Thời kỳ dự báo kiểm định: từ 401 đến 490, trong đó, giá trị thực tế của Y và tất cả các sX đều đã biết. Nếu trong thời đoạn này, MAE nhỏ hơn thì mô hình được đánh giá là tốt hơn và được lựa chọn.  Thời kỳ dự báo tiên nghiệm: thời đoạn 491 tới 580 dùng để chứng minh các tham số được chọn là đúng. + Kết hợp tĩnh: nếu sử dụng giải thuật hồi qui bội (ở mục 2.1.4) để xác định các hệ số 210 ,,  , ta sẽ có kết quả cụ thể 210 ,,  của dầu tương ứng là -0.93887, 1.01218 và 0.00588; của mặt hàng khí là :-0.25108, 1.09152, -0.00427; Vải: - 6.54752, 1.10957, 0.00189; cà phê: -0.33732, 1.15558, 0.01981 và thóc là : - 1072.73918, 0.87007, 98.31207. Các hệ số này sẽ không thay đổi theo thời gian nên ta gọi phương pháp này là “Kết hợp tĩnh”. Sai số trung bình MAE của các mặt hàng này được nêu tại bảng 1. Dầu thô 0 20 40 60 80 100 120 1 163 325 487 649 811 973 1135 1297 1459 1621 Dầu thô Khí tự nhiên 0,000 1,000 2,000 3,000 4,000 5,000 6,000 7,000 1 173 345 517 689 861 1033 1205 1377 1549 1721 Khí tự nhiên Vải c o ton 0 50 100 150 200 250 1 171 341 511 681 851 1021 1191 1361 1531 1701 Vải c oton Cà phê luân đôn 0,00 0,50 1,00 1,50 2,00 2,50 3,00 1 187 373 559 745 931 1117 1303 1489 1675 Cà phê luân đôn Thóc 0,00 2,00 4,00 6,00 8,00 10,00 12,00 14,00 16,00 18,00 20,00 1 163 325 487 649 811 973 1135 1297 1459 1621 Thóc Công nghệ thông tin N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 176 + Kết hợp động: Gọi mô hình ARIMA của từng biến là 1f và FIR của từng biến là 2f . Nếu kết hợp với nhau, ta sẽ có mô hình mới tY theo công thức: 22110 ffYt   Nhưng do hệ số 1 thay đổi theo thời gian, còn 2 là hệ số của mô hình FIR chính xác hơn so với mô hình ARIMA nên giữ nguyên, không đổi. (Tuy nhiên, có thể mở rộng bằng việc cho 2 thay đổi theo thời gian). Ta có : t10000   và t11011   . Phương trình trên sẽ trở thành : 22111101000 )( ffttYt   221111101000 ftfftYt   Đặt 223131111010000 ,,,, AftfAAtA   ta sẽ có một phương trình hồi qui đầy đủ là : 3322110 fAfAfAAYt  Để kết hợp các mô hình trong dự báo, phải xác định chính xác các hệ số A0, A1, A2, A3. Nhưng trước tiên, ta sẽ xác định giá trị 13 tff  . Ta có thể tính 3f bằng tích giữa biến ARIMA này với thời gian t . Sử dụng giải thuật kết hợp các mô hình bằng phương pháp hồi qui bội, cụ thể là: Input: matran(1080,5) // ma trận chứa bảng số liệu Output:MAEFIR, MAEARIMA, MAEkethop, R 2, giá trị kết hợp. Thuật toán 1. Tinh tf1 2. Matran(i,5)=matran(i,4)*matran(i,1) 3. Xây dựng ma trận XTX 4. Xây dựng ma trận XTY 5. Tính định thức xxt D bằng phương pháp Gaus 6. Tính ma trận nghịch đảo của (XTX) 7. Tính tích 2 ma trận để xác định hệ số A0,A1.A3 8. Tính độ lệch trung bình Ytb 9. Xác định các giá trị MAE Và R2: duyệt toàn bộ miền kiểm định tính giá trị kết hợp Ta sẽ xác định được các hệ số A0, A1, A2, A3 tương ứng của từng biến. Kết quả khi sử dụng giải thuật này được đánh giá bằng tiêu chuẩn MAE cho tại bảng 1. Bảng 1. Các tham số MAE tại miền kiểm định và tiên nghiệm. TT Tên mô hình dự báo Dầu Khí Vải Cà phê Thóc Miền kiểm định 1. ARIMA 7.4069 0.1416 30.7849 0.1416 3.6665 2. FIR 0.8161 0.0415 1.0935 0.0415 4.9045 3. Kết hợp tĩnh 0.8231 0.0774 0.1488 0.0246 1.9294 4. Kết hợp động 0.8059 0.0246 0.1684 0.0240 1.3259 5. MAE nhỏ nhất 0.8059 0.0246 0.1684 0.0246 1.3259 6. Mô hình có MAE nhỏ nhất Kết hợp động Kết hợp động Kết hợp động Kết hợp động Kết hợp động Miền tiên nghệm Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 177 7. ARIMA 12.0432 0.0470 36.3148 0.0470 3.9577 8. FIR 0.6002 0.0767 1.5961 0.0767 4.5863 9. Kết hợp tĩnh 0.6122 0.0609 0.1735 0.0295 3.4323 10. Kết hợp động 0.5944 0.0250 0.1222 0.0250 3.5458 11. MAE nhỏ nhất 0.5944 0.0250 0.1222 0.0250 3.5458 12. Mô hình có MAE nhỏ nhất Kết hợp động Kết hợp động Kết hợp động Kết hợp động Kết hợp động Đồ thị giữa kết quả, dự báo của FIR và dự báo ARIMA và kết hợp cả hai mô hình theo hình thức tĩnh và động tại miền kiểm định và miền tiên nghiệm của từng biến sẽ như sau: Hình 5. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động của mặt hàng “dầu” trong miền kiểm định (trái) và tiên nghiệm (phải). Hình 6. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động của mặt hàng “khí” trong miền kiểm định (trái) và tiên nghiệm (phải). Hình 7. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động của mặt hàng “cà phê” trong miền kiểm định (trái) và tiên nghiệm (phải). Hình 8. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động của mặt hàng “vải” trong miền kiểm định (trái) và tiên nghiệm (phải). 0 10 20 30 40 50 60 70 80 90 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ketqua ket hop dong arima Fir ket hop tinh 0 10 20 30 40 50 60 70 80 90 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ketqua ket hop dong arima Fir ket hop tinh 0 0,5 1 1,5 2 2,5 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ketqua ket hop dong arima Fir ket hop tinh 0 0,5 1 1,5 2 2,5 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ketqua ket hop dong arima Fir ket hop tinh 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ketqua ket hop dong arima Fir ket hop tinh 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ketqua ket hop dong arima Fir ket hop tinh 0 10 20 30 40 50 60 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ket qua ket hop dong arima Fir ket hop tinh 0 10 20 30 40 50 60 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ketqua kethop dong arima fir ket hop tinh Công nghệ thông tin N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 178 Hình 9. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động của mặt hàng “thóc” trong miền kiểm định (trái) và tiên nghiệm (phải). Nhận xét: Trong 5 trường hợp của cả 2 miền, ta thấy rằng: +Phương pháp kết hợp bình thường (kết hợp tĩnh) chưa mang lại hiệu quả cao (ở miền kiểm định, mặt hàng dàu và khí có MAE thậm chí còn thấp hơn so với FIR). +Sự kết hợp giữa FIR và ARIMA theo hình thức động đều mang lại hiệu quả tốt nhất (MAE nhỏ nhất) tại cả 2 miền kiểm định và tiên nghiệm. +Do trong khuôn khổ một bài báo, chỉ sử dụng 5 ví dụ ứng dụng, khi mở rộng các ứng dụng dự báo, ta còn giai đoạn kiểm định mô hình, nếu việc kết hợp theo hình thức “động” không mạng lại kết quả tốt hơn, thì vẫn có quyền lựa chọn lại kết quả mà FIR, ARIMA hoặc kết hợp tĩnh có MAE bé nhất làm kết quả dự báo. 3. KẾT LUẬN Trong nghiên cứu thực tế, quy trình phổ biến được các nhà phân tích chấp nhận là ước lượng một số các mô hình, và cuối cùng chọn lấy mô hình nào là “tốt nhất” theo mục tiêu. Tuy nhiên, các mô hình bị bỏ đi vẫn chứa những thông tin về các động thái rõ nét của biến phụ thuộc và lập luận rằng việc kết hợp dự báo từ nhiều mô hình sẽ tốt hơn là từ một mô hình duy nhất. Bài báo này đã tổng hợp được các tài liệu để có cái nhìn tổng quan về dự báo, đưa ra giải pháp xây dựng một mô hình kết hợp giữa mạng nơron FIR và ARIMA để nâng cao hiệu quả dự báo dựa vào việc giải thuật hồi qui bội để tìm ra được các trọng số kết hợp thay đổi theo thời gian. Bài báo này là một hướng nghiên cứu mở, có thể tiếp tục phát triển bằng việc sử dụng các hàm khác ngoài hàm bậc 1 đã nêu để nâng cao hiệu quả dự báo. Lời cảm ơn: Tác giả xin chân thành cám ơn tập thể cán bộ, nhân viên Viện CNTT, và đặc biệt là 02 TS Ngô Trọng Mại và Tôn Thiện Chiến đã giúp đỡ tận tình về mặt ý tưởng cũng như khi thực hiện chi tiết bài báo. TÀI LIỆU THAM KHẢO [1]. Đỗ Quang Giám, Vũ Thị Hân (2012), “Xây dựng mô hình Arima cho dự báo khách du lịch quốc tế đến Việt Nam”, Tạp chí Khoa học và Phát triển : Tập 10, số 2: 364 - 370 , Trường ĐH Nông Nghiệp Hà Nội [2]. Vũ Thị Gương ( 2012 ), “Kỹ thuật khai phá dữ liệu chuỗi thời gian áp dụng trong dự báo chứng khoán”, luận án Thạc sĩ khoa học CNTT, Học viện Bưu chính Viễn Thông, Hà nội [3]. Nguyễn Khắc Hiếu, 2014. "Mô hình ARIMA và dự báo lạm phát 6 tháng cuối năm 2014" . Tạp chí Kinh Tế và Dự Báo số 16, tháng 8-2014 . [4]. Phạm Văn Khánh (2008) , “Phân tích thống kê dự báo và mô phỏng một số chuỗi thời gian ”, Luận án Tiến sỹ Toán ứng dụng , ĐH QG Hà Nội, Hà Nội. [5]. Hà Gia Sơn, Một giải pháp phối hợp mô hình trong dự báo, Tạp chí Nghiên cứu Khoa học và Công nghệ quân sự số 39 tháng 10 năm 2015, tr 82-89. 0 5 10 15 20 25 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ketqua ket hop dong fir arima ket hop tinh 0 5 10 15 20 25 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 ketqua ket hop dong fir arima ket hop tinh Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 179 [6]. Hà Gia Sơn, Đỗ Văn Đỉnh, “Ứng dụng phương pháp hồi qui bội để kết hợp các mô hình dự báo”, Tạp chí Khoa học và Công nghệ số 13 tháng 8 năm 2017, tr 69-Trường ĐH Sao Đỏ (ISSN-2354-0575). [7]. C. Lee Giles, Steve Lawrence, A. C. Tsoi (2001)- “Noisy Time Series Prediction using a Recurrent Neural Network and Grammatical Inference” - Machine Learning, Volume 44, Number 1/2, July/August, pp. 161–183, [8]. Eric A Wan ( 2003), “Finite Impulse Response Neural Networks for Autoregressive Time Series Prediction”, Proceedings of the NATO Advanced Workshop on Time Series Prediction and Analysis, Sante Fe, NM. [9]. Eric A Wan (2004), “Finite Impulse Response Neural Networks With Application In Time Series Prediction” - a dissertation submitted to the department of electrical engineering and the committee on graduate studies of stanford university in partial fulfillment of the requirements for the degree of doctor of philosophy. [10]. Ho Joon Kim(2005), “Time Series Prediction Using an Interval Arithmetic FIR Network”, Neural Information Processing - Letters and Reviews Vol.8, No.3, September [11]. Luis Aburto, Richard Weber (2012), “Demand Forecast in a Supermarket using a Hybrid Intelligent System”, Department of Industrial Engineering, University of Chile, pp 143-151. [12]. Michael Falk , Frank Marohn (2012), “A First Course on Time Series Analysis - Examples with SAS”, by Chair of Statistics, University of Wurzburg. [13]. Michael K. Evans (2002), “Practical Bususiness Forecasting”, Blackwell Publishers Ltd, a Blackwell Publishing company. Bodmin, Cornwall. [14]. Marek Hlav’acek (2009), “Seasonal Time Series Modeling Via Neural Networks With Swithching Units”, PHD Czech Technical University Prague [15]. N.Gujarati (2004), “Basic Econometrics”, Fourth Edition-The McGraw−Hill Companies. ABSTRACT FIRST ARRIVAL AND ARIMA MODEL COMPLETES TO IMPROVE TIME EFFICIENCY FOR TIME. The article is about a solution to improve the efficiency of time series forecasting by combining FIR neural networks and ARIMA models, the weights will be varied over time. The results are based on the MAE criteria. The application is based on data on prices of five basic commodities sold in the Forex market (Foreign Exchange). The results show that this combination is more effective than conventional combination. Keywords: Model of forecast, ARIMA method, Combined method, Time series. Nhận bài ngày 16 tháng 8 năm 2017 Hoàn thiện ngày 26 tháng 11 năm 2017 Chấp nhận đăng ngày 28 tháng 11 năm 2017 Địa chỉ: 1 Viện CNTT- Viện KH&CN Quân sự; 2 Trường Đại học Công nghiệp Việt-Hung. * Email : Thanhnc80@gmail.com.

Các file đính kèm theo tài liệu này:

  • pdf17_1805_2151888.pdf