Tổng hợp hệ thống điều khiển bám thích nghi bền vững cho đối tượng phi tuyến bất định

Tài liệu Tổng hợp hệ thống điều khiển bám thích nghi bền vững cho đối tượng phi tuyến bất định: Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019 79 TỔNG HỢP HỆ THỐNG ĐIỀU KHIỂN BÁM THÍCH NGHI BỀN VỮNG CHO ĐỐI TƯỢNG PHI TUYẾN BẤT ĐỊNH Nguyễn Trung Kiên*, Lê Ngọc Quyết Tóm tắt: Bài báo giới thiệu phương pháp tổng hợp hệ điều khiển bám cho đối tượng phi tuyến bất định, dưới tác động của nhiễu ngoài. Khả năng thích nghi của hệ thống được thiết lập trên cơ sở nhận dạng các thành phần bất định, bao gồm cả các hàm phi tuyến bất định, sử dụng mạng nơ-ron RBF; khả năng hoạt động bền vững của hệ thống được thiết lập nhờ sử dụng điều khiển mode trượt. Từ khóa: Hệ thống bám; Chế độ trượt; Mạng nơ-ron. 1. MỞ ĐẦU Trong lĩnh vực quân sự, vấn đề xây dựng các hệ thống bám với độ chính xác cao trong điều kiện đối tượng điều khiển phi tuyến bất định, lại chịu sự tác động của nhiễu từ bên ngoài, đồng thời đầu vào của hệ thống thay đổi với độ phức tạp cao đang trở nên ngày càng cấp thiết. Mặc dù đã được các nhà khoa học quan tâm ...

10 trang | Chia sẻ: quangot475 | Lượt xem: 244 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Tổng hợp hệ thống điều khiển bám thích nghi bền vững cho đối tượng phi tuyến bất định, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019 79 TỔNG HỢP HỆ THỐNG ĐIỀU KHIỂN BÁM THÍCH NGHI BỀN VỮNG CHO ĐỐI TƯỢNG PHI TUYẾN BẤT ĐỊNH Nguyễn Trung Kiên*, Lê Ngọc Quyết Tóm tắt: Bài báo giới thiệu phương pháp tổng hợp hệ điều khiển bám cho đối tượng phi tuyến bất định, dưới tác động của nhiễu ngoài. Khả năng thích nghi của hệ thống được thiết lập trên cơ sở nhận dạng các thành phần bất định, bao gồm cả các hàm phi tuyến bất định, sử dụng mạng nơ-ron RBF; khả năng hoạt động bền vững của hệ thống được thiết lập nhờ sử dụng điều khiển mode trượt. Từ khóa: Hệ thống bám; Chế độ trượt; Mạng nơ-ron. 1. MỞ ĐẦU Trong lĩnh vực quân sự, vấn đề xây dựng các hệ thống bám với độ chính xác cao trong điều kiện đối tượng điều khiển phi tuyến bất định, lại chịu sự tác động của nhiễu từ bên ngoài, đồng thời đầu vào của hệ thống thay đổi với độ phức tạp cao đang trở nên ngày càng cấp thiết. Mặc dù đã được các nhà khoa học quan tâm giải quyết, song cho đến nay vẫn chưa được giải quyết thỏa đáng. Huang cùng các cộng sự đã sử dụng mạng nơ-ron xuyên tâm RBF (Radial Basic Function) để đánh giá (nhận dạng) các hàm phi tuyến bất định, kết quả nhận dạng được sử dụng trong bộ điều khiển trên cơ sở kết hợp với bộ điều khiển PID tối ưu [1]. Tuy nhiên, luật cập nhật được đề xuất ở đây còn có nhược điểm là tốc độ hiệu chỉnh các trọng số cho mạng RBF phụ thuộc vào sai số của hệ thống, trong lúc sai số này phụ thuộc vào rất nhiều yếu tố, đặc biệt là phụ thuộc vào sự biến đổi của đầu vào của hệ thống bám. Trong [2] đã đề xuất bộ điều khiển cho đối tượng SISO bậc hai chứa hàm phi tuyến bất định trong điều kiện không có nhiễu ngoài tác động. Tuy bộ điều khiển đảm bảo được ổn định, song chất lượng của hệ thống bị hạn chế do tốc độ hội tụ kém của quá trình nhận dạng hàm phi tuyến bất định với nhược điểm tượng tự như ở công trình [1] nêu trên. Các công trình [3], [4] đã đề xuất phương pháp tổng hợp hệ thống điều khiển cho đối tượng phi tuyến bất định trên cơ sở sử dụng mạng nơ-ron RBF với luật cập nhật các trọng số có ưu điểm nổi bật là tốc độ hiệu chỉnh các trọng số của mạng chỉ phụ thuộc vào tín hiệu sai lệch giữa đầu ra của đối tượng và đầu ra của mô hình nhận dạng và không phụ thuộc vào các yếu tố khác. Hơn nữa, trong [4] đã đề xuất phương pháp xây dựng hệ thống tự động bám cho các đối tượng mà động học của chúng gồm phần tuyến tính bậc hai và phần phi tuyến bất định dưới tác động của nhiễu ngoài, đảm bảo tính thích nghi bền vững và cận tối ưu theo tác động nhanh. Dưới đây, vấn đề tổng hợp hệ điều khiển bám thích nghi bền vững cho lớp đối tượng, mà động học của chúng bao gồm phần tuyến tính và phần phi tuyến bất định, được nghiên cứu giải quyết, nhằm đáp ứng yêu cầu bức thiết về xây dựng các hệ thống tự động bám chất lượng cao. 2. ĐẶT VẤN ĐỀ Giả sử động học của đối tượng điều khiển được mô tả bằng hệ phương trình: 80 (1) đ cao, các tham s dạng v đổi của các tham số n 3.1. Trong đó: Bài toán đ Xây d C Trong đó: NN1: kh MH: mô hình; N. T. Kiên, L. N. Quy ảm bảo bám sát đầu v à đi ấu trúc của hệ thống đ , , là tác đ (. ⎩ ⎪⎪ ⎨ ⎪⎪ ⎧ = ), ều khiển thích nghi l 3. ựng cấu trúc hệ thống ̇ = ̇ = ̇ = = , 1 (. ặt ra l ố GI ̇ ̇ ̇ , , ộng điều khiển ) là các hàm phi tuy ẢI B ĐTĐK: đ là các thành ph , à ph , ÀI TOÁN T là các th = ày ch ối nhận dạng 1; NN2: khối nhận dạng 2 ết, “Tổng hợp hệ thống điều khiển + ải xây dựng hệ thống thích nghi bền vững cho đối t 1, ậm h Hình 1. ào , ược thể hiện tr ối t ( am s | à các quá trình “c ơn nhi ư , | () và ỔNG HỢP HỆ ĐIỀU Sơ đ ợng điều khiển , ần c ố động học phần tuyến tín ≤ ến trơn, b , trong đó ều so với động học của đối t ồ cấu trúc hệ thống , ủa véc tơ tr U; tho ả m ên hình 1. ) + ấ ãn gi t đ ận dừng”, m . ( ạng thái ịnh () ả thiết c Kỹ thuật điều khiển , ; có th đ , là nhi KHI . ối t , ể l ơ b ượng ) = h; ễu ngoài à hàm có đ ản của lý thuyết nhận à theo đó, t ỂN BÁM ; phi tuy [ + , ượng điều khiển. & , ; Tự động hóa ến , là đ ộ phức tạp ốc độ thay bất định ] ; ầu ra. ượng .” (1) Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019 81 Để làm rõ ý tưởng chủ đạo của phương pháp tổng hợp hệ thống, ta xây dựng cấu trúc hệ thống trên cơ sở cách tiếp cận giải bài toán tổng hợp. Các hàm phi tuyến bất định (. ), (. ) là các hàm trơn, vì vậy để nhận dạng, đánh giá chúng, ta sử dụng mạng nơ-ron RBF. Kết quả đánh giá có thể đạt tới độ chính xác tùy ý. Việc nhận dạng các tham số , = 1, , phải được đồng thời cùng với việc nhận dạng các hàm phi tuyến bất định. Kết quả (. ), được sử dụng để bù trừ tác động của (. ), lên hệ thống. Tiếp theo, cần tổng hợp bộ điều khiển mode trượt trên cơ sở tín hiệu sai lệch của hệ thống và bộ tham số nhận dạng , = 1, , . 3.2. Xây dựng thuật toán nhận dạng Theo cấu trúc hệ thống trên hình 1, phân hệ nhận dạng được xây dựng trên cơ sở mô hình (MH) và khối hiệu chỉnh thích nghi (HCTN). Khối này thực hiện các thuật toán nhận dạng và thực hiện hiệu chỉnh các tham số của mô hình trên cơ sở tín hiệu sai lệch giữa véc tơ trạng thái của đối tượng và véc tơ trạng thái của mô hình. Để giải quyết được các yếu tố bất định, hệ thống sẽ sử dụng công cụ nhận dạng trên cơ sở mạng nơ-ron [5], [6], [7]. Kết quả nhận dạng được sử dụng trong luật điều khiển, vì vậy hệ thống trở nên thích nghi với các yếu tố bất định. Luật điều khiển còn được xây dựng trên cơ sở mode trượt, nhờ vậy hệ thống bám sát đầu vào với các tính chất thích nghi và bền vững. Phương trình (1) được viết lại dưới dạng: ̇ = + (. ) + (. ) + (2) Với: = 0 1 0 . . . 0 0 0 1 . . . 0 . . . . . . . . . . ; (. ) = [0 0 . . . (. )]; (. ) = [0 0 . . . (. )] ; = [0 0 . . . ] Các hàm (. ), (. ) là các hàm trơn, vì vậy có thể được xấp xỉ bằng mạng nơ- ron xuyên tâm RBF với độ chính xác tuỳ ý [6], [7]: ⎩ ⎪ ⎨ ⎪ ⎧ () = ∗ () + ∗ () = ∗ () + ∗ (3) Với: () là các hàm cơ sở, ∗ , = 1, , , ∗ , = 1, , là các trọng số tối ưu, đảm bảo với số lượng nơ-ron tương ứng là , , đầu ra của mạng thứ nhất cho sai lệch so với () là ∗, của mạng thứ hai cho sai lệch so với () Kỹ thuật điều khiển & Tự động hóa N. T. Kiên, L. N. Quyết, “Tổng hợp hệ thống điều khiển đối tượng phi tuyến bất định.” 82 là ∗. Các sai số ∗ và ∗ được chọn trước, tuỳ theo mức độ chính xác cần thiết. Trên mô hình MH, các mạng nơ-ron tương ứng được sử dụng với các đầu ra là () và (). ⎩ ⎪ ⎨ ⎪ ⎧ () =() () =() (4) Với , = 1, , ;, = 1, , là các trọng số được hiệu chỉnh (cập nhật) để → ∗ ; → ∗ . Phương trình động học của MH có dạng: ̇ = + (. ) + (. ) + (5) Với: = [ . . . ] ; (. ) = [0 0 . . . (. )] (. ) = [0 0 . . . (. )]; (. ) = [0 0 . . . (. )]. Khối hiệu chỉnh thích nghi HCTN có nhiệm vụ hiệu chỉnh tham số của mô hình sao cho: → ; → ∗ ; → ∗ ; → . Biến đổi phương trình (1) và (5) thu được phương trình mô tả sai lệch của véc tơ trạng thái của mô hình so với véc tơ trạng thái của đối tượng = − ̇ = + + (. ) + (. ) + (6) Trong đó: = − , = − (7) = 0 1 0 . . 0 0 0 1 . . 0 . . . . . . − − − . . − = 0 1 0 . . 0 0 0 1 . . 0 . . . . . . . . (8) (. ) = [0 0 . . (. )] (. ) = [0 0 . . (. )] = [0 0 . . ] (9) (. ) = (. ) − (. ) = ∗ () + ∗ −() (. ) =() + ∗ , = ∗ − (10) Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019 83 (. ) = (. ) − (. ) = ∗ () + ∗ − () (11) (. ) =() + ∗, = ∗ − (12) = − (13) Vấn đề đặt ra tiếp theo là phải xây dựng các luật hiệu chỉnh các tham số , = 1, , ; , = 1, , ; , = 1, , , và đảm bảo cho hệ (6) ổn định. Chọn hàm Lyapunov cho hệ (6) dưới dạng: = + + + + Trong đó là ma trận đối xứng xác định dương, kích thước ( × ). Định lý sau đây xác lập điều kiện đủ để hệ thống (6) ổn định. Định lý: Giả sử hệ thống động học (6) có ma trận luôn là Hurwitz. Hệ thống (6) sẽ ổn định thực tế (practical stability) nếu thoả mãn đồng thời các điều kiện sau đây: ̇ = −() , = 1, , (14) ̇ = −() , = 1, , (15) ̇ = − , = 1, , (16) ̇ = − (17) ‖‖ > ( ∗ + ∗)‖‖ () (18) Trong đó = [ . . . ] là ma trận dòng thứ của ma trận . Chứng minh: Lấy đạo hàm theo thời gian của hàm Lyapunov () dọc theo quỹ đạo của hệ (6), sau khi biến đổi, ta thu được: ̇ = + + 2 + 2(. ) +2(. ) + 2 +2 ̇ + 2 ̇ + 2̇ + 2̇ (19) Vì là ma trận đối xứng xác định dương, ma trận luôn là Hurwitz, nên ta có [8] Kỹ thuật điều khiển & Tự động hóa N. T. Kiên, L. N. Quyết, “Tổng hợp hệ thống điều khiển đối tượng phi tuyến bất định.” 84 [ + ] = − (20) Với là ma trận đối xứng xác định dương. Chú ý đến các biểu thức (7) ÷ (13) và (20), biểu thức (19) được viết lại dưới dạng: ̇ = − + 2 + 2() +2 ∗ + 2() + ∗ +2 + 2 ̇ + 2 ̇ + 2 ̇ + 2̇ (21) Từ (21) ta rút ra các điều kiện đủ để cho đạo hàm ̇ luôn có giá trị âm, tức là điều kiện đủ để hệ thống (6) ổn định: () + ̇ = 0 (22) () + ̇ = 0 (23) 2 + ̇ = 0 (24) + ̇ = 0 (25) − + ( ∗ + ∗) < 0 (26) Từ (22)  (25) ta dễ dàng thu được các luật hiệu chỉnh (14)  (17) trong định lý nêu trên. Đối với bất phương trình (26), ta có nhận xét sau: Ma trận trong thành phần thứ nhất là ma trận xác định dương và tác động điều khiển trong thành phần thứ ba thoả mãn điều kiện chặn || ≤ . Vì vậy ta có [8]: ()‖‖ ≤ ≤ ()‖‖ (27) Thành phần thứ ba trong vế trái của (26) thoả mãn bất đẳng thức: ‖ ∗‖ < ∗‖‖‖‖ (28) Từ (26), (27) và (28) ta có: − + ( ∗ + ∗) < −()‖‖ + ( ∗ + ∗)‖‖‖‖ < 0 (29) Bất phương trình (29) sẽ thoả mãn nếu thoả mãn bất đẳng thức (18) trong định lý trên. Nói cách khác từ (29) ta thu được bất đẳng thức (18). Định lý đã được chứng minh ■ Thế ; từ (10) và (12) vào (14) và (15). Vì ̇ ∗ = 0 và ̇ ∗ = 0 ta được: ̇ = (), = 1, , (30) Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019 85 ̇ = (), = 1, , (31) Thế từ (7) vào (16) và từ (13) vào (17) ta có: ̇ = (32) ̇ = (33) Vì , = 1, , và thoả mãn điều kiện “cận dừng” [10] ̇ ≈ 0; ̇ ≈ 0. Như vậy, ta đã tổng hợp được các luật hiệu chỉnh thích nghi đảm bảo cho quá trình nhận dạng hội tụ. 3.3. Tổng hợp luật điều khiển bám trên cơ sở kết quả nhận dạng, sử dụng mode trượt Để tiện cho việc tổng hợp luật điều khiển bám, ta biến đổi từ phương trình (1) và dựa vào cấu trúc hệ thống để có được phương trình động học trong không gian sai lệch. Đặt: = − = − = ̇, = 2, , (34) Từ (1) và (34) ta thu được: ⎩ ⎪ ⎨ ⎪ ⎧ ̇ = = .. ̇ = + − () + (. ) + (. ) + (35) Luật điều khiển trên cơ sở mode trượt cho (35) có sử dụng với các kênh bù có dạng: = + = 1 (. ) − − 1 (. ) (. ) + = + (36) Với là điều khiển tương đương và là thành phần điều khiển dạng relay [9]. Thế và từ (36) vào (35) ta có: ⎩ ⎪ ⎨ ⎪ ⎧ ̇ = ̇ = .. ̇ = + (. ) + (. ) − (. ) (. ) (ℎ + ℎ) (37) Trong đó: ℎ = () − ; ℎ = (. ) + (38) Kỹ thuật điều khiển & Tự động hóa N. T. Kiên, L. N. Quyết, “Tổng hợp hệ thống điều khiển đối tượng phi tuyến bất định.” 86 Phương trình cuối của (37), nếu chú ý đến (7), (11) sẽ có dạng: ̇ = ∑ ( + ) + [(. ) + (. )] − (. )[ℎ + ℎ] (.) Từ đây ta có: ̇ = + (. ) + + (. ) − (. )[ℎ + ℎ] 1 (. ) (39) Do quá trình nhận dạng hội tụ, nên ta có → 0, = 1, , ; → ∗ với ∗ được chọn trước nhỏ bao nhiêu tùy ý. Vì vậy các thành phần liên quan đến và (. ) có giá trị rất nhỏ, thậm chí tiến tới không. Đặt như sau: = + (. ) − (. )[ℎ + ℎ] 1 (. ) (40) Với là giá trị rất bé. Từ (37), (39) và (40) viết lại phương trình của hệ thống trong không gian sai lệch: ⎩ ⎪ ⎨ ⎪ ⎧ ̇ = ̇ = .. ̇ = + (. ) + (41) Trong đó là giá trị đánh giá của ; (. ) là giá trị đánh giá của (. ) do kết quả nhận dạng mang lại, được xem như nhiễu do sai số nhận dạng gây ra. Như vậy, trên cơ sở các đánh giá do nhận dạng mang lại, ta sử dụng (41) để tổng hợp luật điều khiển theo mode trượt. Mặt trượt S được chọn dưới dạng: = ∑ + (42) Trong đó, các hệ số được chọn sao cho đa thức đặc tính + ∑ là đa thức Hurwitz. Thành phần điều khiển tương đương được tổng hợp sao cho ̇ = 0 trong điều kiện chưa tính đến nhiễu . Thành phần được chọn sao cho đảm bảo điều kiện đủ cho sự tồn tại chế độ trượt trong sự tồn tại của nhiễu . Lấy đạo hàm theo thời gian dọc theo quỹ đạo của hệ (41) ta được: ̇ = + + (. ) + + (43) Chọn hàm Lyapunov dạng: = 1 2 (44) Điều kiện đủ để tồn tại chế độ trượt của hệ (41) trên mặt S là: ̇ = . ̇ < 0 (45) Như vậy, cần tổng hợp và sao cho thoả mãn bất phương trình (45). Từ (43) ta có thể chọn: Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san TĐH, 04 - 2019 87 = 1 (. ) +( + ) (46) = − 1 (. ) (47) Với: = || Thế và từ (46), (47) vào (45), ta được: ̇ = . ̇ = −. . < 0 (48) Rõ ràng luật điều khiển trượt = + với các thành phần (46), (47) đảm bảo cho hệ (41) chế độ trượt trên mặt trượt . Vì mặt trượt thoả mãn điều kiện Hurwitz nên hệ thống trượt trên mặt và tiến về gốc toạ độ. Điều đó có ý nghĩa là hệ thống tự động bám với sai số tĩnh → 0 , = 1,2, , . 4. KẾT LUẬN Bài báo đã tổng hợp được các luật hiệu chỉnh thích nghi (30), (31), (32), (33) cho mô hình MH có sử dụng mạng nơ-ron RBF. Nhờ đó, quá trình nhận dạng các thành phần bất định được hội tụ. Phương pháp đề xuất trên đây cho phép tổng hợp hệ thống điều khiển bám thích nghi bền vững cho lớp đối tượng phi tuyến bất định, trong đó, đối tượng điều khiển có phần tuyến tính bất định, phần phi tuyến cũng bất định và chịu tác động của nhiễu bên ngoài. Kết quả nhận dạng được sử dụng để tổng hợp luật điều khiển trượt, đảm bảo đầu ra của hệ thống bám sát đầu vào với các thành phần của véc tơ sai lệch tiến về không → 0 , = 1,2, , . Hệ thống vừa có khả năng thích nghi vừa có tính bền vững và có khả năng kháng nhiễu cao. TÀI LIỆU THAM KHẢO [1]. Huang S. N., Tan K. K., Lee T. H (2011), “Combined PID/adaptive controller for a class of nonlinear systems”, Automatica No.37, pp. 611-618. [2]. Liu J. (2013), “Radial Basic Function (RBF) Neural Network Control For Mechanical Systems: Design, Analysis and Matlab Simulation”, Beijing and Springer-Verlag Berlin Heidelberg. [3]. Cao Tiến Huỳnh, Nguyễn Vũ, Nguyễn Trung Kiên, Ngô Trí Nam Cường (2012), “Về một phương pháp tổng hợp hệ điều khiển thích nghi cho một lớp đối tượng phi tuyến dưới tác động của nhiễu bên ngoài”, Tạp chí Nghiên cứu khoa học và công nghệ quân sự, Số 17, trang 6-15. [4]. Nguyễn Trung Kiên (2014), “Xây dựng phương pháp tổng hợp hệ thống điều khiển các đài quan sát tự động định vị các đối tượng di động từ xa”, Luận án Tiến sĩ kỹ thuật, Viện KH-CN quân sự. [5]. Hornik K. , Stinchcombe M. & White H. (1989), “Multillayer feedforward networks are universal approximator”, Neural Networks, pp. 359-365. [6]. Gomn J.B. , Yu D.L. (2000), “Selecting radial basic function networks centers with recursive orthogonal least squares training”, IEEE Trans. on Neural Networks, Vol. 11, Issue 2, pp. 306-314. [7]. Neil E. Cotter (1990), “The Stone-Weiestrass Theorem and its Application to Neural networks”, IEEE Trans. on Neural Networks. Vol. 1, No. 4, pp. 290-295. Kỹ thuật điều khiển & Tự động hóa N. T. Kiên, L. N. Quyết, “Tổng hợp hệ thống điều khiển đối tượng phi tuyến bất định.” 88 [8]. Ortega J.M. (1987), “Matrix Theory”, Plenum Press, Newyork. [9]. Christopher E., Sarah K. (1998), “Sliding Mode Control: Theory and Applications”, Taylor & Francis, UK. [10]. Gangtao (2003), “Adaptive Control Design and Analysis”, John Wiley & Son, Inc Publication. ABSTRACT DEVELOPMENT OF METHOD TO SYNTHESIZE AN ADAPTIVE AND ROBUST CONTROLLER FOR AUTO TRACKING SYSTEMS This paper presents new results used to synthesize the control system based on a combination of adaptive and robust control, using neural network and sliding mode control together for autotracking systems with large parameter uncertainties to guarantee very high control quality such as insensitivity disturbances, high accuracy and robustness. Keywords: Autotracking systems; Sliding mode; Neural network. Nhận bài ngày 08 tháng 01 năm 2019 Hoàn thiện ngày 06 tháng 3 năm 2019 Chấp nhận đăng ngày 15 tháng 3 năm 2019 Địa chỉ: Viện Tự động hóa KTQS. * Email: kiennt67@gmail.com.

Các file đính kèm theo tài liệu này:

10_quyet_3656_2150146.pdf