Luận văn Dụng cụ đo và cảm biến

Tài liệu Luận văn Dụng cụ đo và cảm biến: 1 Luận văn : Dụng cụ đo và cảm biến BẢNG KÝ HIỆU A= [aij ] : Ma trận n x m chiều. AT : Ma trận chuyển vị của A. A-1 : Ma trận nghịch đảo của A. Rn : Không gian thực n chiều. g(.) : Hàm quan hệ phi tuyến vào ra. f-1 : Hàm ngược của hàm f. W= [wik] : Ma trận trọng số liên kết n x m chiều. 1. BẢNG CHỮ VIẾT TẮT VÀ MỘT SỐ THUẬT NGỮ Adaline : Adaptive Linear Element- Phần tử nơron tuyến tính thích nghi, tên loại nơron do Windrow đề xuất năm 1960. ART : Adaptive Resonance Theory- Thuyết cộng hưởng thích nghi. Một loại mạng được xây dựng theo lý thuyết này. BAM : Bidirection Associative Memory- Một loại mạng do Kosko đề xuất năm 1988. BP : Backpropagation - Thuật học lan truyền ngược. CAM : Content Addressable Memory- Bộ nhớ nội dung được địa chỉ hóa. 2 LMS : Least Mean Square - Tên một thuật học (trung bình bình phương nhỏ nhất). LVQ : Learning Vector Quantization - Thuật học lượng hóa véctơ. MIMO : Multi Input Multi Output - Hệ nhiều đầu vào ...

97 trang | Chia sẻ: hunglv | Lượt xem: 1163 | Lượt tải: 0

Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Dụng cụ đo và cảm biến, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

1 Luận văn : Dụng cụ đo và cảm biến BẢNG KÝ HIỆU A= [aij ] : Ma trận n x m chiều. AT : Ma trận chuyển vị của A. A-1 : Ma trận nghịch đảo của A. Rn : Không gian thực n chiều. g(.) : Hàm quan hệ phi tuyến vào ra. f-1 : Hàm ngược của hàm f. W= [wik] : Ma trận trọng số liên kết n x m chiều. 1. BẢNG CHỮ VIẾT TẮT VÀ MỘT SỐ THUẬT NGỮ Adaline : Adaptive Linear Element- Phần tử nơron tuyến tính thích nghi, tên loại nơron do Windrow đề xuất năm 1960. ART : Adaptive Resonance Theory- Thuyết cộng hưởng thích nghi. Một loại mạng được xây dựng theo lý thuyết này. BAM : Bidirection Associative Memory- Một loại mạng do Kosko đề xuất năm 1988. BP : Backpropagation - Thuật học lan truyền ngược. CAM : Content Addressable Memory- Bộ nhớ nội dung được địa chỉ hóa. 2 LMS : Least Mean Square - Tên một thuật học (trung bình bình phương nhỏ nhất). LVQ : Learning Vector Quantization - Thuật học lượng hóa véctơ. MIMO : Multi Input Multi Output - Hệ nhiều đầu vào nhiều đầu ra. MNN : Artificial Neural Networks - Mạng nơron nhân tạo SISO : Single Input Single Output - Hệ một đầu vào một đầu ra. RBF : Radial Basis Functions - Tên một loại mạng do Moody và Darken đề xuất năm 1989. 3 MỞ ĐẦU Mô phỏng sinh học đã tạo ra những thành tựu khoa học kỹ thuật to lớn cho cuộc sống và công cuộc chinh phục thế giới tự nhiên của loài người. Mô phỏng mạng nơron sinh học là một trong những lĩnh vực đang được phát triển mạnh mẽ để tạo ra những hệ thống thông minh có những khả năng như ghi nhớ kinh nghiệm quá khứ, nhận dạng, điều khiển, ra quyết định, dự đoán...tương tự như bộ não người. Việc nghiên cứu và phát triển lý thuyết mạng nơron nhân tạo đã được ứng dụng trong nhiều lĩnh vực như đo lường, điều khiển, công nghệ rôbôt, truyền thông, giao thông vận tải, hàng không.v.v... Mạng nơron với những ưu điểm vượt trội so với các hệ thống tính toán truyền thống như: cho phép xấp xỉ những ánh xạ phi tuyến tùy ý; là hệ thống xử lý song song làm tăng tốc độ tính toán cho phép đáp ứng khả năng tính toán thời gian thực và chính xác; là hệ học và thích nghi, khi mạng được huấn luyện từ các dữ liệu quá khứ, đồng thời có khả năng khái quát hóa khi dữ liệu vào bị thiếu hoặc không đầy đủ, phù hợp với các hệ thống nhận dạng, chuẩn đoán kỹ thuật... Với những ưu điểm trên việc ứng dụng mạng nơron để chế tạo các cảm biến thông minh với độ chính xác cao là điều hoàn toàn cần thiết, có khả năng thúc đẩy sự phát triển của kỹ thuật công nghệ nói chung và lĩnh vực đo lường nói riêng. Nội dung chủ yếu của luận văn là tập trung nghiên cứu ứng dụng mạng nơron cho khắc độ dụng cụ đo và cảm biến thông minh. Luận văn bao gồm năm chương, trong đó chương 1 là phần tổng quan về các phương pháp khắc độ thiết bị đo bao gồm các phương pháp khắc độ cho dụng cụ đo tương tự, dụng cụ đo có sử dụng vi xử lý hoặc máy vi tính và các chuyển đổi đo lường sơ cấp. Chương này cũng nêu ra các hướng ứng dụng mạng nơron cho việc xử lý số liệu đo và hiệu chỉnh đặc tính thang đo của cảm biến. 4 Chương 2 trình bày phần lý thuyết cơ sở của mạng nơron cho việc nghiên cứu ứng dụng trong việc xử lý số liệu nhằm giảm sai số ngẫu nhiên, khắc độ tự động đặc tính và hiệu chỉnh sai số hệ thống của cảm biến. Ở chương 3, tác giả đã tập trung vào việc nghiên cứu ứng dụng mạng nơron nhân tạo để xử lý số liệu đo ngẫu nhiên nhằm giảm sai số ngẫu nhiên, từ các giá trị lấy mẫu đã được xử lý để giảm sai số ngẫu nhiên bằng mạng nơron chúng tôi đề xuất sử dụng hàm nội suy Lagrange để khắc độ tự động đường đặc tính của cảm biến thông minh. Đồng thời chương này cũng đã nghiên cứu việc ứng dụng mạng nơron để khắc độ tự động đặc tính của cảm biến đảm bảo độ chính xác cao. Chương 4 nghiên cứu ứng dụng mạng nơron để hiệu chỉnh đặc tính thang đo của cảm biến đảm bảo giới hạn sai số cho phép. Chương 5 đánh giá kết quả đạt được và hướng nghiên cứu tiếp theo dựa trên những kết quả của đề tài. 5 Chương 1 TỔNG QUAN CÁC PHƯƠNG PHÁP KHẮC ĐỘ CỦA DỤNG CỤ ĐO VÀ CẢM BIẾN 1.1 Phương pháp khắc độ dụng cụ đo tương tự Dụng cụ đo tương tự là loại dụng cụ đo mà số chỉ của nó là đại lượng liên tục tỉ lệ với đại lượng đo liên tục. Trong dụng cụ đo tương tự người ta thường dùng các chỉ thị cơ điện, trong đó tín hiệu vào là dòng điện còn tín hiệu ra là góc quay của phần động (kim chỉ) hoặc là di chuyển của bút ghi trên giấy (dụng cụ tự ghi). Các cơ cấu chỉ thị này thường dùng trong máy đo các đại lượng như dòng điện, điện áp, công suất, tần số, góc pha, điện trở.v.v . Những dụng cụ này chính là dụng cụ đo chuyển đổi thẳng. Tức là thực hiện việc biến năng lượng điện từ thành năng lượng cơ học làm quay phần động một góc α so với phần tĩnh. Như vậy α = F(x), với x là đại lượng điện ( dòng hay áp hoặc là tích của hai dòng điện) Đối với chỉ thị cơ điện ta có phương trình đặc tính thang đo αα d dw D e1= , trong đó D là mômen cản riêng và We là năng lượng điện từ trường. Từ phương trình này ta sẽ biết được đặc tính của thang đo và tính chất của cơ cấu chỉ thị. Do trong cơ cấu chỉ thị cơ điện tồn tại nhiều mômen như mômen ma sát, mômen cản dịu, mômen động lượng nên để xác định dạng thang đo của cơ cấu chỉ thị thường sử dụng phương pháp đồ thị. Bằng thực nghiệm ta xây dựng các đường cong mômen quay Md = f(α) với các giá trị X khác nhau. Ví dụ với cơ cấu chỉ thị điện từ ta xây dựng các đường cong mômen quay 1, 2, 3, 4 với các giá trị X tương ứng bằng 40, 60, 80 và 100% Xn (Xn- trị số dòng điện định mức làm kim lệch toàn thang). Trong trường hợp ở đồ thị hình 1.1 Xn =In=50mA. Các đường cong mômen quay Mq cắt đường mômen cản Mc tại các điểm A, B, C, D. Từ giao điểm A, B, C, D ta có các vị trí cân bằng α = 30°, 50°, 70°, 90° tương ứng với các giá trị X=20, 30, 40, 50 mA. Như vậy ta có thang đo của cơ cấu chỉ thị điện từ theo đơn vị của đại lượng X đầu vào. 6 Tuỳ thuộc vào phương trình đặc tính thang đo mà thang đo có thể là tuyến tính (ví dụ : cơ cấu chỉ thị từ điện) hoặc phi tuyến (ví dụ : cơ cấu chỉ thị điện từ , điện động, tĩnh điện). Nếu thang đo phi tuyến ta thường để thang đo đạt được tương đối đều. Đối với cơ cấu chỉ thị từ điện ta có phương trình đặc tính thang đo là α= BswI D 1 = K.I [TL3] Trong đó B- Độ từ cảm của nam châm vĩnh cửu s- Diện tích khung dây w- số vòng dây α- góc lệch của khung dây so với vị trí ban đầu Góc lệch α tỉ lệ thuận với dòng điện I nên đặc tính của thang đo đều. Cơ cấu chỉ thị điện từ có phương trình đặc tính là α= 2 2 1 I d dL D α [TL3]. Góc quay tỉ lệ với bình phương dòng điện do đó thang đo không đều. Ngoài Mq α 0° 30° 50° 70° 90° X=40%Xn (I= 20 mA) X=60%Xn (I= 30 mA) X=80%Xn (I= 40 mA) X=100%Xn (I= 50 mA) 4 3 2 1 0 20 30 40 50 Hình 1.1 : Xác định thang đo bằng phương pháp đồ thị X(mA) 7 ra đặc tính thang đo lại còn phụ thuộc vào tỉ số αd dL là một đại lượng phi tuyến. Để cho đặc tính thang đo đều cần phải tính toán sao cho khi góc lệch α thay đổi thì tỉ số αd dL thay đổi theo quy luật tỉ lệ nghịch với dòng điện. Như vậy đường cong tổng hợp sẽ là đường tuyến tính với một độ chính xác nhất định. Cơ cấu chỉ thị điện động có phương trình đặc tính thang đo đối với trường hợp dòng một chiều I1 và I2 : α= 2112 IId dM α [TL3]. Trong trường hợp dòng xoay chiều ta có α= 2112 cos II Dd dM ϕ α . Như vậy góc lệch α phụ thuộc vào tích I1I2 nên thang đo không đều. Có thể thay đổi vị trí của các cuộn dây để thay đổi tỉ số αd dM 12 theo hàm ngược với I1I2 nhằm đạt được thang đo đều (thường từ 20%÷100% thang đo có thể chia đều còn 20% đầu thang đo chia không đều) Đối với Lôgômét điện động ta có phương trình đặc tính thang đo α= ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ ),cos( ),cos( 22 11 III IIIF [TL3]. Khi cos(I,I1)=cos(I,I2)=1 tức là dòng điện chạy qua α I, L I2αd dL Đặc tính thang đo ~ αd dLI 2 Hình 1.2 : Đặc tính thang đo với αd dL đã điều chỉnh 8 cuộn động và cuộn tĩnh đồng pha thì α = ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ 2 1 I IF . Như vậy góc lệch α tỉ lệ với tỉ số hai dòng điện. Cơ cấu chỉ thị sắt điện động có phương trình đặc tính thang đo : α=k1s2 w2I1I2cos(I1,I2), góc lệch α tỉ lệ với tích hai dòng điện. Đối với cơ cấu chỉ thị tĩnh điện ta có phương trình đặc tính thang đo α= αd dCU 2 2 [TL3]. Như vậy góc lệch α tỉ lệ với bình phương điện áp U. Đặc tính thang đo không đều (bậc hai) và phụ thuộc vào tỉ số αd dC là một đại lượng phi tuyến. Trong thực tế để cho đặc tính thang đo đều cần phải tính toán sao cho khi góc lệch α thay đổi thì tỉ số αd dC thay đổi tỉ lệ nghịch với điện áp và đường cong tổng hợp sẽ là đường tuyến tính với một độ chính xác nhất định. Giống như trường hợp cơ cấu chỉ thị điện từ. Đối với cơ cấu chỉ thị tự ghi đầu vào thường là dòng điện biến thiên theo thời gian i(t) và đầu ra là đường quan hệ α(t). Đường ghi trên băng giấy là sự phối hợp giữa hai chuyển động y=α=f(i) và x=Kt. Theo cách ghi có thể phân loại cơ cấu tự ghi làm ba loại : loại thứ nhất là ghi các đường cong liên tục; loại thứ hai là ghi các đường cong rời rạc; loại thứ ba là in số lên băng giấy. Nhận xét : trong dụng cụ đo tương tự chỉ thị kim thì sai số phi tuyến được đưa lên thang đo mà không nhất thiết phải tuyến tính hóa đặc tính phi tuyến như dụng cụ đo số. 1.2 Phương pháp khắc độ dụng cụ đo có sử dụng vi xử lý hoặc máy vi tính [TL3] Việc sử dụng vi xử lý trong lĩnh vực đo lường mở ra những hướng phát triển và mang lại nhiều ưu điểm cho dụng cụ đo và hệ thống thông tin đo lường như : 9 - Có thể ghép nối thiết bị đo với bàn phím cho phép nhập thông tin bằng bàn phím số hoặc đặt trước giá trị đo lường hay kiểm tra của một thông số nào đó. - Có thể ghép nối với màn hình để đọc kết quả và sai số - Có thể gia công kết quả đo theo các thuật toán đã định sẵn và đưa ra màn hình. - Có thể nối với máy in để in kết quả đo hay tự động vẽ lại các đường cong sau khi đã gia công kết quả bằng phép xây dựng đường cong thực nghiệm. - Thay đổi toạ độ bằng cách đưa thêm vào các hệ số nhân thích hợp. - Tiến hành tính toán khi thực hiện phép đo gián tiếp hay hợp bộ hoặc đo lường thống kê. - Hiệu chỉnh được sai số của phép đo - Bù các kết quả đo bị sai lệch do ảnh hưởng của sự biến động các thông số như nhiệt độ, độ ẩm, tần số…. - Điều khiển các khâu của dụng cụ đo cho phù hợp với đại lượng đo ví dụ : tự động chọn thang đo. - Mã hoá các tín hiệu đo - Ghép nối với kênh liên lạc để truyền số liệu đi xa. - Có thể ghép nối với bộ nhớ để lưu giữ số liệu của kết quả đo hay các giá trị tức thời của tín hiệu đo. Ngoài ra dụng cụ đo có sử dụng vi xử lý hoặc máy vi tính còn có khả năng tự động khắc độ. Quá trình tự động khắc độ như sau : - Đầu tiên người ta đo các giá trị của tín hiệu chuẩn, ghi vào bộ nhớ, sau đó đo các giá trị của đại lượng cần đo và bằng các công cụ toán học (dưới dạng thuật toán) có thể so sánh, gia công kết quả đo và loại trừ các sai số. 10 Ví dụ : Trong một Vônmét thực hiện theo phương pháp này việc khắc độ được thực hiện trước mỗi lần đo (ở chế độ đồng bộ trong). Việc bù sai số do sự lệch không của bộ khuếch đại (sự trôi điểm không chẳng hạn) sẽ được thực hiện bằng cách đo mức không (mức đất) của tín hiệu, sau đó bắt đầu đo điện áp chuẩn cố định từ nguồn mẫu (ví dụ như pin mẫu). Sử dụng vi xử lý hoặc máy vi tính có thể thay thế cho một loạt các thao tác mà trong dụng cụ tương tự không thực hiện được ví dụ như : phép nhân, phép tuyến tính hoá, điều khiển quá trình đo, điều khiển sự làm việc của các thiết bị vào ra v.v... 1.3 Phương pháp khắc độ các chuyển đổi đo lường sơ cấp 1.3.1 Chuyển đổi đo lường so cấp Chuyển đổi đo lường là thiết bị thực hiện một quan hệ hàm đơn trị giữa hai đại lượng vật lý với một độ chính xác nhất định. Như vậy chuyển đổi đo lường làm nhiệm vụ biến đổi từ đại lượng vật lý này sang đại lượng vật lý khác. Mối quan hệ hàm có thể là tuyến tính hay phi tuyến. Tuy nhiên trong kỹ thuật đo lường người ta cố gắng tạo ra các chuyển đổi tuyến tính để nâng cao độ chính xác của phép đo. Chuyển đổi đo lường sơ cấp là các chuyển đổi đo lường mà đại lượng vào là đại lượng không điện và đại lượng ra của nó là đại lượng điện. Phương trình đặc tính của chuyển đổi Y=f(X) Trong đó X-là đại lượng không điện cần đo Y-đại lượng điện sau chuyển đổi Hàm đặc tính của chuyển đổi là một hàm đồng biến hoặc nghịch biến. Khi chuyển đổi sơ cấp được đặt trong một vỏ hộp có kích thước và hình dáng phù hợp với vị trí điểm đo hoặc có khi tích hợp với mạch đo để tạo thành một dụng cụ được gọi là đầu đo, bộ cảm biến hoặc là sensor. Để có được đặc tính của chuyển đổi sơ cấp người ta thường làm thực nghiệm để tìm ra mối quan hệ giữa X và Y. Mối quan hệ này thường là phi 11 tuyến, nhưng để nâng cao độ chính xác của thiết bị đo người ta tìm cách tuyến tính hoá nó bằng các mạch điện tử hay dùng các thuật toán khi gia công số liệu đo bằng máy tính hoặc vi xử lý. Trong thực tế tín hiệu ra Y của chuyển đổi không những phụ thuộc vào X mà còn phụ thuộc vào điều kiện bên ngoài Z : Y=f(X,Z) Đặc tính của chuyển đổi phải là hàm đơn trị, nghĩa là với đường cong hồi phục của chuyển đổi ứng với một giá trị X ta chỉ nhận được một giá trị Y. Đường cong của chuyển đổi phải ổn định, nghĩa là không thay đổi theo thời gian. Và tín hiệu ra của chuyển đổi phải tiện cho việc ghép nối vào dụng cụ đo, hệ thống đo và máy tính. Đặc tính của chuyển đổi có thể là hàm tuyến tính hoặc phi tuyến, chẳng hạn như hàm lôga-rít, hàm đa thức, hàm mũ. Đặc tính tuyến tính được mô tả bởi biểu thức :Y=a+bx Đặc tính lôga-rít : Y=a+b.lnx Đặc tính hàm mũ : Y=a.ekx Đặc tính hàm đa thức : Y=ao + a1.x + a2x2 +...+ anxn Đặc tính quan trọng của chuyển đổi là sai số. - Sai số cơ bản của chuyển đổi là sai số gây ra do nguyên lý của chuyển đổi, sự không hoàn thiện của cấu trúc, sự yếu kém của công nghệ chế tạo. - Sai số phụ là sai số gây ra do biến động của điều kiện bên ngoài khác với điều kiện tiêu chuẩn. Sai số tương đối quy đổi: %100max N n X XΔ=γ , với XN là giá trị cực đại của thang đo, cần phải nhỏ hơn hoặc bằng cấp chính xác. Sai số tuyệt đối được tính bằng hiệu của giá trị đo được với giá trị thực. Ví dụ một sensor đo khoảng cách tuyến tính lý tưởng sẽ tạo ra 1 mV trên 1mm dịch chuyển. Tuy nhiên trong thực tế một dịch chuyển 10 mm tạo ra 10.5 mV, từ 10.5 mV tính ngược lại (1mm trên 1 mV) ta được 10.5 mm, lớn hơn 0.5 mm so với thực tế. 12 0.5mm này là sai số tuyệt đối và do đó trong khoảng 10 mm sai số tương đối quy đổi của sensor là 0.5mm/10 mm x 100% =5%. Để cảm biến đạt cấp chính xác nhất định thì đường cong đặc tính thực tế phải nằm trong hai đường giới hạn sai số cho phép như biểu diễn trên hình 1.3 và hình 1.4 . Các đường giới hạn sai số cho phép lệch với đường đặc tính lý tưởng một khoảng Δ± và đường cong thực tế lệch với đường đặc tính lý tưởng một khoảng δ± , trong đó Δ≤δ . 100% x Y 100% y y’ z z’ x x’ -δ +Δ -Δ Đường đặc tính thực tế Đường đặc tính lý tưởng Đường giới hạn YFS Hình 1.3 : Đường cong đặc tính của cảm biến Δ− Δ+ -δ Đường giới hạn phải Đường giới hạn trái Đường hiệu chuẩn Đường đặc tính thực tế Hình 1.4 : Đường giới hạn độ chính xác x Y 13 Có nhiều phương pháp để tuyến tính hoá đường đặc tính của cảm biến. Đối với đặc tính có thể tuyến tính bằng một đường thẳng người ta thường dùng các phương pháp sau : + Phương pháp dùng điểm đầu và điểm cuối của đường đặc tính : Ta xác định các giá trị đầu ra của cảm biến tại giá trị nhỏ nhất và lớn nhất của đầu vào và vẽ đường thẳng qua hai điểm này (đường 1 trên hình 1.5). Gần các điểm đầu và điểm cuối thì sai số nhỏ và sai số lớn nhất rơi vào khoảng giữa của đường đặc tính. + Phương pháp xấp xỉ bình phương cực tiểu : Đo vài giá trị đầu ra Y (n giá trị) tương ứng với các giá trị đầu vào x trong toàn thang đo. Sử dụng công thức sau để xác định các giá trị a và b của đường thẳng Y=a+b.x (đường 2 trên hình 1.5) ( )22 2 ∑∑ ∑ ∑∑∑ − −= xxn xYxxY a ( )22 ∑∑ ∑∑∑ − −= xxn YxxYn b Trong đó ∑ là tổng của n số hạng. Trong một vài ứng dụng thì độ chính xác cao nhất cần phải đạt được ở trong một khoảng nhỏ nhất định. Ví dụ nhiệt kế y tế phải có độ chính xác cao Điểm đầu và điểm cuối L2 L1 100% x Y 100% 0 Hình1.5 : Đường thẳng xấp xỉ đường cong phi tuyến c 2 1 3 14 trong vùng nhiệt độ sốt của cơ thể từ 37 đến 38°C. Nó có thể kém chính xác ở ngoài khoảng nhiệt độ đó. Cảm biến được hiệu chuẩn ở vùng yêu cầu độ chính xác cao nhất . Do đó đường xấp xỉ có thể được vẽ qua điểm hiệu chuẩn c (đường 3 trên hình 1.5). Sai số nhỏ ở gần điểm hiệu chuẩn và tăng lên về phía hai đầu của thang đo. Trong phương pháp này thì đường thẳng thường được xác định như là tiếp tuyến của đường đặc tính tại điểm hiệu chuẩn. + Phương pháp dùng đường thẳng độc lập : đường thẳng xấp xỉ độc lập là đường thẳng nằm giữa hai đường song song sát nhau và bao toàn bộ các giá trị đầu ra trên đường đặc tính thực tế như hình 1.6. Đặc tính động của chuyển đổi là khi cho tín hiệu đo vào chuyển đổi thường xuất hiện quá trình quá độ. Quá trình này có thể nhanh hay chậm tuỳ thuộc vào dạng chuyển đổi. Đặc tính này được gọi là độ tác động nhanh. Độ tác động nhanh hay chậm tức là thời gian trễ nhỏ hay lớn của đáp ứng tín hiệu ra so với sự thay đổi của tín hiệu vào. Phương trình cơ bản của cảm biến có dạng : Y=f(x, a, b, c…) Trong đó x là đại lượng đo hay còn gọi là đại lượng chủ, các đại lượng a, b, c… được gọi là các yếu tố ảnh hưởng cần được loại bỏ. Yêu cầu của cảm biến là tạo được đặc tính Y=f(x) và quan hệ này được lặp lại với một giá trị Hình1.6 : Đường thẳng xấp xỉ độc lập Đường thẳng xấp xỉ -δ 100% x Y 100% 0 +δ c 15 chính xác để từ Y ta có thể suy ra được x với một sai số nhỏ hơn yêu cầu. Trong cảm biến thông minh người ta phải sử dụng triệt để khả năng xử lý kết quả đo của các bộ vi xử lý hay vi tính đơn phiến để nâng cao đặc tính kỹ thuật của các cảm biến. 1.3.2 Ứng dụng vi xử lý trong xử lý số liệu đo của cảm biến [TL3] +Xử lý khắc độ Yêu cầu cơ bản nhất đối với chuyển đổi là tạo được đặc tính Y=f(x) với Yi=KiXi. Động tác khắc độ hay chuẩn độ là xác định các Ki với sai số của nó là max i i K KΔ ≤ iK γ Trong trường hợp cảm biến bị nhiều yếu tố ngẫu nhiên tác động thì Ki được xác định bằng phương pháp thống kê. m K K m j ij i ∑ == 1 iK này được vi xử lý lưu giữ làm hệ số biến đổi tại điểm Xi của cảm biến và Xi= i i K Y , sai số tuyệt đối ngẫu nhiên của hệ số Ki được tính với giả thiết phân bố xác suất của nó là phân bố Student. * iXsti kK δ=Δ với xác suất P iKΔ sai số tuyệt đối của Ki có tính ngẫu nhiên kst - hệ số tra ở bảng Student * iX δ = )1( )( 2 − − nn Xx ii là độ lệch bình quân phương Bộ hệ số Ki và iKΔ có thể được tính toán và ghi trong bộ nhớ của vi xử lý. 16 +Xử lý tuyến tính hoá từng đoạn Giá trị đo X tương ứng với giá trị Yx .Kiểm tra giá trị của Yx nằm trong khoảng Yi<Yx<Yi+1 tương ứng với Xi<X<Xi+1 Thực hiện phép nội suy tuyến tính X=Xi+ )( 1 1 ix ii ii YY YY XX −− − + + Ghi lại kết quả X cùng với Ki và i i K K K i Δ=γ +Xử lý thống kê Khi bản thân đối tượng đo biến đổi hoặc chịu tác động của nhiễu, gây ra sai số ngẫu nhiên. Cảm biến thông minh có thể xử lý thống kê tức là đo với tốc độ nhanh rồi tính giá trị trung bình, tính sai số thống kê của kết quả đo, lưu giữ và truyền lên máy tính cấp trên. Giá trị trung bình : m X X m i i∑ == 1 Sai số là : *Xstkx δ±=Δ Kết quả đo sẽ nằm giữa XXXXX o Δ+<<Δ− 1.3.3 Cấu trúc của cảm biến thông minh Đối tượng đo CB1 CB2 CBn CĐCH1 CĐCH2 CĐCHn MUX A/D µC Cảm biến thông minh Hình 1.7:Cấu trúc Cảm biến thông minh 17 Cảm biến gồm những chuyển đổi sơ cấp dùng để biến đại lượng không điện hoặc điện thành đại lượng điện. Các đại lượng này có thể là đại lượng chủ hoặc là các đại lượng của yếu tố ảnh hưởng dùng để loại trừ sai số do ảnh hưởng của chúng. Có thể có hai loại công nghệ : + Nếu các chuyển đổi là loại chuyển đổi sơ cấp bình thường thì các đầu ra của chúng được đưa vào một vi mạch công nghệ lai, gồm bộ biến đổi chuẩn hoá, MUX, A/D và vi xử lý trong một khối có truyền thông với máy tính và bộ nạp chương trình cho EPROM. + Nếu các chuyển đổi là loại chuyển đổi thực hiện bằng công nghệ vi mạch thì cả chuyển đổi lẫn phần tử gia công phía sau được mô-đun hoá trong một khối công nghệ mạch lai. Với sự phát triển mạnh mẽ của lĩnh vực mạng nơron nhân tạo, các giải pháp nơron đã được ứng dụng vào nhiều lĩnh vực nhằm thông minh hoá thiết bị như các hệ thống điều khiển, robot, các thiết bị gia dụng, phân loại sản phẩn, các hệ thống nhận dạng, phân tích tài chính v.v... và ta có thể ứng dụng mạng nơron trong lĩnh vực đo lường để thông minh hoá cảm biến. Tính chất ưu việt của mạng nơron là xử lý song song cho khả năng dung lượng tính toán lớn, tính toán cho đáp ứng thời gian thực đảm bảo độ chính xác cũng như tốc độ đáp ứng của hệ thống đo có một hoặc nhiều cảm biến. Tiếp theo ta sẽ xem xét một số khía cạnh thông minh hoá cảm biến. 1.4 Ứng dụng mạng nơron trong cảm biến thông minh 1.4.1 Khắc độ tự động cảm biến Cảm biến cho ra giá trị đo X thông qua phương trình đặc tính : X=f(Y). Phương trình này được xây dựng từ tập các giá trị lấy mẫu (Xi,Yi), i=1,..n, trong đó n là số điểm lấy mẫu. Thông thường sử dụng phương pháp tuyến tính hoá để xây dựng đường xấp xỉ đường cong đặc tính trong một giới hạn sai số cho phép. Mạng nơron có khả năng xấp xỉ hàm một hoặc nhiều biến với độ chính xác tuỳ ý, do đó ta có thể sử dụng mạng nơron để thực hiện xấp xỉ hàm X=f(Y) trên cơ sở tập lấy mẫu đã có. 18 Y X 0 Y1 Y2 Yn X1 Xn X2 Xi Yi 19 Hình 1.8 : Đường cong đặc tính của cảm biến Tập các giá trị lấy mẫu được đưa vào để huấn luyện mạng cho ra quan hệ hàm X=f(Y) như sơ đồ sau : Mạng nơron được cài vào vi xử lý để xử lý khắc độ tự động đặc tính của cảm biến thông minh. Hình 1.10 : Cảm biến thông minh sử dụng mạng nơron để khắc độ tự động đường đặc tính 1.4.2 Hiệu chỉnh đặc tính thang đo của cảm biến MNN W {Yi } {Xi } X=f(Y) Chỉ thị Hình 1.9 : Sơ đồ khắc độ tự động bằng mạng nơron CĐCH CB A/D VXL MNN Hiển thị số Đối tượng đo x xđo y y 20 Các cảm biến trong quá trình chế tạo hoặc sau một thời gian sử dụng đều mắc phải sai số hệ thống và sai số ngẫu nhiên, trong đó sai số hệ thống là sai số của phép đo luôn không đổi hoặc thay đổi có quy luật khi đo nhiều lần một đại lượng đo và sai số ngẫu nhiên là thành phần sai số của phép đo thay đổi không theo một quy luật nào cả mà ngẫu nhiên khi lặp lại phép đo nhiều lần một đại lượng duy nhất, có thể hình dung như hình 1.11. Trong trường hợp chung sai số hệ thống là hàm của đại lượng đo, đại lượng ảnh hưởng và thời gian. Khi là hàm của đại lượng đo (trong điều kiện tiêu chuẩn), sai số hệ thống gồm hai thành phần : Sai số cấu trúc và sai số công nghệ chế tạo. Sai số cấu trúc là sai số do bản thân nguyên lý cấu trúc chuyển đổi gây nên, sai số công nghệ chế tạo là sai số gây ra bởi các sai sót trong quá trình chế tạo. Bằng việc ứng dụng mạng nơron ta có thể giảm sai số hệ thống và sai số ngẫu nhiên của cảm biến để đạt sai số nằm trong giới hạn cho phép rất hiệu quả. Trước tiên ta xét sai số hệ thống thể hiện qua đường cong đặc tính của Giá trị thực Hình 1.11: Mô hình sai số hệ thống và sai số ngẫu nhiên Sai số hệ thống Sai số ngẫu nhiên 21 cảm biến. Giả sử đường cong đặc tính của cảm biến có sai số vượt quá sai số cho phép, ta có thể biểu diễn như trên hình 1.12. Như vậy δ>Δ , tức là sai số vượt quá giới hạn cho phép. Có thể dùng phương pháp tuyến tính hoá hoặc phương pháp biến đổi hàm để hiệu chuẩn lại đường đặc tính của cảm biến đạt sai số trong giới hạn cho phép. Để tuyến tính hoá đặc tính thực tế của cảm biến ta cần lấy mẫu nhiều điểm với tần số lấy mẫu được tính theo công thức : M e CF T 1= . Trong đó C≥ 2 theo Shannon. Để đảm bảo sai số của phép hồi phục đường cong ban đầu và sai số phép rời rạc hoá cho trước, giá trị C phụ thuộc sai số hồi phục ε : ε π 8 2=C [TL4]. Hoặc lấy mẫu theo định lý mới về lấy mẫu tín hiệu đo lường của PGS.TS Phạm Thượng Hàn theo biểu thức : γ π 3 2 maxffe = [TL1 ] Phương pháp tuyến tính hoá từng đoạn đòi hỏi nhiều thao tác lấy mẫu và thực hiện tuyến tính từng đoạn. Với tần số lấy mẫu lớn, số điểm lấy mẫu nhiều thì việc tuyến tính hoá cần khối lượng tính toán lớn, thủ công và mất rất nhiều thời gian, công sức. Δ− Δ+ Đường giới hạn phải Đường giới hạn trái Đường hiệu chuẩn Đường đặc tính thực tế Hình 1.12 : Đường đặc tính với sai số vượt quá giới hạn cho hé x Y -δ 22 Giả sử phương trình đường đặc tính thực tế Y1=g(X) và đường cong hiệu chuẩn (đường đặc tính lý thuyết) được biểu diễn bằng phương trình Y2=f(X). Để hiệu chỉnh lại đường đặc tính lý thuyết dịch lại gần với đường đặc tính thực tế nhằm đạt sai số cho phép ta dùng phương pháp biến đổi hàm : Y1=f(g-1(Y2))= φ(Y2), trong đó g-1 là hàm ngược của g. Hàm Y1= φ(Y2) có thể được xấp xỉ gần đúng với độ chính xác tuỳ ý sử dụng mạng nơron, loại trừ được sai số do tuyến tính hoá đường cong thực tế. Lý thuyết mạng nơron chỉ ra rằng có thể xấp xỉ một hàm phi tuyến bất kỳ với độ chính xác tuỳ ý bằng mạng nơron với số nơron và số lớp ẩn thích hợp [TL14], [TL18]. Tương tự ta cũng có thể hiệu chỉnh đường cong đặc tính lý thuyết theo giá trị đo X. Hàm biến đổi có dạng X1=ϕ(X2) cũng có thể xấp xỉ chính xác bằng mạng nơron. Do các hàm Y1= φ(Y2) và X1=ϕ(X2) đều là hàm đơn trị, đồng biến hoặc nghịch biến nên ta có thể sử dụng những mạng nơron khá đơn giản đủ để thoã mãn yêu cầu bài toán đặt ra. Đặc tính thực tế - (1) Đường hiệu chuẩn (Đặc tính lý thuyết) – (2) 100% X 100% Y 0 X Hình 1.13: Hiệu chỉnh đường đặc tính thực tế Y1 Y2 23 Ta có một nhận xét quan trọng là phương pháp tuyến tính hoá đường cong thực tế mắc phải một sai số hồi phục trong khi sử dụng mạng nơron có thể xấp xỉ chính xác hàm chuyển đổi với độ chính xác tuỳ ý mà không phải tuyến tính hoá đường cong thực tế, do đó sẽ giảm được sai số hệ thống và cho độ chính xác cao hơn. 1.5 Đề xuất phương pháp sử dụng mạng nơron để giảm sai số ngẫu nhiên và khắc độ bằng hàm nội suy Lagrange Thông thường khi thực hiện phép đo ta cố định một giá trị chẳng hạn yk và thu được các giá trị đo ngẫu nhiên phân bố xung quanh giá trị thực xk , k=1,..n ; n là số điểm lấy mẫu để xây dựng đường đặc tính của cảm biến Ta giả thiết đã có các giá trị thực Xk và các giá trị đo ngẫu nhiên phân bố theo luật phân phối chuẩn- luật Gauss đối với số lượng phép đo n≥20, và luật phân phối Student đối với 2≤ n<20 [TL3]. Hình 1.14 : Xây dựng đường đặc tính của cảm biến Theo lý thuyết thống kê giá trị đo thực Xk sẽ nằm trong khoảng : kkkkk XXXXX Δ+<<Δ− . Như vậy giá trị trung bình kX sẽ lệch với giá trị thực Xk một khoảng kkk XXX Δ≤− . X Yn 0 Y1 Y2 Yk Y * 1X * 2X * kX * nX 24 Từ tập các giá trị đo ngẫu nhiên ta sẽ sử dụng mạng nơron để tìm được giá trị *kX sao cho kkkk XXXX −<<− ε* với ε nhỏ tuỳ ý cho trước. Khi mạng nơron được huấn luyện để giá trị đầu ra của mạng *kX hội tụ về giá trị thực Xk thì đó là kết quả ước lượng tốt hơn giá trị trung bình kX . Sau khi đã có mạng nơron được huấn luyện để có đáp ứng gần với giá trị thực nhất thì với một tập đầu vào số liệu đo ngẫu nhiên ta sẽ có giá trị đầu ra của mạng * kX . Các giá trị đầu ra *kX này có thể xem là giá trị thực để tiến hành thao tác khắc độ cảm biến bằng phương pháp nội suy Lagrange. Việc sử dụng phương pháp nội suy Lagrange có ưu điểm là hàm này sẽ đi qua tất cả những điểm lấy mẫu và xấp xỉ hàm phi tuyến với độ chính xác cao. 25 Chương 2 CƠ SỞ LÝ THUYẾT MẠNG NƠRON Mô phỏng sinh học, đặc biệt là mô phỏng các chức năng hoạt động của bộ não người là mơ ước từ lâu của loài người. Não người được cấu tạo từ khoảng 1011 nơron, mỗi nơron trung bình nhận thông tin từ 104 nơron khác. Như vậy có khoảng 1015 mối liên kết trong bộ não người. Với số lượng nơron và các mối liên kết giữa chúng làm cho bộ não người có cấu trúc cực kỳ phức tạp. Điều này cho phép bộ não người có khả năng tư duy, nghi nhớ những sự kiện quá khứ, dự đoán, tổng quát hóa, nhận dạng, phân loại, điều khiển. Việc nghiên cứu bộ não người theo khía cạnh giải phẫu học, tâm lý học, thần kinh học để hiểu biết các nguyên tắc hoạt động của bộ não là rất cần thiết. Từ đó cho phép chúng ta tạo ra được những hệ thống thông minh có thể giải quyết nhiều vấn đề phức tạp trong đo lường, điều khiển tự động, hệ thống chuyên gia, công nghệ robot.v.v... 2.1 Nơron sinh vật 2.1.1 Cấu trúc cơ bản của nơron Nơron sinh học thu nhận, xử lý thông tin và kết nối với các bộ phận của cơ thể. Hình 2.1: Sơ đồ liên kết các nơron Mỗi nơron nhận các tín hiệu đầu vào qua các khớp thần kinh và tạo ra một tín hiệu ra truyền đến các nơron khác. Khớp thần kinh Dây thần kinh vào Các đầu vào song song Nơron Dây thần kinh ra Dây thần kinh ra 26 Hình 2.2: Cấu trúc một nơron sinh học Mỗi nơron nhận nhiều tín hiệu đầu vào thông qua các khớp thần kinh và tạo ra một tín hiệu đầu ra truyền dọc theo dây thần kinh ra. Thân nơron (soma) có đường kính khoảng 30μm. Trong thân nơron là nhân tế bào thần kinh. Mỗi tế bào thần kinh nhận nhiều đầu vào (khoảng 104) qua các dây thần kinh vào (dendrite) và sau vài quá trình xử lý tạo ra một tín hiệu đầu ra truyền dọc theo dây thần kinh ra (axon). Điểm nối giữa dây thần kinh ra của nơron này với dây thần kinh vào của nơron khác được gọi là khớp thần kinh (synapse). Dây thần kinh vào có độ dài khoảng 200-300μm. Thông tin tạo ra bởi tế bào thần kinh được truyền dọc theo dây thần kinh ra. Dây thần kinh ra có độ dài từ 50μm cho đến vài mét. Trung bình có 10.000 khớp thần kinh nối với mỗi dây thần kinh ra. Nơron được bao quanh bởi dung dịch các ion hóa học hòa tan, chủ yếu là Na+, Ca2+, K+ và Cl-. Các ion Na+ và K+ góp phần quan trọng để tạo ra các đáp ứng của nơron, những đáp ứng này gọi là điện thế hoạt động hay xung thần kinh. Ion K+ tập trung chủ yếu bên trong nhân của nơron và Na+ được tập trung chủ yếu bên ngoài của màng tế bào thần kinh. Ở trạng thái nghỉ thì điện thế nghỉ của nơron vào khoảng -70mV được cung cấp bởi sự hoạt động của màng tế bào. Các khớp thần kinh Các đầu vào từ nơron khác Các dây thần kinh vào Hướng truyền thông tin Các nhánh đầu ra Thân nơron 27 Hình 2.3: Cấu trúc hóa học của nơron Hình 2.4: Cấu trúc đơn giản của khớp thần kinh Hình 2.5: Xung thần kinh Dung dịch Na+ Nhân nơron K+ Màng tế bào thần kinh -70mV Xung thần kinh Khớp kích thích Khớp ức chế Điện thế kích thích Điện thế ức chế Dây thần kinh vào Màng trước khớp thần kinh Thời gian hồi phục Thời gian hoạt động Thời gian tăng Đỉnh xung Suy giảm điện thế hoạt động 0 1 2 -70 +30 0 Điện thế màng (mV) Điện thế nghỉ (mV) t (ms) t (ms) 0 1 2 Kích thích 28 2.1.2 Các tín hiệu điện của nơron Trong nơron sinh học, dây thần kinh vào cung cấp các tín hiệu đầu vào cho nơron. Chúng truyền và giữ nguyên dạng các tín hiệu vào thân nơron. Thân nơron thực hiện các thao tác toán học trên các tín hiệu này và tạo ra điện thế hoạt động truyền theo dây thần kinh ra. Điện thế hoạt động xuất hiện trên các dây thần kinh ra như một chuỗi xung, gọi là xung thần kinh. Các điện thế hoạt động được truyền không suy giảm trên dây thần kinh ra và các nhánh của nó đến các tế bào đích như các nơron, cơ bắp, các tuyến... Quá trình tạo ra xung thần kinh trong nơron hoặc truyền trên các dây thần kinh ra là do thay đổi sự thẩm thấu của các ion K+ và Na+ trên màng tế bào thần kinh. Khớp thần kinh đóng vai trò bộ biến đổi hóa học để truyền tín hiệu qua ranh giới của khớp nối. Điện thế hoạt động dọc theo dây thần kinh ra của nơron này được khớp thần kinh chuyển thành điện áp trên dây thần kinh vào của nơron khác. Nơron được xem là hoạt động khi nó tạo ra chuỗi các điện thế hoạt động. Khi xung thần kinh truyền tới khớp thần kinh giải phóng chất trong khớp tạo ra đáp ứng điện. Đáp ứng điện này có thể là kích thích hoặc ức chế được biểu trên hình 2.6. Hình 2.6: Điện thế kích thích và ức chế của khớp thần kinh. Bản chất của đáp ứng điện tùy thuộc vào kiểu của bộ biến đổi hóa học và màng dây thần kinh vào. Các dây thần kinh đầu vào bắt nguồn từ các khớp thần kinh kích thích có xung hướng tăng cường độ đốt nơron. Trong khi các đầu vào từ các khớp ức chế có xu hướng giảm cường độ đốt nơron. Một nơron nhận nhiều đầu vào kích thích và ức chế. Nếu các đầu vào kích thích càng mạnh thì xung đầu ra càng lớn. Ngược lại, nếu các đầu vào ức chế chiếm ưu thế thì đầu ra sẽ nhỏ hoặc bị triệt tiêu hoàn toàn. Độ lớn của tín hiệu trên dây thần kinh vào tỉ lệ với tần số trung bình của các xung truyền tới khớp thần 29 kinh. Các khớp thần kinh thường nằm giữa dây thần kinh vào và dây thần kinh ra. Nó cũng có thể xuất hiện giữa các dây thần kinh ra hoặc giữa các dây thần kinh vào, thậm chí nằm giữa dây thần kinh ra và thân nơron. Một nơron có khả năng mã hóa các tín hiệu kích thích thành tần số xung như hình 2.5. Hai tính chất quan trọng của các điện thế hoạt động có liên hệ trực tiếp với khả năng mã hóa tần số của nơron. Tính chất thứ nhất là thời gian tăng, nó được xác định bằng thời gian bắt đầu kích thích đến khi điện thế hoạt động đạt cực đại. Thời gian tăng này giảm theo hàm mũ khi tăng cường độ kích thích. Tính chất thứ hai gọi là thời gian hồi phục, là thời gian ngắn nhất cần thiết để tạo hai điện thế hoạt động thành công trên dây thần kinh ra như hình 2.5. Nói cách khác là thời gian ngắn nhất giữa hai điện thế hoạt động. Ngưỡng của kích thích thứ hai tùy thuộc vào thời gian hồi phục. Có một vùng thời gian chết gọi là thời gian hồi phục tuyệt đối. Trong khoảng thời gian này, nơron không thể tạo ra một xung thần kinh khác. Sau thời gian hồi phục tuyệt đối thì cường độ ngưỡng kích thích của xung thứ hai giảm theo hàm mũ khi tăng thời gian hồi phục. Do đó, nếu cung cấp kích thích với ngưỡng không đổi thì thời gian tăng và thời gian hồi phục sẽ điều khiển tần số của các xung đầu ra. Chẳng hạn, kích thích với cường độ cao sẽ thu được thời gian hồi phục nhỏ và thời gian tăng ngắn, do đó tạo ra điện thế hoạt động có tần số cao. 2.2 Mô hình nơron nhân tạo Từ những nghiên cứu về nơron sinh vật ta có thể xây dựng mô hình nơron nhân tạo như hình 2.7. W1 W2 Wn x1 x2 xn b ∑ g(.) y(t) u(t) Hình 2.7: Mô hình một nơron nhân tạo 30 Mô hình một nơron nhân tạo ở trên bao gồm bộ tổng các liên kết đầu vào và phần phi tuyến g(.). + Bộ tổng liên kết: Phương trình mô tả của bộ tổng liên kết: u(t)= )(W 1 k tx n k k∑ = +b Trong đó: u(t): Tổng tất cả các đầu vào mô tả thế năng tác động ở thân nơron xk(t) : Các đầu vào ngoài, mô tả tín hiệu vào từ các khớp nơron ngoài tới nơron hiện tại, n là số đầu vào, k=1..n y(t) : Đầu ra nơron Wk : trọng số liên kết các đầu vào ngoài b: Ngưỡng, xác định ngưỡng kích thích hay ức chế + Phần phi tuyến: Quan hệ phi tuyến y(t)=g(u(t)) cho đầu ra y(t) với đầu vào u(t). Có nhiều hàm phi tuyến có thể sử dụng trong mạng nơron nhân tạo. Các hàm phi tuyến thông thường được mô phỏng theo các hàm ánh xạ của nơron sinh vật. Tuy nhiên có một số dạng hàm mũ, lôgarít được sử dụng nhưng cơ sở sinh vật của các hàm này chưa được giải quyết. Bảng 2.1:Một số hàm phi tuyến thường dùng trong các mô hình nơron Tên hàm Công thức Đặc tính Hàm bước nhảy đơn vị (hard limit) g(u)= 1 nếu u≥ 0 0 nếu u< 0 Hàm bước nhảy lưỡng cực g(u)= 1 nếu u≥ 0 -1 nếu u< 0 u g -1 1 0 g u 1 0 31 Hàm tuyến tính g(u)=u Hàm tuyến tính bão hòa g(u)= 1 nếu u>1 u nếu 0≤u≤1 0 nếu 0<u Hàm tuyến tính bão hòa đối xứng g(u)= 1 nếu u>1 u nếu -1≤u≤1 -1 nếu 0<u Hàm tuyến tính dương g(u)= u nếu u ≥0 0 nếu u <0 Hàm sigmoid đơn cực ue ug λ−+= 1 1)( 1 0 0.5 u Hàm sigmoid lưỡng cực 1 1 2)( −+= − ueug λ 1 -1 0 u Hàm cạnh tranh g(u)= 1 nơron gần tâm nhất 0 nơron khác 2.3 Mạng nơron nhân tạo 2.3.1 Cấu trúc mạng nơron Mạng nơron hai lớp: Mạng nơron hai lớp gồm một lớp đầu vào và một lớp đầu ra riêng biệt. Mạng nơron nhiều lớp: Mạng nơron nhiều lớp gồm một lớp đầu vào và một lớp đầu ra riêng biệt. Các lớp nằm giữa lớp đầu vào và lớp đầu ra gọi là các lớp ẩn (Hidden layers). Mạng nơron truyền thẳng: Mạng nơron truyền thẳng là mạng hai hay nhiều lớp mà tín hiệu truyền theo một hướng từ đầu vào đến đầu ra. u g 0 u 1 1 0 g -1 1 1 -1 u u g 0 32 Mạng nơron phản hồi: Mạng nơron phản hồi là mạng mà trong đó một hoặc nhiều đầu ra của các phần tử lớp sau truyền tín hiệu ngược lại tới đầu vào của lớp trước. 2.3.2 Phân loại mạng nơron Có nhiều cách để phân loại mạng nơron. - Dựa vào số lớp có trong mạng nơron ta có thể phân loại thành : mạng nơron một lớp; mạng nơron nhiều lớp. - Dựa vào đường truyền tín hiệu trong mạng nơron ta phân loại thành: Mạng nơron truyền thẳng; mạng nơron phản hồi; mạng nơron tự tổ chức. Một kiểu phân loại điển hình được biểu diễn như hình 2.8. 2.3.3 Một số mạng nơron nhân tạo 2.3.3.1 Mạng nơron truyền thẳng + Mạng truyền thẳng một lớp Mạng nơron truyền thẳng một lớp là mạng mà các nơron tạo thành một lớp và tín hiệu truyền theo một hướng từ đầu vào đến đầu ra. Hình2.8: Phân loại mạng nơron nhân tạo Truyền thẳng Phản hồi Tự tổ chức Một lớp Nhiều lớp BackPropa gation Percept ron Adaline Brain State- in Box Hop- field Máy Boltz- Man BAM Mc Culloch Pitts Cohen Grossberg RBF Ánh xạ đặc trưng ART Mạng nơron nhân tạo 33 34 Trường hợp H(s)=1, ta có phương trình mô tả mạng: ui(t)= i m k kik btpw +∑ =1 )( yi(t)=g(ui(t)) Trong đó ui(t) là tổng tất cả các đầu vào thứ i, i=1,..n. pk(t) : đầu vào ngoài thứ k, k=1,...m, tại thời điểm t. wik : trọng liên kết từ đầu vào thứ k đến nơron thứ i. yi(t) : đầu ra của nơron thứ i. bi : ngưỡng của nơron thứ i. n : số phần tử nơron. m : số tín hiệu đầu vào. Có thể mô tả bằng phương trình dạng ma trận như sau: U(t)= W.P(t)+B Y(t)=g(U(t)) Trong đó: g(.) u1(t) y1 b1 p1 w11 ∑ g(.) u2(t) y2 b2 p2 w22 ∑ g(.) un(t) yn bn pm wnm ∑ Hình 2.9: Mô hình mạng nơron truyền thẳng một lớp 35 P(t)= [p1(t), p2(t),... pm(t) ]T U(t)= [u1(t), u2(t),...un(t) ]T Y(t)= [y1(t), y2(t),.... ym(t) ]T W= [wik] B=[b1, b2,...bn]T + Mạng nơron truyền thẳng nhiều lớp Mạng nơron truyền thẳng hai lớp gồm lớp sigmoid và lớp tuyến tính có thể xấp xỉ hầu hết các hàm tùy ý, mạng một lớp không làm được điều này. Hình 2.10: Mạng nơron truyền thẳng nhiều lớp Phương trình mô tả mạng : )()( 1 1 1 q i n j q j q ij q i q i q i q i bywgugy q +== ∑ − = − Trong đó : q iy : đầu ra của nơron thứ i ở lớp thứ q, i=1... qn , q=1,...Q qn : số nơron ở lớp thứ q. Q: Số lớp nơron của mạng. Lớp ẩn g1 g1 g1 gq gq gq gQ gQ gQ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ ∑ p1 p2 pm Qy1 Qy2 Q nQy qy1 qy2 q n q y 1 1y 1 2y 1 1n y Lớp vào Lớp ra 1 1b 1 1n b qb1 q n q b Q nQ b Qb1 36 q ib : ngưỡng của nơron thứ i ở lớp thứ q. q ijw : trọng liên kết giữa đầu ra thứ j của lớp thứ q-1 đến nơron thứ i của lớp thứ q, j=1... 1−qn Đầu vào mạng y0=p. Đầu ra mạng y=yQ Hàm năng lượng của mạng có thể tính theo biểu thức: 2 1 )( 2 1)( Qi n i i ydwE Q −= ∑ = Trong đó di là đầu ra mong muốn của nơron thứ i ở lớp ra. Hầu hết các mạng nơron thực tế chỉ có 2 hoặc 3 lớp, rất hiếm mạng có từ 4 lớp trở lên. Các đặc điểm của tín hiệu đầu ra sẽ quyết định hàm truyền của mạng ở lớp ra. + Một số mạng nơron truyền thẳng - Mạng Perceptron (PE) Trong đó : m: số đầu vào n: Số nơron ∑ ∑ ∑ p1 p2 pm 1y 2y ny 1b 2b nb W ∑ b 1 n x 1 n x m p m x1 m y n x1 n x1 u y=hardlim(Wp+b) Hard limit Layer Input Hình 2.11: Mạng perceptron một lớp với hàm truyền hardlimit 37 Ma trận trọng số: ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ = nmnn www .... .............. w...ww w...ww W 21 2m2221 1m1211 Ma trận đầu vào p= [p1,p2,....pm ]T b= [b1, b2,....bn ]T Phương trình tác động : )()( 1 )( sgn ki k j m j ij k i dpWy =⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ = ∑ = Trong đó )(kid là đầu ra mong muốn của nơron thứ i ở bước lặp thứ k. Mạng sử dụng luật học Perceptron: Wnew = Wold+e.pT bnew = bold +e Trong đó e =d-y là sai số Perceptron. Mạng Perceptron thích hợp cho bài toán nhận dạng và phân loại mẫu. -Mạng Adaline Năm 1960, Windrow và Marcian Hoff đã giới thiệu mạng Adaline và một luật học gọi là LMS (Least Mean Square). Mạng Adaline tương tự như perceptron ngoại trừ hàm truyền là hàm tuyến tính thay cho hardlimit. Cả Adaline và Perceptron đều có cùng hạn chế: chúng chỉ có thể giải quyết được bài toán phân lớp tuyến tính (khả tách tuyến tính). Tuy vậy thuật học LMS mạnh hơn luật học perceptron. Luật học perceptron được đảm bảo hội tụ đến một lời giải cho phép phân nhóm đúng đắn các mẫu huấn luyện, mạng thu được có thể nhạy với nhiễu vì các mẫu thường nằm ở gần các biên quyết định. Thuật học LMS cực tiểu hóa sai số bình phương trung bình do đó cố gắng dịch chuyển các biên quyết định ra xa các mẫu huấn luyện nhất có thể tránh được ảnh hưởng của nhiễu. 38 Thuật học LMS có nhiều ý nghĩa sử dụng thực tế hơn luật học perceptron, điều này đặc biệt đúng trong lĩnh vực xử lý tín hiệu số. Chẳng hạn, các hệ thống điện thoại đường dài có thể sử dụng các mạng Adaline để khử nhiễu lặp. Mạng Adaline cũng được ứng dụng để lọc thích nghi. Trong đó : m: số đầu vào n: số nơron Ma trận trọng số: ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ = nmnn www .... .............. w...ww w...ww W 21 2m2221 1m1211 Ma trận đầu vào p= [p1,p2,....pm ]T b= [b1, b2,....bn ]T Phương trình tác động )()( 1 )( k i k j m j ij k i dpWy == ∑ = Thuật toán sai số bình phương nhỏ nhất hay còn gọi là luật học delta hoặc thuật học Windrow-Hoff. ∑ ∑ ∑ p1 p2 pm 1y 2y ny 1b 2b nb W ∑ b 1 n x 1 n x m p m x1 m y n x1 n x1 u y=pureline(Wp +b) Lớp nơron tuyến tính Đầu vào Hình 2.12: Mạng Adaline 39 Tại bước lặp thứ k+1 ta có: )().(.2)()1( kpkekWkW Tα+=+ )(.)()1( keekbkb α+=+ Trong đó: )().()()()()( kpkWkdkykdke −=−= và α là hệ số học - Mạng nơron truyền thẳng nhiều lớp sử dụng thuật học lan truyền ngược Mạng lan truyền ngược thường có một hoặc nhiều lớp ẩn với các nơron dạng sigmoid và lớp ra là các nơron với hàm truyền tuyến tính. Mạng nhiều lớp sử dụng thuật học lan truyền ngược đang được sử dụng rộng rãi nhất trong lĩnh vực nơron. Luật học lan truyền ngược được phát triển từ luật học delta. Cũng như luật học delta, luật học lan truyền ngược (BP) là xấp xỉ của thuật toán giảm dốc nhất, trong đó hàm chất lượng là sai số bình phương trung bình. Sự khác nhau giữa luật học delta và luật học lan truyền ngược chỉ là cách thức lấy đạo hàm. W1 ∑ b1 1 n1x 1 n1xm p m x1 m y1 n1x1 n1x1 u1 y1=tansig(W1p +b1) Lớp nơron Sigmoid Đầu vào W2 ∑ b2 n2x1 n2x1 n2x1 u2 y2=pureline(W2y1 +b2) Lớp nơron tuyến tính 1 y2n2xn1 Hình 2.13: Ví dụ mạng hai lớp sử dụng thuật học BP 40 Đối với mạng đa lớp ta có phương trình )( 1111 ++++ += qqqqq byWgy với q=0,1,..Q-1. Trong đó Q là số lớp của mạng. Các nơron ở lớp đầu tiên nhận đầu vào từ ngoài: y0=p làm điểm khởi đầu. Các đầu ra của các nơron trong lớp cuối cùng được xem là đầu ra của mạng y=yQ. Mạng được cung cấp các tập mẫu học: {p1,d1},{p2,d2},...{pk,dk}, trong đó pi là một đầu vào mạng và di là đầu ra đích tương ứng. Khi mỗi đầu vào được áp lên mạng, luật học sẽ điều chỉnh các tham biến mạng để cực tiểu hóa sai số bình phương trung bình: ))()(.())()(()().()( kykdkykdkekexF TT −−==∧ với x là véc tơ chứa các trọng số và ngưỡng của mạng: x= ⎥⎦ ⎤⎢⎣ ⎡ b W' Thuật toán giảm dốc nhất cho xấp xỉ sai số bình phương trung bình là: q ij q ij q ij ˆ )()1( w Fkwkw ∂ ∂−=+ α q i q i q i ˆ )()1( b Fkbkb ∂ ∂−=+ α Trong đó α là hệ số học. Với định nghĩa q i ˆ u Fsqi ∂ ∂= là độ nhạy của Fˆ theo thay đổi của net input tại lớp q. Thuật toán xấp xỉ giảm dốc nhất trở thành : 1q ij q ij )()1( −−=+ qjqi yskwkw α q iskbkb α−=+ )()1( qiqi Và dạng ma trận: Tqqqq yskWkW )(.)()1( 1−−=+ α 41 qqq skbkb .)()1( α−=+ Trong đó: ⎥⎥ ⎥⎥ ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ ∂ ∂ ∂ ∂ =∂ ∂= q n q q q qu F . u F u F ˆ . ˆ ˆ 1 s Ký hiệu ⎥⎥ ⎥⎥ ⎥⎥ ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎢⎢ ⎢⎢ ⎢ ⎣ ⎡ = )('...00 .. .. .. 0...)('0 0...0)(' )(' 2 1 q n q qq qq qq quf uf uf uF Ta có: ( ) 11)(' ++= qTqqqq sWuFs ))(('2 yduFs QQQ −−= Ta sẽ truyền lùi các độ nhạy thông qua mạng từ lớp cuối cùng cho đến lớp đầu tiên. sQ sQ-1 ..... s2 s1 Tóm lại giải thuật BP được mô tả như sau: • Bước truyền thẳng: truyền đầu vào xuôi theo mạng: y0 = p )( 1111 ++++ += qqqqq byWgy với q=0,1,...,Q-1. y = yQ • Bước truyền lùi: truyền lùi các độ nhạy: ))(('2 yduFs QQQ −−= ; 42 ( ) 11)(' ++= qTqqqq sWuFs với q = Q-1,...,2,1. • Các trọng số và ngưỡng được cập nhật theo luật xấp xỉ giảm dốc nhất: Tqqqq yskWkW )(.)()1( 1−−=+ α qqq skbkb .)()1( α−=+ Tuy nhiên thuật toán BP cơ bản ở trên vẫn còn quá chậm cho các ứng dụng. Việc nghiên cứu các thuật toán nhanh hơn được chia thành hai nhóm. Nhóm thứ nhất phát triển các kỹ thuật mang tính kinh nghiệm (heuristic), nay sinh khi nghiên cứu về chất lượng đặc trưng của thuật toán BP. Các kỹ thuật heuristic này đưa ra các ý tưởng như hệ số học biến đổi, sử dụng momentum và các biến co giãn. Nhóm thứ hai phát triển theo hướng kỹ thuật tối ưu hóa số. Một số kỹ thuật về tối ưu hóa số đã áp dụng thành công cho mạng nơron nhiều lớp là : thuật toán gradient liên hợp và thuật toán Levenberg-Marquardt (LM- một phiên bản khác của phương pháp Newton)... [TL5] 2.3.3.2 Mạng nơron phản hồi Mạng nơron phản hồi có một số đầu ra kết nối đến các đầu vào của mạng. Hình 2.14: Mạng nơron phản hồi một lớp Trong trường hợp tổng quát, mô hình mạng nơron phản hồi được mô tả bằng hàm: U(t)=F(Y(t), P(t), b) p1 p2 pm y1 y2 yn b1 b2 bn 43 Y(t)=G(U(t)) Trong đó: U(t) là trạng thái P(t) là các đầu vào ngoài b là tham số ngưỡng F(.) là hàm mô tả cấu trúc G(.) là hàm mô tả quan hệ giữa biến trạng thái và đầu ra Ta xét một số mạng nơron phản hồi sau: + Mạng Hopfield liên tục Mô hình Hopfield thể hiện ở dạng mạch điện. Mỗi nơron thể hiện bằng một khuếch đại và các điện trở/tụ điện. Có 2 tập đầu vào nơron. Tập thứ nhất thể hiện bởi các dòng điện I1,I2,... là các đầu vào từ bên ngoài không đổi. Tập còn lại là gồm các kết nối phản hồi từ các khuếch đại thao tác khác. Phương trình thao tác cho mô hình Hopfield, sử dụng định luật Kirchoff là: ∑ = +−= S j i i i jji i I R tntaT t tdnC 1 , )()()( Trong đó ni là điện áp đầu vào của bộ khuếch đại thứ i, ai là điện áp đầu ra của bộ khuếch đại thứ i, C là điện dung đầu vào và Ii là cường độ dòng điện đầu vào và cố định cho bộ khuếch đại thứ i. Và ( )∑ = − ==+ρ== S j iiii jiiji ji nfaafnRRR T 1 1 ,, , )(hay )(, 111,1 . Giả thiết là mạch điện là đối xứng do đó Ti,j = Tj,i. Hình 2.15: Mô hình Hopfield ρ ρ ρ 44 Ta biến đổi phương trình thao tác thành dạng: ∑ = ++−=ε S j ijjii i btawtn dt tdn 1 , )()( )( hay ở dạng véctơ : btWatn dt tdn ++−= )()()(ε và ))(()( tnfta = Kết quả ta có mạng Hopfield cho ở hình 2.16 Hopfield đã chọn hàm Lyapunov hay hàm năng lượng (áp dụng trong định lý bất biến LaShalle) sau: ∑ ∫ = − − ⎪⎭ ⎪⎬ ⎫ ⎪⎩ ⎪⎨ ⎧ +−= s i T a T abduufWaaaV i 1 0 1 )( 2 1)( và chứng minh được )(aV dt d ≤ 0 nghĩa là )(aV dt d là bán xác định âm và V chính là một hàm Lyapunov. Áp dụng định lý bất biến LaShalle cho phép xác định các điểm cân bằng của mạng Hopfield. Đầu tiên ta xác định tập Z: Hình 2.16: Mạng Hopfield n(0)=f-1(p), (a(0)=p), εdn/dt = -n+Wf(n)+b 1/ε Đầu vào Lớp phản hồi 45 Z = {a: , Ga0, dt dV(a) ∈= G là bao đóng của G } Tập này chứa tất cả các điểm mà tại đó đạo hàm của hàm Lyapunov bằng 0. Đạo hàm của hàm Lyapunov bằng 0 một khi các đạo hàm của đầu ra của nơron bằng 0: 0= dt da Hệ này tồn tại nhiều điểm cân bằng ứng với mức năng lượng cực tiểu trên một siêu phẳng năng lượng của siêu diện n chiều. Mạng Hopfield không có luật huấn luyện và không được huấn luyện hay tự học. Mạng có khả năng dùng làm bộ nhớ các mẫu lệnh để sau đó gọi lại.Mạng cũng có thể dùng trong hệ nhận dạng các tham số, làm các suy diễn mờ trong điều khiển thông minh, mở ra những lớp bài toán cho nhiều lĩnh vực khác nhau. + Mạng BAM (Bidirection Associative Memory) Mạng BAM là cải tiến của các mạng Hopfield do Kosko đề xuất năm 1988 với đầu ra truyền ngược trở về bằng một nơron. Thực chất có thể xem sự phản hồi đó như lớp mạng thứ hai. Phương trình tác động: y’=g(Wx) hoặc y’i = g )( 1 '∑ = m j jij xw ; i=1,2..,n x’=g(WTy’) hoặc )( ' 1 ' i n i jii xwgx ∑ = = ; j=1,2...m Qúa trình gọi lại: y(1) =g(Wx(0)) x(2) = g(WTy(1)) y(3) =g(Wx(2)) x(4) = g(WTy(3)) . . Hình 2.17: Mạng BAM x1 x2 xm y1 y2 ym 46 y(k-1) =g(Wx(k-2)) x(k) = g(WTy(k-1)) Ta có hàm năng lượng E(x,y)= wxywxyywx TTTT −=− 2 1 2 1 Chỉnh trọng trên cơ sở luật Hebb: ⎪⎪⎩ ⎪⎪⎨ ⎧ −− = ∑ ∑ = = p k Tkk p k Tkk xy xy W 1 1 )12)(12( )( hoặc ⎪⎪⎩ ⎪⎪⎨ ⎧ −− = ∑ ∑ = = p k k j k i p k k j k i ij xy xy w 1 1 )12)(12( Mạng BAM nhớ tập trọng liên kết x-y, với đầu vào x mạng cho đầu ra y tương ứng và ngược lại. + Mạng RBF(Radial Basis Function Networks) Mạng RBF đã được đề xuất bởi một số tác giả như Moody và Darken 1989; Renals và Rohwer 1989... Kiến trúc chung của mạng RBF như ở hình 2.18. cho vectơ lưỡng cực cho vectơ không lưỡng cực x1 x2 xm y1 y2 yn . . . . . Hình 2.18: Mạng RBF cho vectơ lưỡng cực cho vectơ không lưỡng cực 47 Với lớp ẩn chứa các hàm RBF. Hàm RBF là hàm đối xứng hình chuông chẳng hạn như hàm Gauss. Hàm gauss: f(x) = exp[-(x - M)2/2σ2 ] Trong đó M và σ là giá trị trung bình và phương sai của biến x. Mạng RBF Gauss có thể áp dụng luật học không giám sát của Kohonen mở rộng. Phương trình tác động: [ ][ ]∑ −− −−= k kk qq q mx mx z 22 22 2/)(exp 2/)(exp σ σ yi=gi( ) 1 ∑ = + n q iqiq bzw với i=1,...n Trong đó mq : giá trị trung bình kσ : phương sai Hàm sai lệch: ∑∑ ∑∑∑ = −=−= k i i q k qiq k i k i k i k iiq zwdydwE 2 1 2 )( 2 1)( 2 1)( Chỉnh trọng: qiiwiq zydw )( −=Δ η ∑ ∂∂−=Δ i q i iim m y ydmq )(η ∑ ∂∂−=Δ i q i iiq y yd σησ σ )( Mô hình RBF có thể thực hiện như một mô hình mờ bởi vì các RBF có thể xem như các hàm liên thuộc. 48 So sánh các loại mạng nơron ta thấy một số đặc điểm sau: - Mạng nơron truyền thẳng không có lớp ẩn dễ phân tích nhưng không mô tả được mọi hàm. Mạng có lớp ẩn cho phép mô tả được hầu hết các hàm nhưng khó phân tích và có thể gây ra sai số tích lũy qua các lớp. - Mạng nơron phản hồi một lớp đơn giản trong phân tích, không chứa sai số tích lũy, dễ thực hiện trên các mạch điện và mạch tổ hợp. Mạng được nghiên cứu và ứng dụng với phần động học tuyến tính thích hợp với các bài toán điều khiển và công nghệ rôbốt. - Mạng tự tổ chức mở ra nhiều khả năng giải quyết các bài toán phức tạp, thông minh gần với tri thức con người nhưng chậm trong xử lý do số lượng tính toán nhiều. 2.4 Học của mạng nơron Luật học (thuật toán huấn luyện) thực hiện thuật toán để điều chỉnh các trọng và ngưỡng hoặc cấu trúc của mạng để có tín hiệu đầu ra mong muốn. Có hai thuật học cơ bản là thuật học tham số quan tâm đến việc điều chỉnh các trọng số, ngưỡng của mạng và thuật học cấu trúc tập trung vào việc điều chỉnh cấu trúc mạng bao gồm số lượng các nơron, số lớp và mối liên kết giữa chúng. Các thuật học có thể phân thành học có tín hiệu chỉ đạo, học củng cố và học không có hướng dẫn. Học có tín hiệu chỉ đạo là học để đưa ra các tín hiệu bám sát các đầu ra mong muốn. Mạng được cung cấp các cặp giá trị mẫu học (p1, d1), (p2, d2),... (pk, dk) là các cặp giá trị đầu vào đầu ra mong muốn. Quá trình học là điều chỉnh trọng số và ngưỡng của mạng để giảm sai số giữa giá trị đầu ra thực tế và đầu ra mong muốn. Luật học điển hình của nhóm này là luật học Delta của Widrow dùng để xấp xỉ trọng của mạng Adaline dựa trên nguyên lý giảm Gradient. Một luật học hiệu quả và được sử dụng rộng rãi trong lĩnh vực mạng nơron là thuật toán lan truyền ngược cũng nằm trong nhóm này với các trọng số và ngưỡng được cập nhật theo luật xấp xỉ giảm dốc nhất. Ngoài ra 49 còn có luật học Perceptron. Về cơ bản luật học Perceptron giống luật học Delta. Điểm khác nhau là luật học Delta thay đổi các giá trị của trọng trong thời gian học, còn luật học Perceptron thêm hoặc bỏ trọng tuỳ theo giá trị sai số đầu ra là dương hay âm. Học củng cố được thực hiện trên thông tin phản hồi hai trạng thái đúng hoặc sai và tín hiệu mang thông tin phản hồi được gọi là tín hiệu cũng cố cho quá trình học. Quá trình học không có hướng dẫn là quá trình học không có thông tin phản hồi cho biết tín hiệu đầu ra là đúng hay không. Mạng phải tự xác định các cặp dữ liệu mẫu, các tính chất, các quan hệ và mã hóa chúng trong tín hiệu đầu ra. Luật học không có hướng dẫn điển hình là luật Hebb thường dùng cho mạng tự liên kết. Luật học LVQ thường dùng cho mạng nơron tự tổ chức. MNN W Bộ tính sai số X Y d Tín hiệu sai số Đầu ra mong muốn Đầu ra thực tế (a)- Học có tín hiệu chỉ đạo MNN W Bộ nhận xét X Y d Tín hiệu nhận xét Đầu ra thực tế Đầu ra mong muốn (b)- Học củng cố MNN W X Y Đầu vào Đầu ra thực tế (c)- Học không có hướng dẫn 50 Hình 2.19 : Sơ đồ khối các thuật học của mạng nơron. Ứng với các nhóm mạng nơron khác nhau thường áp dụng một số luật học nhất định. Nếu tồn tại hàng chục loại mạng nơron khác nhau thì các luật học dùng trong mạng nơron có thể liệt kê gấp nhiều lần. Đối với mạng nơron phản hồi thường sử dụng luật Hebb và các luật cải tiến của nó để chỉnh trọng mà không cần tín hiệu chỉ đạo từ bên ngoài. Đối với mạng nơron truyền thẳng thường sử dụng luật truyền ngược để chỉnh trọng với tín hiệu chỉ đạo từ bên ngoài. Nếu coi cấu trúc mô hình mạng là phần xương thịt, thể xác thì các luật học là phần trí tuệ thông minh của mạng nơron và các công trình nghiên cứu luật học chiếm số lượng lớn nhất trong mấy chục năm qua. 2.5 Một số ứng dụng mạng nơron nhân tạo + Mạng nơron nhân tạo có khả năng nhận dạng (ảnh, vật thể, tiếng nói...), xử lý thông tin có nhiễu, không đầy đủ, không chắc chắn, mờ [TL7], [TL18]. + Mạng nơron có khả năng xử lý song song với tốc độ xử lý nhanh do vậy nó là công cụ mới đầy hứa hẹn trong khoa học tính toán, nhận dạng, điều khiển tự động cũng như nhiều lĩnh vực khác. Các hệ thống sử dụng nó có thể tăng tốc độ xử lý và tính toán theo thời gian thực [TL18]. + Mạng nơron nhân tạo có khả năng học thích nghi, nó sẽ thích ứng với quá trình tự chỉnh trong quá trình điều khiển tự động. 51 + Mạng nơron có khả năng tổng quát hoá do đó có thể áp dụng để dự báo lỗi hệ thống tránh được những sự cố đáng tiếc mà các hệ thống điều khiển có thể gây ra [TL5], [TL7]. + Mạng nơron có thể phối hợp cả nhận dạng và điều khiển đối tượng do đó nó có thể được thực hiện như một bộ điều khiển thích nghi. Việc nghiên cứu để đưa mạng nơron nhân tạo áp dụng vào quá trình điều khiển tự động đã được nhiều nhà khoa học thực hiện và đã đưa ra được nhiều kết quả quan trọng. + Theo Hunt (1992) thì mạng Hopfield có thể dùng làm bộ điều khiển cho hệ thống học tuyến tính [TL15]. Trong trường hợp này người ta dùng các phần tử của cấu trúc nơron thay đổi được để xây dựng bộ điều khiển. Bộ điều khiển đưa ra chứa đựng sự thích nghi và đạt độ bền tốt. + Theo Chu thì mạng Hopfield có thể dùng làm một phần của cơ chế thích nghi trong nhận dạng hệ tuyến tính. Trong trường hợp này, mạng tham gia vào vòng thích nghi và được dùng để tối thiểu tốc độ sai số bình phương tức thời của tất cả các trạng thái. Các đầu ra của mạng được dùng để thể hiện các tham số của mô hình đối tượng dạng tuyến tính có tham số thay đổi theo thời gian hoặc tham số bất biến. + Chang, Zhang và Sami cho biết mạng Hopfield cũng có thể kết hợp với mạng Gabor để nhận dạng hệ phi tuyến. Trong trường hợp này, mạng bao gồm ba lớp. Lớp thứ nhất gọi là bộ tạo hàm sử dụng mạng Gabor để tạo hàm phi tuyến cơ sở Gabor. Lớp thứ hai dùng mạng Hopfield để tối ưu các hệ số trọng chưa biết. Lớp thứ ba được gọi là mạng điều khiển để tính sai số ước lượng và điều khiển hoạt động của các lớp mạng thứ nhất và lớp mạng thứ hai. Hệ không yêu cầu phải ổn định tiệm cận mà chỉ cần các đầu vào-ra giới hạn và ổn định đối với các kết quả được coi là hợp lý theo miền vào-ra lớn. Thành công của phương pháp ở chỗ đã đạt được lý luận của phương pháp và cho kết quả mô phỏng. 52 + Mạng phản hồi Hopfield được dùng để tổng hợp hệ điều khiển tuyến tính có phản hồi thông qua đặt cực. Trong trường hợp này mạng nơron có khả năng giải những bài toán quy hoạch lồi. Để thu được ma trận phản hồi trạng thái K thông qua đặt cực, người ta dùng mạng nơron phản hồi kiểu Hopfield. So với các phương pháp đặt cực truyền thống khác, phương pháp này có ưu điểm là phương pháp tổng hợp on-line và tự điều chỉnh thông qua mạng nơron phản hồi. So với phương pháp sử dụng mạng nơron khác dùng để tổng hợp hệ tuyến tính, phương pháp này có ưu điểm là tự động cả đặt cực và tối thiểu chuẩn mà không cấn huấn luyện trước. Phương pháp này sử dụng bản chất vốn dĩ về tính toán song song và phân bổ của mạng nơron phản hồi nên có thể dùng trực tiếp trong các ứng dụng theo thời gian thực. Các tác giả này đang định hướng nghiên cứu phương pháp này để đặt cực trong tổng hợp hệ phi tuyến. + Mạng nơron phản hồi có thể dùng làm bộ nhớ liên kết. Bộ nhớ liên kết có thể sử dụng như bộ suy diễn mờ. Như vậy có sự kết hợp giữa mạng nơron và các luật mờ tạo nên bộ điều khiển nơron mờ. Phần điều kiện trong trường hợp này có thể sử dụng mạng 'học lượng tử véc tơ'. Luật if...then... dùng bộ nhớ liên kết với mạng Hopfield hoặc mạng liên kết hai chiều. + Yun-Ki Lei và các đồng tác giả đã sử dụng mạng nơron truyền thẳng ba lớp lấy tín hiệu sai số để điều chỉnh tham số của PID là các hệ số Ki, Kp, Kd. Đầu vào hiệu chỉnh mạng nơron trong trường hợp này sử dụng độ lệch giữa sai số chuẩn g(t) và sai số thực của hệ điều khiển. Tuy nhiên, hệ điều khiển được xây dựng chưa được chứng minh đảm bảo ổn định. + Abiev (1994) cũng đã nêu sơ đồ chỉnh định trực tiếp các hệ số PID. Trong trường hợp này, mạng nơron ba lớp truyền thẳng chứa các tình huống điều khiển để đưa ra tín hiệu điều khiển cho hệ. Mạng nơron lúc đó được mô tả theo các luật mờ if...then...Phương pháp đã được áp dụng để điều khiển nhiệt độ trong công nghệ hoá dầu ở Bacu. + Allon Gues cũng đã nêu một phương pháp tuyến tính hóa quanh điểm cân bằng của mạng Hopfield liên tục nhằm xác định hệ số của mô hình bằng 53 cách rút ra và giải n(n+1) phương trình và bất phương trình, (trong đó n là số phần tử nơron). Phương pháp Liapunov trực tiếp sử dụng ở đây để xác định nghiệm ổn định tiệm cận cho mạng. Các vùng ổn định của mạng dùng làm các vùng điều chỉnh các tham số của bộ điều chỉnh PD. Đây là một phương pháp tổng hợp mạng kết hợp với tiêu chuẩn ổn định Liapunov để xác định các hệ số trọng của mạng liên tục cho từng phần tử nơron, mỗi nơron chỉnh một tham số của bộ PD. + Năm 1996, vấn đề nhận dạng tham số và điều khiển hệ servo với bộ điều chỉnh PID đã được đưa ra. Sơ đồ sử dụng mạng Hopfield liên tục để nhận dạng, sử dụng mạng Hopfield rời rạc bậc ba theo phương pháp điều khiển gián tiếp để điều chỉnh tham số của bộ điều khiển PID theo tình huống, đồng thời ứng dụng nó để điều khiển rô bốt. + Mạng nơron RBF, với khả năng ứng dụng trong điều khiển thích nghi phi tuyến. Trên cơ sở phân tích ưu điểm của mạng nơron RBF là khả năng sinh và diệt nơron tác giả đưa ra nhận định khả năng ứng dụng nó vào quá trình điều khiển thích nghi các hệ thống phi tuyến có cấu trúc thay đổi. + Mạng nơron truyền thẳng nhiều lớp với khả năng xấp xỉ các hàm phi tuyến bất kỳ với độ chính xác tuỳ ý do đó ngày càng được ứng dụng nhiều trong các bài toán điều khiển. + Một số tác giả đã tập trung nghiên cứu việc ứng dụng mạng nơron nhân tạo vào điều khiển rô bốt và tay máy [TL13]. Các mạng nơron phản hồi, mạng nơron truyền thẳng cũng đã được sử dụng để hiệu chỉnh tín hiệu điều khiển nhằm đạt được chế độ điều khiển tối ưu. + Mạng nơron đã dần được ứng dụng vào các lĩnh vực truyền thông như nhận dạng kênh, mô hình hoá kênh, mã hoá và giải mã, hiệu chỉnh kênh, phân tích phổ, lượng tử hoá véc tơ... ở đây các mạng nơron truyền thẳng, phản hồi, mạng nơron tự tổ chức được ứng dụng trong các lĩnh vực phù hợp. 54 + Có thể sử dụng mạng nơron để làm bộ biến đổi tương tự-số. Để xác định các trọng và ngưỡng của mạng nơron ta tiến hành so sánh sai số của bộ biến đổi với hàm năng lượng của mạng Hopfield. + Mạng nơron được dùng để xấp xỉ các đặc tính phi tuyến của cảm biến dựa trên lý thuyết xấp xỉ hàm một hoặc nhiều biến bằng mạng nơron với độ chính xác tủy ý. + Ứng dụng mạng nơron trong xử lý điện não. Trong điện não đồ thì sóng điện não EEG bao gồm bốn sóng là Delta, Theta, Alpha và Beta. Để nhận dạng ra bốn loại sóng đó rồi tiến hành so sánh điện não đồ của người mắc bệnh và người không mắc bệnh giúp cho quá trình chuẩn đoán bệnh được dễ dàng. Mạng nơron có thể thực hiện được việc đó. Mạng nơron Back- propagation có trễ với hàm kích hoạt Sigmoid đã được sử dụng để nhận dạng các thông số của điện não đồ. + Các mạng nơron đã được nhiều tác giả nghiên cứu ứng dụng trong xử lý chữ viết, như: nhận dạng ký tự, nhận dạng chữ viết, nhận dạng tiếng nói. + Trong các lĩnh vực nghiên cứu về hình ảnh cũng được các tác giả sử dụng mạng nơron để xử lý hình ảnh như nhận dạng, xử lý. 2.6 Kết luận Trong chương này chúng tôi đã trình bày các nét đặc thù điển hình của mạng nơron và khả năng hiệu chỉnh trọng của nó. Trong đó nổi bật lên mấy vấn đề sau: + Cơ sở nghiên cứu mạng nơron nhân tạo là quá trình phỏng cấu hình mạng của nơron sinh vật, từ cấu trúc của một nơron sinh vật đến cấu trúc mạng của nơron nhân tạo cũng như quá trình học. + Cấu trúc cơ bản của mạng nơron nhân tạo đã được nêu làm sáng tỏ nguyên lý hoạt động của mạng. Một số cấu trúc mạng truyền thẳng, mạng phản hồi cũng được giới thiệu làm cơ sở cho các nghiên cứu và lựa chọn cấu trúc mạng cho đề tài của luận văn. 55 + Nguyên lý xấp xỉ theo quan điểm lý thuyết đối với mạng nơron và một số luật học cơ bản cũng được nêu ra cho cách chỉnh trọng của mạng nơron. Từ những phân tích trên chúng tôi đề ra vấn đề nghiên cứu ứng dụng mạng nơron: - Để khắc độ tự động thiết bị đo và cảm biến - Xử lý số liệu đo để xác định giá trị thực - Chỉnh định đường đặc tính của thiết bị đo và cảm biến nằm trong giới hạn sai số cho phép. 56 Chương 3 ỨNG DỤNG MẠNG NƠRON ĐỂ KHẮC ĐỘ TỰ ĐỘNG 3.1 Cơ sở lý thuyết xử lý số liệu đo 3.1.1 Tính toán sai số ngẫu nhiên [TL3] Sai số ngẫu nhiên xuất hiện khi đo nhiều lần một điểm đo, nghĩa là khi thực hiện phép đo theo cùng một phương pháp bằng những thiết bị có độ chính xác như nhau trong cùng một điều kiện bên ngoài. Đặc tính chung nhất cho sai số ngẫu nhiên và đại lượng ngẫu nhiên bất kỳ là luật phân bố xác suất của chúng, nó được xác định bởi các giá trị có thể của sai số ngẫu nhiên và xác suất xuất hiện của chúng. Phần lớn các đại lượng đo các đại lượng vật lý có sai số ngẫu nhiên tuân theo luật phân bố chuẩn-luật Gauss. Nó dựa trên giả thiết : các sai số ngẫu nhiên có cùng giá trị (độ lớn) thì có cùng xác suất ; có giá trị nhỏ thì xác suất xuất hiện lớn và giá trị lớn thì xác suất nhỏ. Nếu sai số ngẫu nhiên vượt quá một giá trị nào đó thì xác suất xuất hiện hầu như bằng không và giá trị trung bình của tất cả sai số ngẫu nhiên sẽ tiến tới « không » khi số lượng các lần đo tăng lên đến vô cùng. Sai số ngẫu nhiên Δ của lần đo thứ i có thể xem là hiệu giữa kết quả đo x và kì vọng toán học mx của nó : Δ=x-mx (3-1) Trong đó kỳ vọng toán học của biến ngẫu nhiên X , ký hiệu mx được xác định như sau : - Nếu X là biến rời rạc có hàm xác suất p(xi) =pi, i=1,2... thì mx=∑ ∀i ii px ; - Nếu X là biến liên tục có hàm mật độ f(x), x∈R thì mx= ∫ +∞ ∞− dxxxf )( 57 Kỳ vọng chính là tổng có trọng số của tất cả các giá trị của X, hay còn là giá trị trung bình của biến ngẫu nhiên (phân biệt với trung bình cộng của các giá trị). Trong thực tế, nếu quan sát các giá trị của X nhiều lần và lấy trung bình cộng, thì khi số quan sát càng lớn số trung bình đó càng gần tới kỳ vọng toán học mx, vì vậy kỳ vọng còn được gọi là trị trung bình của biến X. Biến ngẫu nhiên X được gọi là tuân theo luật phân phối chuẩn nếu hàm mật độ phân bố xác suất của sai số ngẫu nhiên hay là hàm phân bố vi phân w( Δ ) có dạng : 2 2 2 5,0 2 )( 2 1 2 1)( ⎟⎠ ⎞⎜⎝ ⎛Δ−−− ==Δ σσ πσπσ eew xmx (3-2) ở đây Δ - sai số ngẫu nhiên tuyệt đối σ - Độ lệch bình quân phương. Phương sai D của sai số ngẫu nhiên bằng phương sai của các kết quả đo, nó được định nghĩa là kì vọng toán học của bình phương sai số ngẫu nhiên và nó đặc trưng cho sự sai lệch của kết quả đo vì có sai số ngẫu nhiên. 1σ 2σ 3σ Hình 3.1: Phân bố chuẩn của sai số ngẫu nhiên 58 D= ∫+∞ ∞− ΔΔΔ= dw )(22σ (3-3) Trong thực tế thường sử dụng khái niệm độ lệch bình quân phương D±=σ có thứ nguyên của đại lượng ngẫu nhiên. Từ công thức (3-3) và các đường cong mật độ phân bố đối với các giá trị 321 σσσ << được vẽ ở hình 3.1, rõ ràng khi σ giảm thì sẽ tăng các giá trị đo có sai số nhỏ. Tức là càng gần đến giá trị thực của đại lượng đo hay càng giảm tán xạ của kết quả đo. Xác suất rơi của sai số ngẫu nhiên vào trong một khoảng nào đó cho trước Δ 1 và Δ 2 bằng : Δ=ΔΔ= Δ− Δ Δ Δ Δ ∫ ∫ dedwP 21 2 1 2 )/(5,0 2 1)( σπσ (3-4) Xác suất rơi của kết quả đo hay là sai số ngẫu nhiên vào khoảng cho trước sẽ bằng diện tích bao bọc đường cong phân bố, trục hoành và các đường thẳng đứng giới hạn khoảng đó. Việc tính xác suất theo (3-4) gặp phải khó khăn. Vì vậy trong thực tế người ta sử dụng máy tính với các phần mềm tương ứng, hoặc dùng bảng số có sẵn. Với khái niệm hàm Láp-la-xơ : φ(x)= dte x t ∫ − 0 2 2 2 1 π (3-5) Dễ thấy hàm phân phối chuẩn của X có dạng: F(x)= dte x mt x ∫ ∞− −− 2 2 2 )( 2 1 δ πδ (3-6) Dễ dụng phép biến đổi z= δ xmt − ta có thể đưa về dạng 59 F(x)= dzedzedze xx mx zz mx z ∫∫∫ − − ∞− − − ∞− − += δδ πππ 0 2 2 0 2 2 2 2 2 1 2 1 2 1 = )( 2 1 δφ xmx −+ (3-7) Do vậy P( )21 Δ<≤Δ X = )()( 12 δφδφ xx mm −Δ−−Δ (3-8) Nếu ta đưa vào một hệ số k= σ/2,1Δ sau đó lập bảng các giá trị xác suất đáng tin P (là xác suất của khoảng sai số, hệ số tin cậy) là một hàm của hệ số k= )(kφ được tính theo biểu thức : ∫== k t dtekP 0 2 2 /2)( πφ 0≤ )(kφ ≤1 (3-9) Như vậy để tính được sai số ngẫu nhiên 122,1 Δ−Δ=Δ nhất thiết phải tìm được các giá trị σ và k. Hệ số k thường được xác định bằng xác suất đã cho của P và dạng luật phân bố xác suất của sai số ngẫu nhiên. Giá trị lý thuyết của hệ số k khi luật phân bố của sai số ngẫu nhiên là chuẩn có các giá trị sau đây tuỳ thuộc vào xác suất P (bảng 3.1) Bảng 3.1 P 0,5 0,68 0,95 0,98 0,99 0,997 k 0,667 1 2 2,33 2,58 3 Để tính sai số ngẫu nhiên người ta thường chọn : σ=Δ 2,1 nghĩa là k=1 Đôi khi ta cũng chọn σ)3/2(2,1 =Δ tức là k=0,667 đối với một số phép đo. Sai số lớn nhất có thể mắc phải là σ32,1 =Δ tức là k=3. khi đó sai số ngẫu nhiên lớn hơn 3σ chỉ chiếm 0,3% còn giá trị nhỏ hơn chiếm 99,7%. Vì vậy 60 khoảng σ3± trong trường hợp phân bố chuẩn là khoảng đủ để cho kết quả đo đáng tin cậy. Việc xuất hiện sai số lớn hơn σ3 hầu như không xảy ra. Trong kỹ thuật đo người ta còn dùng luật phân bố đều của sai số ngẫu nhiên, tức là hàm mật độ phân bố w(Δ ) không đổi trong khoảng ( Δ+Δ− , ) và bằng 0 ngoài khoảng đó. 3.1.2 Gia công kết quả đo [TL3] Khi tính toán sai số ngẫu nhiên, người ta thường sử dụng các đặc tính số của chúng, đó là kỳ vọng toán học và độ lệch bình quân phương. Các đặc trưng thống kê này đủ để đánh giá sai số của kết quả đo. Việc tính các đặc tính số này là nội dung cơ bản trong quá trình gia công kết quả đo. Để tính kỳ vọng toán học và độ lệch bình quân phương ta có số lượng các phép đo rất lớn. Tuy nhiên trong thực tế số lượng các phép đo n là có hạn, vì vậy ta chỉ tìm được ước lượng của kỳ vọng toán học và độ lệch bình quân phương. Thường các ước lượng này đối với các đại lượng đo vật lý có các tính chất cơ bản là ước lượng có căn cứ, không lệch và có hiệu quả. Nếu *ξ là ước lượng của đặc tính thống kê ξ và ta tăng số lượng N các giá trị đo và với mọi ε>0 mà ta có : ∞→ =⎥⎦ ⎤⎢⎣ ⎡ ≥− N P 0lim * εξξ (3-10) Thì ước lượng được gọi là có căn cứ. Nếu lấy trung bình ước lượng ta có : M [ ] ξξ =* (3-11) thì ước lượng *ξ được gọi là không chệch. Nếu lấy trung bình bình phương độ sai lệch (phương sai) của một ước lượng đã cho *lξ nào đó không lớn hơn trung bình bình phương độ sai lệch của bất kỳ ước lượng thứ i nào *iξ thì ước lượng đó được gọi là có hiệu quả : 61 M [ ] [ ]2*2* )()( ξξξξ −≤− il M (3-12) Giả sử ta tiến hành n phép đo cùng một giá trị X. Giá trị đáng tin nhất đại diện cho đại lượng đo X là giá trị trung bình đại số của dãy phép đo như nhau : ∑ = =+++= n i in n x n xxx X 1 21 ... (3-13) Trong đó x1, x2,…xn là kết quả của các phép đo riêng biệt. n là số các phép đo ước lượng của kì vọng toán học *xm của đại lượng đo sẽ bằng X khi số lượng phép đo tiến đến vô cùng. Nếu không có sai số hệ thống thì X sẽ là giá trị thực của đại lượng đo. Tất cả các giá trị của kết quả đo sẽ phân tán xung quanh giá trị X này. Độ lệch của kết quả đo so với giá trị trung bình (theo giá trị số và theo dấu) được xác định từ biểu thức : xi- X =vi (3-14) vi là sai số dư Sai số dư có tính chất sau : Tổng tất cả các số dư bằng 0 : 0 1 =∑ = n i iv Tổng số bình phương của chúng có giá trị nhỏ nhất : ∑ = = n i i Minv 1 2 (3-15) Theo tổng bình phương của tất cả sai số dư người ta xác định ước lượng độ lệch bình quân phương *σ , tiêu biểu cho mức độ ảnh hưởng của sai số ngẫu nhiên đến kết quả đo. 62 Theo lý thuyết xác suất việc tính *σ được thực hiện theo công thức Bessel : ∑ = −= n i i n v 1 2 * )1( σ (3-16) Ước lượng này không chệch, có căn cứ và có hiệu quả. Việc chia tổng bình phương sai số dư cho n-1 thay cho n có thể chấp nhận được vì kết quả gần bằng nhau và n càng lớn thì sự sai lệch càng nhỏ. Ước lượng độ lệch quân phương *σ đặc trưng cho độ chính xác của một dãy các phép đo và được xác định bởi một tập các điều kiện đo (các đặc tính kỹ thuật của dụng cụ đo, các đặc điểm của người làm thí nghiệm, các yếu tố bên ngoài ảnh hưởng đến phép đo). Ước lượng *σ đặc trưng cho độ phân tán của kết quả đo xung quanh giá trị trung bình đại số của nó. Vì giá trị trung bình đại số còn có một sai số ngẫu nhiên nào đó, nên ta đưa ra khái niệm ước lượng độ lệch quân phương của giá trị trung bình đại số : nnn v nn Xx n i i n i i X * 1 2 1 2 * )1()1( )( σσ =−=− − = ∑∑ == (3-17) Ước lượng này đặc trưng cho sai số kết quả đo. Ước lượng đã khảo sát trên đây được gọi là ước lượng điểm bao gồm : Xo= nX X ,, *σ . Ước lượng điểm của sai số phép đo không hoàn chỉnh bởi vì * Xσ chỉ thể hiện ở khoảng mà giá trị thực có thể nằm trong đó nhưng lại không nói gì về xác suất rơi của Xo vào khoảng đó. Ước lượng điểm chỉ cho phép làm một vài kết luận nào đó về độ chính xác của phép đo. Ước lượng khoảng là khoảng đáng tin mà trong giới hạn của khoảng đó với một xác suất nhất định ta tìm thấy giá trị thực Xo. Cho trước giá trị xác suất đáng tin P với đại lượng ngẫu nhiên có phân bố chuẩn và số lượng phép đo là vô hạn n ∞→ , thì theo bảng 3.1 ta tìm được hệ số k và như vậy tìm được khoảng đáng tin *2,1 σk=Δ 63 Khi số lượng các phép đo n ≥20 khoảng đáng tin đó có thể tính gần bằng : * 2,1 Xkσ=Δ (3-18) Trong thực tế ta không thể tiến hành nhiều phép đo được thường chỉ hạn chế trong 2≤ n <20, khi đó thì khoảng đáng tin được tính theo biểu thức: *' 2,1 Xsth σ=Δ (3-19) Ở đây hst là hệ số phân bố Student, phụ thuộc vào xác suất đã cho P và số lượng phép đo n và được xác định bằng cách tra bảng. Số liệu trong bảng này được tính theo công thức: [ ] 2/2 )/1( 1 ! 2/)1()1( )!2/();( nntnn nntS +−−= π (3-20) S(t;n) là mật độ phân bố Student ; t=( */) XoXX σ− là phân số Student ; n - số lần đo Trường hợp n ∞→ (thực tế với n≥20) thì phân bố Student sẽ tiến đến phân bố chuẩn, lúc đó hst có thể thay thế bằng hệ số k như ở biểu thức (3-18). Kết quả đo với ước lượng khoảng, nhờ có phân bố Student có thể viết dưới dạng ( ) ( )' 2,1' 2,1 Δ+<<Δ− XXX o (3-21) Từ 3-21 ta thấy rằng độ lệch giá trị trung bình đại số so với giá trị thực của đại lượng đo không vượt quá ' 2,1Δ Khi thực hiện gia công kết quả đo người ta còn xác định khái niệm sai số bình quân phương tương đối theo biểu thức sau đây : 100 * X X X σγ = (3-22) Quá trình gia công kết quả đo được biểu diễn theo sơ đồ thuật toán ở hình 3.2 64 65 Bắt đầu n phép đo xi Kì vọng toán học M[x]= X Sai số dư vi=xi- X Kiểm tra 0 1 =∑ = n i iv Tính ∑ = n i iv 1 2 Tính ∑ = −= n i i nv 1 2* )1/(σ nX / ** σσ = Cho xác suất P tìm hst Khoảng đáng tin *' 2,1 Xsth σ=Δ Kết quả đo = ' 2,1Δ±X Kết thúc Hình 3.2: Lưu đồ gia công kết quả đo 66 Quá trình gia công này có thể thực hiện trên máy tính. Kết quả cho ta giá trị thực Xo = X và khoảng đáng tin ' 2,1Δ . Kết quả đo được sau khi gia công là : ' 2,1Δ±X Nhận xét : Phương pháp xử lý thống kê cho ra kết quả nằm trong khoảng đáng tin phụ thuộc xác suất P và số lượng phép đo n. Thông thường ta sử dụng giá trị trung bình X để xây dựng đường đặc tính của cảm biến. Giá trị trung bình X mắc phải một sai số nằm trong khoảng đáng tin ' 2,1Δ so với giá trị thực X0. Do đó đường đặc tính của cảm biến nếu loại trừ được sai số hệ thống thì vẫn tồn tại một sai số ngẫu nhiên do sử dụng giá trị trung bình X gây ra. Trong luận văn này tôi đề xuất việc ứng dụng mạng nơron để xử lý số liệu đo hội tụ về giá trị thực với độ chính xác tùy ý để giảm sai số ngẫu nhiên một cách rất hiệu quả. Sử dụng giá trị đo đã được xử lý giảm sai số ngẫu nhiên bằng mạng nơron để xây dựng đường đặc tính của cảm biến bằng hàm nội suy Lagrange cho phép cảm biến đạt cấp chính xác cao. 3.2 Giảm sai số ngẫu nhiên bằng mạng nơron để khắc độ tự động thiết bị đo và cảm biến 3.2.1 Đặt vấn đề Để xây dựng đường đặc tính của cảm biến Y=f(x), trong đó x là đại lượng đo chủ yếu. Theo phương pháp tuyến tính hóa từng đoạn ta cần lấy mẫu nhiều giá trị trên toàn thang đo. Tần số lấy mẫu được tính theo công thức : M e CF T 1= với ε π 8 2=C , ε là sai số hồi phục đường cong [TL4]. Thông thường người ta tiến hành đo nhiều giá trị tại mỗi điểm lấy mẫu để giảm sai số ngẫu nhiên của phép đo. Tại mỗi điểm lấy mẫu kết quả đo sau khi gia công theo lý thuyết xác suất thống kê là : kk XX Δ± , k=1,..n và n là số điểm lấy mẫu. Điều này cho thấy giá trị trung bình kX thường dùng để khắc độ cảm biến vẫn mắc phải một sai số nằm trong khoảng kXΔ so với giá trị 67 thực Xk. Tương tự Y cũng tuân theo luật phân phối xác suất như X và độ lệch của kY so với giá trị thực Yk cũng nằm trong khoảng kYΔ . Đối với mỗi tập giá trị đo ngẫu nhiên tại mỗi điểm lấy mẫu ta có thể sử dụng mạng nơron để đưa ra được giá trị sát với giá trị thực hơn so với giá trị trung bình. Giả sử ta đã biết được giá trị thực tại mỗi điểm lấy mẫu và tập các giá trị đo ngẫu nhiên phân tán xung quanh giá trị thực theo hàm phân phối chuẩn. Hình 3.3: Các kết qủa đo phân bố ngẫu nhiên xung quanh giá trị thực Tại điểm lấy mẫu thứ k, k=1,..n, ta đo m lần để có tập giá trị đo ngẫu nhiên {x(1),x(2)....x(m) } và {y(1),y(2),...y(m) } phân bố xung quanh cặp giá trị thực (xk,yk). Các tập giá trị đo ngẫu nhiên này sẽ được đưa vào huấn luyện mạng nơron để được đầu ra là các giá trị thực Xk và Yk mong muốn. Sau khi đã có mạng nơron được huấn luyện để có đáp ứng gần với giá trị thực nhất thì với mỗi tập đầu vào số liệu đo ngẫu nhiên ta sẽ có giá trị đầu ra *kX , *kY gần với các giá trị thực Xk và Yk. Các giá trị đầu ra này có thể được dùng để khắc độ cảm biến bằng hàm nội suy Lagrange cho độ chính xác cao, (Xem mục 1.5). y x 0 ky kxXk Yk Mạng nơron W x(1) x(2) x(m) - + Xk * kX Hình 3.4 : Sơ đồ huấn luyện mạng cho giá trị ngẫu nhiên X 68 69 Hình 3.5: Sơ đồ huấn luyện mạng cho giá trị ngẫu nhiên Y. 3.2.2 Xử lý số liệu đo bằng mạng nơron để giảm sai số ngẫu nhiên Xét đường đặc tính của cảm biến có dạng y=x2. Với giải đo từ 0-xmax= 0-10 tương ứng với 0-ymax= 0-100. Thực hiện lấy mẫu tại n điểm và tại mỗi điểm lấy mẫu thứ k, k=1..n, ta đo m lần để được tập giá trị {x(1), x(2)...x(m)} và {y(1), y(2),...y(m) } phân bố xung quanh giá trị thực Xk và Yk. Mạng nơron W y(1) y(2) y(m) - + Yk * kY x y 0 1 2 3 4 5 6 7 8 9 10 0 10 20 30 40 50 60 70 80 90 100 Hình 3.6: Đặc tính cảm biến 70 Ứng với các tập giá trị đo ngẫu nhiên X tại điểm lấy mẫu thứ k, ta sử dụng mạng nơron hai lớp và thuật học lan truyền ngược để huấn luyện mạng cho ra kết quả chính xác gần với Xk. Với tập giá trị ngẫu nhiên Y ta cũng sử dụng mạng tương tự như đối với biến X, tức là dùng hai mạng nơron để huấn luyện tập các giá trị X và Y tương ứng. + Xây dựng mạng nơron: Ta sử dụng mạng nơron truyền thẳng hai lớp như sau : - Lớp vào : có m đầu vào và số nơron bằng số tự nhiên làm tròn của giá trị đúng tại điểm lấy mẫu. Trong chương trình mô phỏng Matlab số nơron được tính bằng hàm round(t(k)+1) trong đó t(k) là giá trị đúng tại điểm lấy mẫu thứ k. Hàm truyền sử dụng cho lớp này là hàm sigmoid lưỡng cực : 1 1 2)( −+= −neng . Hàm này được dùng trong Matlab với tên hàm là tansig - Lớp ra : một nơron với hàm truyền tuyến tính : nng =)( . Trong Matlab hàm này được dùng với tên purelin. - Thuật học sử dụng cho mạng : Ta dùng thuật học lan truyền ngược Levenberg-Marquardt. Algorith này là nhanh nhất trong việc dạy mạng có kích thước vừa phải và giảm bộ nhớ khi tập mẫu học quá lớn. Nếu số mẫu học tại mỗi điểm lấy mẫu càng lớn đồng thời sai số học càng nhỏ thì kết quả thu được càng chính xác. Trong trường hợp này chỉ cần dùng 200 mẫu học tại mỗi điểm lấy mẫu đủ để đạt được độ chính xác mong muốn. Với 20 điểm lấy mẫu (n=20), số giá trị đo tại mỗi điểm lấy mẫu là 10 (m=10) và số mẫu học tại mỗi điểm lấy mẫu là 200 (h=200). Mạng được huấn luyện theo thuật học lan truyền ngược, số lần lặp tối đa là 3000 và giá trị sai số học là 10-10 đủ để đạt được mục tiêu của bài toán đề ra. Sau khi huấn luyện mạng tại mỗi điểm lấy mẫu ta sẽ có một ma trận trọng số tối ưu. Ta kiểm tra lại kết quả bằng cách lấy m=10 giá trị ngẫu nhiên tại mỗi điểm cho vào mạng 71 nơron đã huấn luyện để được giá trị đầu ra *kX , *kY thoã mãn : kk XX −* < kk XX − và kk YY −* < kk YY −* với k=1,..n. Lưu đồ thuật toán quá trình học như hình 3.7 72 Bắt đầu - Nhập số điểm lấy mẫu, số giá trị ngẫu nhiên, số mẫu học, sai số cho phép - k=0 - Tạo mạng ở điểm lấy mẫu thứ k - Tạo mẫu học ở điểm lấy mẫu thứ k - Tính sai lệch trọng và cập nhật trọng theo thuật toán lan truyền ngược - Tính sai lệch Emới Emới≤ ε sai - Tạo tập giá trị ngẫu nhiên mô phỏng - Tính kết quả bằng mạng đã huấn luyện - Gán k=k+1 k> số điểm lấy mẫu sai đúng đúng - Vẽ đồ thị sai số - lưu kết quả Kết thúc Hình 3.7: Lưu đồ thuật toán qúa trình học 73 Kết quả mô phỏng: Số điểm lấy mẫu: n=20 Số giá trị đo ngẫu nhiên tại mỗi điểm lấy mẫu: m=10 Số mẫu học tại mỗi điểm lấy mẫu: h =200 - Mô phỏng đối với các giá trị ngẫu nhiên X (0≤ x ≤10) ta được kết quả với các đồ thị sai số tuyệt đối thể hiện trên hình 3.8 và hình 3.9. Bảng 3.2: Liệt kê các kết quả mô phỏng Đầu ra mạng ( *X ) Giá trị trung bình ( X ) Giá trị thực X 0,00000006060542 0,50000000002978 0,99999999992853 1,50000000000253 1,99999999973687 2,49999928158084 2,99998934352460 3,49999999830347 3,99999657058059 4,49999999989793 4,99999999995207 5,49999999831897 5,99999999986617 6,49999994654007 6,99999996939560 7,49999651946078 7,99999728632537 8,49999304449184 8,99999869244313 9,49999999125812 9,99999999828265 0,00000000000015 0,50007836778220 1,00221730947259 1,49837875201959 2,00129209733474 2,50667369385198 3,00409276259502 3,50120637498524 4,00778532001772 4,49785243112724 4,98920624163394 5,49489551061936 5,98401929137361 6,51640259371695 6,97407969009206 7,50741352837351 7,98356088223748 8,51771984922467 9,00466876286380 9,50912038327919 9,97734890122512 0,00 0,50 1,00 1,50 2,00 2,50 3,00 3,50 4,00 4,50 5,00 5,50 6,00 6,50 7,00 7,50 8,00 8,50 9,00 9,50 10,00 74 Hình 3.9 : Đồ thị sai số tuyệt đối giữa giá trị trung bình và giá trị đúng Hình 3.8 : Đồ thị sai số tuyệt đối giữa giá trị đầu ra của mạng và giá trị đúng X Sa i s o Sa i s o X 75 - Mô phỏng cho các giá trị ngẫu nhiên Y (0≤ y ≤100) ta có kết quả với các đồ thị sai số tuyệt đối thể hiện trên hình 3.10 và hình 3.11. Bảng 3.3: Liệt kê các kết quả mô phỏng Đầu ra mạng ( *Y ) Giá trị trung bình (Y ) Giá trị thực Y 0,00000000010387 0,24999999989464 1,00000005729888 2,24999931078880 4,00000000002612 6,24999999997494 8,99999999993234 12,24999576927858 15,99999273844916 20,24999935577222 24,99999880818501 30,24999547344620 35,99999830162605 42,24998820977342 48,99999932707719 56,24999920228370 63,99999461792213 72,24999346342256 80,99999841811624 90,25000023922870 99,99998768170779 0,00000000000210 0,24942875405719 0,99915747684112 2,25121691543895 4,00113099459300 6,25075112808389 8,98525138405521 12,24274314798082 16,01898970014716 20,24321902584729 24,92475117531456 30,25789879401264 36,06930622057524 42,28807302912637 49,01084163554467 56,34915904413644 63,99708132808966 72,25535966859097 80,91901315192682 90,16951604848173 99,71198783869305 0,00 0,25 1,00 2,25 4,00 6,25 9,00 12,25 16,00 20,25 25,00 30,25 36,00 42,25 49,00 56,25 64,00 72,25 81,00 90,25 100,00 76 Hình 3.10 : Đồ thị sai số tuyệt đối giữa giá trị đầu ra mạng và giá trị đúng Hình 3.11 : Đồ thị sai số tuyệt đối giữa giá trị trung bình và giá trị đúng Nhận xét: Sai số tuyệt đối lớn nhất của giá trị đầu ra của mạng nơron so với giá trị đúng của biến X là 1,1x10-5 trong khi đó sai số tuyệt đối lớn nhất giữa giá trị trung bình và giá trị đúng là:0,026. Tương tự các giá trị sai số 0 10 20 30 40 50 60 70 80 90 100 0 0.2 0.4 0.6 0.8 1 1.2 1.4 x 10 -5 0 10 20 30 40 50 60 70 80 90 100 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 Y sa i s o Y sa i s o 77 tuyệt đối tương ứng đối với biến Y là 1,2x10-5 và 0,29. Như vậy việc sử dụng mạng nơron đã cho ta kết quả chính xác hơn so với giá trị trung bình rất nhiều. Bằng cách tăng số lượng mẫu học và giảm sai số học của mạng ta có thể thu được giá trị đầu ra của mạng với độ chính xác tuỳ ý. Tức là với một sai số ε tuỳ ý cho trước ta có thể dùng nhiều mẫu học cho việc huấn luyện mạng để thoã mãn: kk XX −* <ε hoặc kk YY −* <ε với k=1,..n. Từ các kết quả đầu ra mạng sau khi đã được huấn luyện **, kk YX , có thể tiến hành khắc độ tự động bằng một số phương pháp như phương pháp tuyến tính hóa, phương pháp nội suy Lagrange hoặc sử dụng mạng nơron... Tiếp theo ta sẽ xem xét việc sử dụng phương pháp nội suy Lagrange và mạng nơron để khắc độ tự động cảm biến. 3.3 Khắc độ tự động thiết bị đo và cảm biến 3.3.1 Sử dụng hàm nội suy Lagrange để khắc độ tự động Dùng các kết quả đầu ra của mạng nơron sau khi đã được huấn luyện: **, kk YX , k=1,..n để tiến hành khắc độ tự động đặc tính của cảm biến. Trong luận văn này tôi đề xuất phương pháp dùng hàm nội suy Lagrange với lý do hàm này sẽ đi qua tất cả những điểm lấy mẫu **, kk YX . Hàm nội suy Lagrange được cho bởi phương trình: n nnnn n n n n n y xxxxxx xxxxxx y xxxxxx xxxxxx y xxxxxx xxxxxx y ))...()(( ))...()(( ...... ))...()(( ))...()(( ))...()(( ))...()(( 121 121 2 23212 31 1 13121 32 − − −−− −−−+ +−−− −−−+−−− −−−= Hàm này sẽ đi qua tất cả các điểm (Xk,Yk) , k=1,..n. Ta thay các giá trị (Xk,Yk) bằng các giá trị ( **, kk YX ) đã tìm được ở trên vào phương trình Lagrange để có đường đặc tính cần tìm của cảm biến. Đường đặc tính này đi qua tất cả những điểm lấy mẫu đã giảm sai số ngẫu nhiên bằng mạng nơron. 78 Kết quả mô phỏng: Với các giá trị mô phỏng **, kk YX đã tìm được ở bảng 3.2 và bảng 3.3 của mục 3.2.2, ta xây dựng được đường đặc tính bằng hàm nội suy Lagrange. Đường này gần trùng khít với đường cong đặc tính chuẩn y=x2 tạo thành một đường thể hiện trên hình 3.12. Đường sai số giữa đường đặc tính dùng hàm nội suy và đặc tính chuẩn y=x2 như hình 3.13. 0 1 2 3 4 5 6 7 8 9 10 0 10 20 30 40 50 60 70 80 90 100 Hình 3.12: Đường đặc tính cảm biến dùng hàm nội suy Lagrange X Y 0 1 2 3 4 5 6 7 8 9 1 0 -0 .0 8 -0 .0 7 -0 .0 6 -0 .0 5 -0 .0 4 -0 .0 3 -0 .0 2 -0 .0 1 0 0 .0 1 sa i s o X Hình 3.13: Đường sai số giữa hai đường đặc tính 79 Nhận xét: Sử dụng phương pháp nội suy Lagrange để xây dựng đường đặc tính mắc phải sai số tương đối nhỏ (trong ví dụ này sai số tương đối mắc phải là 0.006 %). Như vậy việc ứng dụng mạng nơron để xử lý số liệu đo ngẫu nhiên hội tụ về giá trị thực cho phép giảm sai số ngẫu nhiên. Từ các giá trị đã được xử lý để giảm sai số ngẫu nhiên bằng mạng nơron, có thể dùng hàm nội suy Lagrange để tiến hành khắc độ đường đặc tính của cảm biến đạt độ chính xác cao. 3.3.2 Khắc độ tự động bằng mạng nơron Phương trình đặc tính của cảm biến y=f(x), là hàm quan hệ giữa đại lượng điện y và giá trị thực của đại lượng cần đo x, được xây dựng từ n điểm lấy mẫu (Xi,Yi), i=1,..n. Đường đặc tính của cảm biến phải nằm trong giới hạn sai số 0ε nhất định tùy vào cấp chính xác của cảm biến. Gọi đặc tính chuẩn của cảm biến là y=f0(x) và trong trường hợp cảm biến có sai số hệ thống ta ký hiệu đường đặc tính thực tế là y=fs(x). Đường đặc tính thực tế cần phải nằm trong hai đường giới hạn sai số trên và dưới như biểu diễn trên hình 3.14 để đảm bảo cấp chính xác cần thiết của cảm biến. Khả năng xấp xỉ hàm phi tuyến hoặc tuyến tính với độ chính xác cao của mạng nơron có thể ứng dụng vào việc khắc độ tự động cũng như hiệu chỉnh đường đặc tính của cảm biến khi sai số hệ thống vượt quá giới hạn cho phép. Hình 3.14 : Đặc tính của cảm biến 100% Đường giới hạn dưới Đường giới hạn trên Đặc tính chuẩn y=f0(x) Đường đặc tính thực tế y=fs(x) x y 80 Mạng nơron để khắc độ tự động cảm biến có thể được huấn luyện lại để hiệu chỉnh đường đặc tính trong trường hợp sai số hệ thống vượt quá giới hạn cho phép. Ta có sơ đồ cấu trúc khắc độ tự động đặc tính của cảm biến sử dụng mạng nơron như hình 3.15. Hình 3.15: Cấu trúc cảm biến sử dụng mạng nơron để khắc độ tự động Trong trường hợp không có sai số hệ thống, mạng nơron khắc độ cảm biến cần phải được huấn luyện để xấp xỉ hàm đặc tính chuẩn x=f0(y). Khi cảm biến có sai số hệ thống vượt quá giới hạn cho phép, mạng nơron cần được huấn luyện lại để thực hiện việc bù sai số bằng cách xấp xỉ theo đường đặc tính thực tế x=fs(y). Với các giá trị mô phỏng **, kk YX đã tìm được ở bảng 3.2 và bảng 3.3 của mục 3.2.2, sử dụng mạng nơron có cấu trúc như sau để khắc độ tự động đặc tính của cảm biến : - Chọn mạng nơron truyền thẳng hai lớp. - Lớp vào : một đầu vào và số nơron bằng giá trị tự nhiên làm tròn lớn nhất của thang đo. Hàm truyền sử dụng cho lớp này là hàm sigmoid : 1 1 2)( −+= −neng hoặc neng −+= 1 1)( - Lớp ra : có một đầu ra, một nơron với hàm truyền tuyến tính : nng =)( . - Thuật học cho mạng nơron : Dùng thuật học lan truyền ngược. Lưu đồ thuật toán quá trình học như hình 3.16. CĐCH CB A/D VXL MNN Chỉ thị số Đối tượng đo x y xđo y Bắt đầu - Nhập điểm lấy mẫu - Nhập mẫu học - Nhập sai số học ε 81 Hình 3.16 : Lưu đồ thuật toán quá trình học Kết quả mô phỏng : Dựa trên các giá trị mô phỏng **, kk YX đã tìm được ở bảng 3.1 và bảng 3.2 của mục 3.2.2, sử dụng mạng nơron đã thiết kế để khắc độ đặc tính với sai số học yêu cầu là 10-6. Ta có kết quả mô phỏng thể hiện trên các hình 3.17, 3.18 và 3.19. 82 Hình 3.18: Đường đặc tính chuẩn và đặc tính khắc độ bằng mạng nơron + Điểm lấy mẫu -- Đặc tính khắc độ bằng mạng nơron Đặc tính chuẩn X Y Hình 3.17: Sai số học giảm dần khi tăng số chu kỳ học i s o 0 1 2 3 4 5 6 7 8 9 10 0 10 20 30 40 50 60 70 80 90 100 0.02 0.03 0 200 400 600 800 1000 1200 1400 1600 1800 10 -6 10 -4 10 -2 10 0 10 2 1964 Epochs Tr ai ni ng -B lu e G oa l-B la ck Performance is 9.64924e-007, Goal is 1e-006 83 Nhận xét : Mạng nơron đã thiết kế để khắc độ tự động đặc tính của cảm biến, dựa trên các giá trị lấy mẫu đã qua xử lý giảm sai số ngẫu nhiên, cho phép đạt độ chính xác cao. Với yêu cầu sai số học là 10-6, sai số tương đối quy đổi của đặc tính khắc độ bằng mạng nơron trong ví dụ này là 0,025%. Tuy nhiên trong bài toán này thì sai số khắc độ bằng mạng nơron (0,025%) vẫn lớn hơn sai số khắc độ bằng hàm Lagrange (0,006%). Như vậy việc sử dụng phương pháp nội suy Lagrange để khắc độ tự động đặc tính của thiết bị đo và cảm biến, dựa trên các giá trị lấy mẫu đã được xử lý giảm sai số ngẫu nhiên bằng mạng nơron, cho độ chính xác cao. Ngoài ra phương pháp này còn cho phép giảm khối lượng tính toán cũng như dung lượng bộ nhớ chương trình và đơn giản, dễ ứng dụng trong thực tế. 84 Chương 4 ỨNG DỤNG MẠNG NƠRON ĐỂ HIỆU CHỈNH ĐẶC TÍNH THANG ĐO CỦA CẢM BIẾN 4.1 Đặt vấn đề Đường cong đặc tính của cảm biến x=f(y) là một hàm đơn trị, giữa x và y có ánh xạ một-một. Ta có thể biểu diễn : y=f-1(x), f-1 là hàm ngược của f. Giả sử đường đặc tính thực tế có phương trình là: x=f1(y) và đường đặc tính lý thuyết của cảm biến có phương trình : x=f2(y). Ta ký hiệu x1 là giá trị đo đúng và x2 là giá trị đo thực tế của cảm biến. Sơ đồ cấu trúc và các đường đặc tính của cảm biến như hình 4.1. Hình 4.1 : Sơ đồ cấu trúc và các đường đặc tính của cảm biến Đường đặc tính thực tế có sai số so với đường đặc tính lý thuyết vượt quá giới hạn cho phép do đó kết quả đo cần phải được hiệu chỉnh theo phương trình: x1=f1(y)= f1( 12−f (x2))=ϕ(x2). CB CĐCH A/D VXL Đối tượng đo x1 y y x2 x1 =f1(y) Đặc tính thực tế Đặc tính lý thuyết x1=f1(y)= f1( 12−f (x2))=ϕ(x2) x2=f2(y) hay y= 12 −f (x2) 85 Theo lý thuyết mạng nơron ta có thể thực hiện xấp xỉ hoá hàm phi tuyến x1=ϕ(x2) với độ chính xác tuỳ ý. Hàm x1=ϕ(x2) là hàm đơn trị, đồng biến hoặc nghịch biến do đó để xấp xỉ hàm này ta có thể sử dụng mạng nơron hai lớp sigmoid/linear. Mạng này có thể xấp xỉ hầu hết các hàm phi tuyến với độ chính xác tùy ý nếu có đủ số nơron cần thiết. Ta có sơ đồ huấn luyện mạng như hình 4.3. Ở sơ đồ trên {x1} và {x2} là tập các giá trị đo của cảm biến chuẩn (xem như là tập giá trị đúng) và cảm biến sai tương ứng. Tập {x2} là tập giá trị đầu Đặc tính thực tế - (1) Đường hiệu chuẩn (Đặc tính lý thuyết) – (2) Ym= 100% Y 100% X 0 Y 2X 1X Hình 4.2: Đường cong đặc tính thực tế và lý thuyết Hình 4.3: Sơ đồ huấn luyện mạng nơron hiệu chỉnh sai số Cảm biến sai x1=ϕ(x2) x 1 {x2 } MNN W x1 ≈ ϕ(x2) Đối tượng đo Cảm biến chuẩn {x1 } + 86 vào và tập {x1} là tập giá trị đích dùng để huấn luyện mạng. Sau khi huấn luyện mạng sẽ cho ra hàm xấp xỉ mong muốn x1=ϕ(x2). Mạng nơron đặc biệt hữu hiệu trong việc hiệu chỉnh sai số hoặc tự động khắc độ của hệ thống đo gồm nhiều điểm đo. Mạng này được thiết kế với một đầu vào và nhiều đầu ra. Trong tự động khắc độ nhiều cảm biến thì mỗi đầu ra thứ i tương ứng với một chuyển đổi và hàm đặc tính của chuyển đổi thứ i: X=fi(Y). Để hiệu chỉnh sai số ta cũng sử dụng cấu trúc mạng tương tự, đầu ra thứ i tương ứng với hàm biến đổi hiệu chỉnh sai số: x1=ϕi (x2). Giả sử hệ thống đo gồm n điểm đo cùng một đại lượng, ta có mô hình mạng nơron dùng để hiệu chỉnh sai số: Tín hiệu đo thực tế của các chuyển đổi x2 được đưa vào mạng nơron để xấp xỉ hoá các hàm x1=ϕi (x2) đồng thời. Mạng nơron đã huấn luyện sẽ dùng chung cho nhiều chuyển đổi. Y X=f1 (Y). X=f2 (Y). X=fn (Y). MNN Hình 4.4: Khắc độ cảm biến bằng mạng nơron MNN x 2 x1=ϕ1 (x2). x1=ϕ2 (x2). x1=ϕn (x2). Hình 4.5: Hiệu chỉnh sai số cảm biến bằng mạng nơron 87 4.2 Hiệu chỉnh đặc tính thang đo của cảm biến sử dụng mạng nơron Xét bài toán thực tế : Đo điện áp xoay chiều từ 0-1000 V và đưa ra chỉ thị số kết quả đo đảm bảo sai số hệ thống nhỏ hơn 0.5%. Giả sử chuyển đổi chuẩn hóa có điện áp đầu vào từ 0-500V và cho điện áp đầu ra là 0-5VDC. Ta cần dùng biến áp có tỉ số biến k (k=2) để biến đổi điện áp 0-1000 V thành 0-500 V để đưa vào biến truyền. Thực tế biến áp không thể đạt cấp chính xác trên toàn thang đo, do đó tỉ số biến không phải là hằng số mà có thể là một hàm số gần bằng k. Kết quả đo tính toán theo tỉ số biến k có thể mắc phải một sai số vượt quá giới hạn cho phép. Ta có thể sử dụng mạng nơron để tiến hành hiệu chuẩn đường cong đặc tính thực tế về đường cong đặc tính lý thuyết với một độ chính xác tuỳ ý. Giả sử biến áp thực tế có quan hệ vào/ra : Uv1=0.004 2rU Với k=2 ta có đường đặc tính lý thuyết : Uv2=2Ur Hình 4.7 : Đường đặc tính lý thuyết và đặc tính thực tế 0 50 100 150 200 250 300 350 400 450 500 0 100 200 300 400 500 600 700 800 900 1000 Uv2 Uv1 Ur Đặc tính lý thuyết Đặc tính thực tế CĐCH A/D 0-5VDC 0-500V 0-1000V VXL Chỉ thị số Hình 4.6: Sơ đồ đo điện áp Uv Ur 88 Ta có hàm chuyển đổi để biến đổi đường cong lý thuyết về đường cong thực tế: Uv1=0.001 22vU với Uv2 từ 0÷1000V. Hệ thống đo với những giả thiết như trên mắc phải sai số 12.5%. Sử dụng mạng nơron được huấn luyện bởi tập các giá trị Uv1 và Uv2 tương ứng sẽ cho ra kết quả xấp xỉ hàm chuyển đổi đảm bảo sai số cho phép. + Xây dựng mạng nơron : - Lớp vào : một đầu vào và số nơron bằng giá trị tự nhiên làm tròn lớn nhất của thang đo. Hàm truyền sử dụng cho lớp này là hàm sigmoid : 1 1 2)( −+= −neng hoặc neng −+= 1 1)( - Lớp ra : có một đầu ra, một nơron với hàm truyền tuyến tính : nng =)( . - Thuật học cho mạng nơron : Dùng thuật học lan truyền ngược. Lưu đồ thuật toán quá trình học như hình 4.8 Bắt đầu - Nhập số điểm lấy mẫu - Nhập mẫu học - Nhập sai số học ε - Cập nhật trọng theo thuật toán lan truyền ngược - Tính sai lệch Emới Emới≤ ε - Mô phỏng kết quả qua mạng đã huấn luyện - Vẽ đồ thị - Lưu kết quả Kết thúc sai đúng 89 Kết quả mô phỏng : Mạng nơron được huấn luyện với yêu cầu sai số học là 10-10. Ta có kết quả sai số tương đối quy đổi giảm dần khi tăng số điểm lấy mẫu như bảng 4.1 và hình 4.9 Bảng 4.1 : Kết quả mô phỏng sai số phụ thuộc số điểm lấy mẫu Số điểm lấy mẫu N Số chu kỳ học Sai số % 5 606 1.107 6 724 0.723 7 1207 0.096 8 1800 0.029 Hình 4.8: Lưu đồ thuật toán quá trình học để hiệu chỉnh đường đặc tính 90 9 1844 0.021 10 1256 0.008 Hình 4.9 : Sai số tương đối quy đổi giảm dần khi tăng số điểm lấy mẫu Số điểm lấy mẫu cần thiết để đạt sai số yêu cầu 0.5% là N=7. Với N =7 ta có các kết quả thể hiện trên các hình 4.10, 4.11 và 4.12. Hình 4.10 : Sai số học giảm dần khi tăng số chu kỳ học Sa i s o % N 0 200 400 600 800 1000 1200 10-15 10-10 10 -5 10 0 1207 Epochs Tr ai ni ng -B lu e G oa l-B la ck Performance is 4.34745e-018, Goal is 1e-010 91 Mạng xấp xỉ gần đúng đường cong chuyển đổi Uv1=0.001 22vU tạo thành một đường cong như trên hình 4.11 sau : Hình 4.11 : Đường cong xấp xỉ hàm bằng mạng nơron và đường cong chuyển đổi Hình 4.12 : Đường sai số giữa đường cong xấp xỉ bằng mạng nơron và đường cong chuyển đổi Uv2 Uv1 0 100 200 300 400 500 600 700 800 900 1000 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 Sa i s o Uv2 + Điểm lấy mẫu -- Đường chuyển đổi Đường xấp xỉ bằng mạng nơron 92 Nhận xét : Hệ thống đo sử dụng mạng nơron để hiệu chỉnh sai số của bài toán trên đã giảm được sai số của hệ thống từ 12.5% xuống còn 0.096 % đảm bảo nằm trong giới hạn sai số 0.5% cho phép chỉ với 7 điểm lấy mẫu. Như vậy việc ứng dụng mạng nơron để hiệu chỉnh sai số của cảm biến, kể cả những cảm biến mắc phải sai số lớn, cho độ chính xác cao. 93 Chương 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI Nội dung của luận văn này là ứng dụng mạng nơron nhân tạo để khắc độ tự động thiết bị đo và cảm biến. Luận văn đã trình bày tổng quan các phương pháp khắc độ thiết bị đo và cảm biến bao gồm khắc độ dụng cụ đo tương tự, khắc độ dụng cụ đo có sử dụng vi xử lý hoặc máy tính và khắc độ chuyển đổi đo lường sơ cấp. Phần lý thuyết cơ sở của mạng nơron đã trình bày những hiểu biết về nơron sinh học đến khái niệm mạng nơron nhân tạo, nêu ra những mạng nơron nhân tạo với các thuật học làm cơ sở cho các nghiên cứu ứng dụng mạng nơron trong việc chế tạo cảm biến thông minh. Luận văn đã nghiên cứu ứng dụng mạng nơron trong việc xử lý số liệu nhằm giảm sai số ngẫu nhiên, nêu ra được số lớp của mạng, số nơron và thuật học ứng dụng cho việc xử lý số liệu đo. Từ số liệu đã được xử lý, chúng tôi đề xuất việc sử dụng hàm Lagrange để xây dựng đường đặc tính đi qua tất cả những điểm lấy mẫu. Phưong pháp này cho phép giảm khối lượng tính toán cũng như bộ nhớ chương trình và đơn giản hơn so với những phương pháp thông thường. Với những kết quả thu được có thể áp dụng vào công nghệ chế tạo cảm biến và thiết bị đo để nâng cao độ chính xác của chúng. Khắc độ tự động cảm biến dựa trên nguyên lý xấp xỉ hàm phi tuyến bằng mạng nơron đã được nghiên cứu trong luận văn cho ra những kết quả rất khả quan. Đồng thời luận văn cũng đề cập đến việc hiệu chỉnh đặc tính thang đo của cảm biến đảm bảo sai số cho phép. Mạng được sử dụng là mạng hai lớp với hàm truyền Sigmoid/linear cho phép xấp xỉ hầu hết các hàm phi tuyến với độ chính xác tùy ý. Do thời gian và điều kiện còn hạn chế nên luận văn mới dừng lại ở mức mô phỏng bằng phần mềm trên máy tính, chưa được ứng dụng trong thực tế. Nhưng cũng đã đề xuất được những hướng nghiên cứu cụ thể cho phép áp dụng vào việc chế tạo cảm biến thông minh trong tương lai không xa. 94 Ứng dụng mạng nơron để xử lý số liệu đo nhằm giảm sai số ngẫu nhiên cho phép ứng dụng không chỉ trong cảm biến thông minh mà còn có thể ứng dụng cho các thiết bị đo tương tự, thiết bị đo s

Các file đính kèm theo tài liệu này:

Nghin c7913u 7913ng d7909ng m7841ng n417ron cho kh7855c 2737897 damp.pdf