Kỹ thuật phân tích thành phần độc lập sử dụng ước lượng nguyên lý cực đại trong tách các tổ hợp tín hiệu âm thanh - Nguyễn Thị Huyền

Tài liệu Kỹ thuật phân tích thành phần độc lập sử dụng ước lượng nguyên lý cực đại trong tách các tổ hợp tín hiệu âm thanh - Nguyễn Thị Huyền: Kỹ thuật điện tử & Khoa học mỏy tớnh Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phõn tớch tớn hiệu õm thanh” 106 Kỹ thuật phân tích thành phần độc lập sử dụng ước lượng nguyên lý cực đại trong tách các tổ hợp tín hiệu âm thanh NGUYỄN THỊ HUYỀN, PHAN TRỌNG HANH Túm tắt: Phõn tớch thành phần độc lập (Independent Component Analysis - ICA) là một kỹ thuật tớnh toỏn phõn tỏch nguồn mự hiệu quả trong nhiều ứng dụng thực tế của cỏc lĩnh vực khoa học và cụng nghệ khỏc nhau. Bài bỏo nghiờn cứu cỏch ỏp dụng phương phỏp ước lượng hợp lý cực đại trong ICA, đề xuất cỏch đỏnh giỏ độ hội tụ của thuật toỏn thụng qua số lần lặp để cải thiện tốc độ của thuật toỏn. Từ khúa: ICA, Ước lượng ML. 1. MỞ ĐẦU Kỹ thuật ICA là một phỏt minh tương đối mới ở cuối thế kỷ 20 được giới thiệu lần đầu tiờn vào những năm đầu thập niờn 1980 trong khung cảnh mụ hỡnh mạng nơ ron. ICA cú thể được xem như phần mở rộng của kỹ thuật phõn tớch thành phần chủ yếu (Principal Component Analysis - ...

10 trang | Chia sẻ: quangot475 | Lượt xem: 545 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Kỹ thuật phân tích thành phần độc lập sử dụng ước lượng nguyên lý cực đại trong tách các tổ hợp tín hiệu âm thanh - Nguyễn Thị Huyền, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Kỹ thuật điện tử & Khoa học máy tính Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 106 Kü thuËt ph©n tÝch thµnh phÇn ®éc lËp sö dông íc lîng nguyªn lý cùc ®¹i trong t¸ch c¸c tæ hîp tÝn hiÖu ©m thanh NGUYỄN THỊ HUYỀN, PHAN TRỌNG HANH Tóm tắt: Phân tích thành phần độc lập (Independent Component Analysis - ICA) là một kỹ thuật tính toán phân tách nguồn mù hiệu quả trong nhiều ứng dụng thực tế của các lĩnh vực khoa học và công nghệ khác nhau. Bài báo nghiên cứu cách áp dụng phương pháp ước lượng hợp lý cực đại trong ICA, đề xuất cách đánh giá độ hội tụ của thuật toán thông qua số lần lặp để cải thiện tốc độ của thuật toán. Từ khóa: ICA, Ước lượng ML. 1. MỞ ĐẦU Kỹ thuật ICA là một phát minh tương đối mới ở cuối thế kỷ 20 được giới thiệu lần đầu tiên vào những năm đầu thập niên 1980 trong khung cảnh mô hình mạng nơ ron. ICA có thể được xem như phần mở rộng của kỹ thuật phân tích thành phần chủ yếu (Principal Component Analysis - PCA) [1]. ICA định nghĩa một mô hình sinh cho dữ liệu đa biến quan sát được, thường được cho như một cơ sở dữ liệu lớn của các mẫu. Trong mô hình, các biến dữ liệu được giả thiết là tổ hợp tuyến tính hoặc phi tuyến của một số biến ẩn chưa biết và hệ thống các tham số tổ hợp cũng chưa được biết trước. Các biến ẩn được giả thiết là không chuẩn, độc lập tương hỗ và được gọi là các thành phần độc lập của dữ liệu quan sát được. Các thành phần độc lập này cũng được gọi là các nguồn hoặc các hệ số, có thể được xác định bởi kỹ thuật ICA. Để thực hiện nhiệm vụ này, ICA giả thiết rằng tín hiệu thu được bao gồm một số thành phần độc lập thống kê với nhau và thực hiện xử lí sao cho tính độc lập của các thành phần này là cực đại. Trước đây, kỹ thuật ICA được xử lý nhờ các thuật toán cực đại hóa tính phi Gaussian hay nguyên lý thông tin cực đại, tuy nhiên, các thuật toán này có độ hội tụ khá chậm [2]. Có một cách tiếp cận cải thiện đáng kể thời gian xử lý của kỹ thuật ICA, đó là sử dụng phương pháp ước lượng hợp lý cực đại [3] trong ước lượng các tham số mô hình ICA. 2. ICA SỬ DỤNG PHƯƠNG PHÁP ƯỚC LƯỢNG HỢP LÝ CỰC ĐẠI 2.1 Mô hình ICA Mô hình ICA được đề cập trong [4]. Trong đó, giả sử ta quan sát n xáo trộn tuyến tính của n thành phần độc x1, x2, , xn, chẳng hạn như các tín hiệu thu được từ micro trong một hội nghị hoặc tổ hợp tín hiệu từ Sonar, hình ảnh,... Bỏ tham số thời gian ta có:    1 1 2 2 ...i i i in nx a s a s a s với mọi giá trị của i =1, , n (1) Với xi, s1, s2 đều là hàm của tham số thời gian t và aij, i,j = 1, , n là các hệ số thực. Định nghĩa x là véc tơ ngẫu nhiên chứa các phần tử là các tổ hợp 1 2, ,..., nx x x và s là véc tơ ngẫu nhiên với các phần tử 1 2, ,..., ns s s được gọi là các thành phần độc Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 107 lập. A gồm các phần tử aij được gọi là ma trận trộn. Tất cả các véc tơ đều được viết dưới dạng véc tơ cột. Ta có mô hình trộn: x=As Gọi ai là các véc tơ cột của ma trận A, mô hình cũng có thể được viết lại như sau: 1   n i i i sx a (2) Mô hình trên được gọi là phân tích thành phần độc lập hoặc mô hình ICA. Mô hình ICA là một mô hình sinh (generative model) với ý nghĩa là nó mô tả quá trình dữ liệu được quan sát được tạo ra bởi một quá trình tổ hợp các phần tử si như thế nào. Khởi đầu cho ICA là một giả thiết rất đơn giản rằng các phần tử si là độc lập thống kê và có phân bố phi Gaussian (nongaussian). Giả thiết thứ hai là các ma trận xáo trộn chưa biết là các ma trận vuông. Cái chúng ta quan sát được chỉ là véc tơ ngẫu nhiên x và ta cần phải ước lượng cả A và s sử dụng nó. Trong mô hình ICA, xem mỗi một tổ hợp xi cũng như mỗi một thành phần độc lập sk là một biến ngẫu nhiên thay thế cho một tín hiệu riêng. Không mất tính tổng quát, giả thiết rằng cả tín hiệu được tổ hợp và cả thành phần độc lập đều có trung bình 0. Nếu không, các biến xi quan sát được có thể luôn luôn được định tâm lại bằng cách trừ đi một lượng trung bình mẫu để đảm bảo mô hình có trung bình 0. Tức là các tổ hợp đầu vào của thuật toán 'x là kết quả tiền xử lý bởi:  ' 'E x x x (3) được xử lý trước khi kỹ thuật ICA thực hiện. Do các thành phần độc lập có trung bình 0, nên:    1E Es A x (4) Như vậy, sau khi ước lượng ma trận tổ hợp và các thành phần độc lập với các dữ liệu trung bình 0 có thể đơn giản được xây dựng lại bằng việc thêm  1 'EA x vào các thành phần độc lập trung bình 0. Với mô hình có trung bình 0 này sẽ thuận tiện cho việc sử dụng ma trận véc tơ để thay thế cho các tổng trong biểu thức trên. 2.2. Ước lượng hợp lý cực đại Ước lượng hợp lý cực đại (Maximum Likelihood- ML) [5] thực hiện ước lượng đại lượng ˆML của véc tơ tham số θ được chọn sao cho ˆ ML làm cực đại hóa hàm phân bố xác suất chung:          1 21 , 1 ,..., | ( ) ( ) ... ( )n np p x x x n p x p x p x        x (5) của các tham số x(1), x(2), , x(n) là n quan sát độc lập thống kê và có phân bố xác định. Ước lượng hợp lý cực đại tương ứng với giá trị ˆML làm cho các tham số xác định được là hợp lý nhất. Các phân bố điển hình thường có hàm mật độ xác suất có dạng mũ nên để thuận tiện hơn khi giải quyết vấn đề ước lượng hợp lý cực đại, ta thường xét hàm log hợp lý: lnp(xn| θ). Hiển nhiên là ước lượng hợp lý cực đại ˆML cũng làm cực đại hóa hàm log hợp lý. Như vậy, ước lượng hợp lý cực đại chính là nghiệm của biểu thức:   ˆ ln 0 ML np         x (6) Kỹ thuật điện tử & Khoa học máy tính Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 108 Biểu thức (6) xác định các giá trị của θ làm cực đại hóa (cực tiểu hóa) hàm hợp lý. Trong trường hợp hàm hợp lý phức tạp, phải có thêm một số cực trị địa phương, ta phải lựa chọn giá trị của ˆML tương ứng với trị tuyệt đối cực đại. Biểu thức hợp lý (6) bao gồm m biểu thức:   ˆ ˆln 0, 1,..., ML n ML i p i m          x (7) cho m tham số ước lượng , ˆ , 1,...,i ML i m  . Dựa trên các công thức toán học của phương pháp ước lượng hợp lý cực đại, xét việc áp dụng nguyên lý này vào mô hình ICA để ước lượng các véc tơ của ma trận trộn các thành phần độc lập. 2.3. Mô hình ICA theo ước lượng hợp lý cực đại Để xây dựng hàm hợp lý xét mô hình ICA không có tạp âm: x = As (8) Đặt W = (w1,, wn) T = A-1, biểu thức loga của hợp lý được cho bởi:    1 1 log log det     T n T i i t i L f t Tw x W (9) Trong đó, fi là các hàm mật độ của si (ở đây ta giả thiết là đã biết trước) và x(t), t = 1, , T là phần thực của x. Với một véc tơ ngẫu nhiên x bất kỳ có hàm mật độ xác suất px và với một ma trận W bất kỳ thì hàm mật độ của véc tơ y=Wx được xác định là px(Wx)|detW|. Nếu việc ước lượng ma trận A (hoặc W) chính xác thì y=Wx = WAs = A-1As = s tức là ta đã xác định được các thành phần độc lập. Thay thế tổng theo chỉ số t trong (9) bởi hàm kỳ vọng và chia cho T ta được:   1 log log det n T i i i L E f T          w x W (10) Hàm kỳ vọng này cho phép ta xác định được giá trị trung bình của các mẫu quan sát được. Xét các thuật toán thực hiện kỹ thuật ICA sử dụng ước lượng hợp lý cực đại: Thuật toán Bell-Sejnowski: [4] Là lớp các thuật toán đơn giản nhất để cực đại hóa hàm hợp lý trong nhóm các phương pháp gradient. Gradient thống kê của log- hàm hợp lý:       1 11 T T T TL E E T             W g Wx x W g y x W (11) g(y) = (gi(yi), , gn(yn) là một hàm véc tơ hàng bao gồm các hàm tỷ lệ gi âm của các phân bố si, được định nghĩa:   ' ' log ii i i f g f f   (12) Xét thuật toán sử dụng ước lượng ML theo biểu thức:    1T TE      W W g y x (13) Bỏ qua hàm kỳ vọng trong mỗi bước của thuật toán, tính toán cho một điểm dữ liệu được sử dụng ta có: Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 109   1T T    W W g y x (14) Thuật toán trong biểu thức (13) hội tụ rất chậm vì phải xác định nghịch đảo của ma trận W trong các bước xử lý của thuật toán. Vì thế dù thuật toán Bell- Sejnowski khá đơn giản nhưng ít được sử dụng trong thực tế. Thuật toán gradient tự nhiên: [4] Thực hiện đơn giản hóa việc xác định cực đại của hàm hợp lý. Nguyên lý của gradient tự nhiên dựa trên cấu trúc hình học của không gian tham số. Nhân vế phải của biểu thức (13) với WTW, ta có:    TE  W I g y y W (15) Thuật toán hội tụ khi   TE g y y I tức là yi và gj (yj) là không tương quan với mọi i ≠ j. Các lớp hàm g thường được chọn thuộc về tập các lớp hàm không toàn phương và trong thuật toán này ta chọn g là một hàm tanh (tanhx = sinhx/coshx), xét với các phân bố trên chuẩn (supergaussian), chọn:    2 tanhg y y   (16) Với các thành phần độc lập dưới chuẩn(subgaussian) ta lựa chọn hàm g:    tanhg y y y   (17) Việc lựa chọn sử dụng hai thành phần phi tuyến trong (16) và (17) dựa trên kết quả tính toán của mô men phi đa thức:      2tanh 1 tanhi i iE s s s   (18) Việc sử dụng mô men phi đa thức yêu cầu đầu tiên là các ước lượng của các thành phần độc lập phải có cùng tỷ lệ chính xác, ràng buộc chúng có phương sai bằng 1. Nếu dấu của mô men tính được là âm thì lựa chọn g theo (16), ngược lại thì chọn theo (17) Thuật toán được tóm tắt lại trong bảng 1. Trong bảng này, quá trình trắng hóa và chuẩn hóa dữ liệu thô được thực hiện ở bước tiền xử lý của ICA. Bảng 1. Thuật toán gradient tự nhiên thống kê trực tuyến cho ước lượng ML. STT các bước Nội dung thực hiện Bước 1 Định tâm dữ liệu. Bước 2 Khởi tạo giá trị ban đầu cho ma trận W. Chọn các giá trị ban đầu của si , i=1, , n có thể tạo một cách ngẫu nhiên hoặc sử dụng các thông tin biết trước. Chọn tốc độ học µ và µγ Bước 3 Tính toán biểu thức y = Wx Bước 4 Nếu các hàm phi tuyến là không cố định trước thì: Cập nhật        21 tanh 1 tanhi i i i is s s E y y y       (19) - Nếu si > 0 thì định nghĩa lại gi theo biểu thức (2.16), nếu không thì sử dụng biểu thức (2.17). Bước 5 Cập nhật ma trận phân tách bởi:   T     W W I g y y W (20) Bước 6 Nếu không hội tụ (   TE g y y I ) quay lại bước 3. Kỹ thuật điện tử & Khoa học máy tính Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 110 Thuật toán cố định điểm nhanh - FastICA Hàm hợp lý có thể được cực đại hóa theo thuật toán cố định điểm nhanh. Thuật toán cố định điểm thuộc lớp thuật toán FastICA [3, 4] là một phương pháp có tốc độ hội tụ rất nhanh và tin cậy để cực đại hóa tính không chuẩn sử dụng trong ước lượng ICA. Thực tế, thuật toán FastICA có thể được áp dụng trực tiếp để cực đại hóa hàm hợp lý. Bước lặp thuật toán FastICA cho dữ liệu đã thực hiện trắng hóa (norm w =1) được thực hiện như sau:      T TE g 'E g           w w z w z w w z (21) Trong đó, β được xác định:   i iE y g y   , w + là giá trị cập nhật mới của w và z là véc tơ sau thủ tục trắng hóa của x. Viết dưới dạng ma trận ta có:       diag diag Ti i E g      W W y y W (22) Với αi =    '1 T iE g w z   và y = Wz. Sau mỗi bước lặp, ma trận W cần được tham chiếu đến tập các ma trận trắng hóa để đảm bảo tính trực giao của nó:   1 2T  W WCW W (23) Với C = E{xxT} là ma trận tương quan của dữ liệu. Các bước xử lý của thuật toán FastICA được tóm tắt trong bảng 2. Trong FastICA, tốc độ hội tụ được tối ưu bởi việc lựa chọn các ma trận đường chéo diag (αi) và diag (βi). Hai ma trận này quyết định kích thước bước lặp tối ưu được sử dụng trong thuật toán. Bảng 2. Thuật toán FastICA cho ước lượng hợp lý cực đại. STT các bước Nội dung thực hiện Bước 1 Định tâm dữ liệu. Tính ma trận tương quan C=E{xxT}. Bước 2 Chọn một giá trị khởi tạo cho ma trận phân tách W (có thể chọn ngẫu nhiên). Bước 3 Thực hiện tính toán: y Wx (24)   ; 1,...,i i iE y g y i n    (25)    1 ' ; 1,...,i i iE g y i n     (26) Bước 4 Cập nhật ma trận phân tách theo:       Ti idiag diag E g      W W y y W (27) Bước 5 Giải tương quan và chuẩn hóa bởi:   1 2 ;T T     W WCW W W = W W W (28) Bước 6 Nếu không hội tụ (   TE g y y I ) quay lại bước 3. Trong FastICA, đầu ra yi là được giải tương quan và được chuẩn hóa với phương sai bằng 1 sau mỗi bước lặp. Không có các thao tác phức tạp như trong Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 111 thuật toán gradient chính vì thế tốc độ xử lý của FastICA nhanh hơn hẳn so với các phương pháp truyền thống. Như vậy trong các thuật toán xử lý kỹ thuật ICA theo nguyên lý ước lượng hợp lẽ cực đại thì thuật toán FastICA bằng thủ tục trắng hóa và giải tương quan ma trận trộn đã giảm số lượng các phần tử cần phải ước lượng của ma trận trộn từ n2 xuống còn n(n-1)/2 vì ma trận W là trực giao. Một ưu điểm khác nữa của FastICA là nó có thể ước lượng cả các thành phần độc lập có phân bố trên và dưới chuẩn. 2.4. Một số ứng dụng điển hình của ICA ICA trong lĩnh vực y tế [6]: Xét các bản ghi điện tử của các hoạt động não bộ của con người được ghi lại bởi điện não đồ MEG (Magneto Encephalo Graphy). Dữ liệu MEG bao gồm các bản ghi của các điện áp tại các vùng khác nhau của vỏ não. Các điện áp này được tạo ra bằng cách trộn một số thành phần điện áp nằm dưới hoạt động não bộ. Bài toán đặt ra là cần tìm ra các thành phần ban đầu của hoạt động não bộ nhưng lại chỉ có thể quan sát các tổ hợp của các thành phần. Để giải quyết bài toán này, sử dụng thuật toán ICA, FastICA để tách các hình ảnh độc lập trong tín hiệu MEG nhằm phát hiện ra các thành phần chuyển động của các cơ quan và đặc biệt hơn là tìm ra được các thành phần lạ là các xung bệnh lý. Như hình 1 minh họa, với thuật toán FastICA có thể tách ra được cả thành phần chuyển động của mắt và nháy mắt (IC3, IC5) cũng như các thành phần của tim, cơ và các thành phần khác từ các tín hiệu MEG, trong đó phát hiện ra IC4 thể hiện thành phần lạ của tim chính là xung bệnh lý cần khắc phục. Thuật toán FastICA là một công cụ đặc biệt phù hợp với việc phân tích tín hiệu hình ảnh MEG này bởi vì việc phát hiện chuyển động của thành phần lạ là một kỹ thuật tương hỗ và việc tìm ra chúng có thể thoải mái lựa chọn bao nhiêu thành phần độc lập (IC- Independent Component) muốn có. a) b) Hình 1. a) Các mẫu của tín hiệu MEG. b) Các thành phần độc lập được tách từ dữ liệu MEG. ICA trong khử giao thoa cho tín hiệu Sonar thụ động [7]: thực hiện phân tách thành phần độc lập đối với tín hiệu đầu ra của các hydrophone gồm ba thành phần độc lập: hai tín hiệu từ hai mục tiêu ở hướng 1900, 2050 và tín hiệu tự nhiễu nhằm giảm nhiễu giao thoa trong các hướng lân cận nhau. Xét ví dụ phân tích DEMON Kỹ thuật điện tử & Khoa học máy tính Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 112 (Demodulation of Envolope Modulation On Noise - giải điều chế đường bao trên nền nhiễu) tín hiệu thu được từ hướng 2050 bị nhiễu giao thoa bởi mục tiêu theo hướng 1900 khi không sử dụng ICA và sử dụng ICA như trong hình 2. a) b) Hình 2. Phân tích DEMON ở 2050: a) không sử dụng ICA, b) sử dụng ICA. Với việc sử dụng ICA, biên độ các thành phần tần số giao thoa FA và FC đã được giảm từ -5.9dB và -3.2dB tương ứng xuống mức -9.1dB và -4.2dB. Trên thực tế, phương pháp sử dụng ICA để giảm nhiễu giao thoa đã được ứng dụng trong Hải quân Braxin. Trong lĩnh vực viễn thông, xét ứng dụng thực tế của kỹ thuật FastICA trong tách các tổ hợp âm thanh sử dụng trong quốc phòng, an ninh. 3. THỰC HIỆN THUẬT TOÁN FASTICA 3.1. Xử lý các tổ hợp tín hiệu âm thanh Bài toán mô phỏng thực tế: Trong một phòng họp, ta có 4 micro đặt tại 4 vị trí khác nhau và thu được tổ hợp 4 tín hiệu từ 4 người nói đồng thời. Yêu cầu đặt ra là chỉ chọn lấy một tín hiệu âm thanh trong số 4 tín hiệu âm thanh ban đầu đó mới là thông tin có ích. Bốn âm thanh này chính là 4 thành phần độc lập trong bài toán ICA đang xét. Xét tổ hợp 4 tín hiệu âm thanh ban đầu có dạng sóng như trong hình 3: 0 1 2 3 4 5 6 7 8 9 x 10 4 -0.5 0 0.5 Tin hieu am thanh 1 A m p lit u d e time (ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -0.5 0 0.5 Tin hieu am thanh 2 A m p lit u d e time(ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -1 0 1 Tin hieu am thanh 3 A m p lit u d e time(ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -0.5 0 0.5 Tin hieu am thanh 4 A m p lit u d e time(ms) Hình 3. Các tín hiệu âm thanh gốc. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 113 Giả sử ma trận tổ hợp của 4 tín hiệu là: A = [1 0.75 0.8 0.6; 0.75 1 0.8 0.75; 0.6 0.7 1 0.6; 0.5 0.7 0.8 1] Việc lựa chọn ma trận tổ hợp là hoàn toàn ngẫu nhiên, để phù hợp hơn với thực tế, ta giả thiết rằng mỗi một micro được đặt gần nhất với một tín hiệu tương ứng khi đó tỷ lệ trộn của tín hiệu này là 1. Như vậy, ta có 4 tổ tín hiệu sau trộn tương ứng với 4 tổ hợp ta thu được sau micro như thể hiện trong hình 4. Sử dụng thuật toán FastICA theo phương pháp ước lượng hợp lẽ cực đại ta thu được 4 tín hiệu có dạng như nhể hiện trong hình 5. So sánh giữa tín hiệu sau khi tách và tín hiệu ban đầu ta thấy thuật toán đã thực hiện tách được 4 âm thanh từ tổ hợp trộn ngẫu nhiên của 4 âm thanh gốc. Mặc dù biên độ của tín hiệu là không xác định được tuy nhiên dạng sóng của tín hiệu sau khi tách là hoán toàn trùng khớp với dạng sóng của tín hiệu ban đầu. 0 1 2 3 4 5 6 7 8 9 x 10 4 -1 0 1 Tin hieu tron 1 A m p lit u d e time (ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -0.5 0 0.5 Tin hieu tron 2 A m p lit u d e time(ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -1 0 1 Tin hieu tron 3 A m p lit u d e time(ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -0.5 0 0.5 Tin hieu tron 4 A m p lit u d e time(ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -2 0 2 Tin hieu sau tach 1 A m p lit u d e time (ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -2 0 2 Tin hieu sau tach 2 A m p lit u d e time(ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -2 0 2 Tin sau tach 3 A m p lit u d e time(ms) 0 1 2 3 4 5 6 7 8 9 x 10 4 -2 0 2 Tin sau tach 4 A m p lit u d e time(ms) Hình 4. Các tín hiệu âm thanh sau khi trộn Hình 5. Các tín hiệu âm (tín hiệu thu được trong thực tế). thanh sau khi tách. 3.2. Đánh giá chất lượng thuật toán Việc đánh giá chất lượng thuật toán thông qua số bước lặp để thuật toán hội tụ là việc hết sức cần thiết bởi nó quyết định đến tốc độ xử lý và khả năng thực hiện của thuật toán theo thời gian thực. Để đo tính hiệu quả của thuật toán, bài báo đề xuất phương pháp đánh giá thuật toán dựa trên ma trận ước lượng theo chỉ số thực hiện (PI- Performance Index) được định nghĩa theo biểu thức:   1 1 1 1 1 1 1 max max n n n ik ki i k kj ij j ji g g PI n n g g                              (29) Ở đây gij là thành phần (i,j) của ma trận G = W -1.A. và maxj|gij| biểu diễn cho giá trị lớn nhất trong số các phần tử của vector hàng thứ i của G, maxj|gji| biểu diễn cho giá trị lớn nhất trong số các phần tử của vector cột thứ i của G. Khi việc tách tín hiệu hoàn chỉnh đạt được, chỉ số hiệu quả bằng không (đồng nghĩa với việc ma trận ước lượng W là hoàn toàn khớp với ma trận tổ hợp A). Thực tế, giá trị chỉ số hiệu quả khoảng 10-2 đã là thực hiện khá tốt. Kỹ thuật điện tử & Khoa học máy tính Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 114 So sánh PI theo số lần lặp theo hình 6. 0 20 40 60 80 100 120 140 160 180 200 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 So lan lap C hi s o th uc h ie n P I Hình 6. Chất lượng thuật toán cải thiện qua số lần lặp. Nhận xét: Số lần lặp của thuật toán càng lớn thì chỉ số thực hiện PI càng thấp, chứng tỏ chất lượng của thuật toán được cải thiện đáng kể sau khi tăng số lần lặp. Tuy nhiên khi lần lặp lớn hơn 150 lần thì thuật toán hội tụ có nghĩa là dù có tăng số lần lặp lên nữa thì chất lượng tín hiệu đầu ra vẫn không cải thiện thêm. Vì thế, tùy số lượng tổ hợp tín hiệu đầu vào mà ta có thể lựa chọn số lần lặp cho phù hợp để đảm bảo tốc độ và thời gian xử lý của thuật toán. 4. KẾT LUẬN Bài báo đã nghiên cứu kỹ thuật ICA theo theo phương pháp ước lượng hợp lý cực đại, mô phỏng thuật toán bằng chương trình Matlab với tổ hợp 4 âm thanh. Đề xuất cách đánh giá chất lượng thuật toán qua số lần lặp thông qua hệ số thực hiện được xây dựng trên ma trận tổng thể G là tích của ma trận tổ hợp (A) và nghịch đảo ma trận ước lượng của nó (W-1). Rút ra kết luận: kỹ thuật ICA sử dụng ước lượng hợp lý cực đại là một phương pháp phân tách các nguồn tín hiệu mù cho độ tin cậy cao và thời gian xử lý nhanh nhất trong nhóm các phương pháp phân tách nguồn mù áp dụng cho xử lý các tổ hợp âm thanh, hình ảnh, sử dụng trong lĩnh vực viễn thông, xử lý ảnh TÀI LIỆU THAM KHẢO [1]. Bell, AJ, & Sejnowski. “An information-maximization approach to blind separation and blind deconvolution”. “Neural computation” (1995). [2]. Lee, London, Kluwer Academic Press. “Independent component analysis” (2001). [3]. A.Hyvarinen, Oja.“A fast ﬁxed-point algorithm for independent component analysis”. “Neural computation” (1997). Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 115 [4]. A.Hyvarinen, Juha-Karhunen, Erkki - Oja. “Independent Component Analysis” (2001), pages 182-188. [5]. Cardoso, J-F. “Infomax and maximum likelihood for blind source separation”. Ieee signal processing letters (1997). [6]. J. L. Contreras-Vidal and S. E. Kerick, “Independent component analysis of dynamic brain responses during visuomotor adaptation” (2004). [7]. Natanael Nunes de Moura, Eduardo Simas Filho and Joso Manoel de Seixas “Independent Component Analysis for Passive Sonar Signal Processing” (2009). ABSTRACT INDEPENDENT COMPONENT ANALYSIS TECHNIQUE USING MAXIMUM LIKELIHOOD ESTIMATION IN ANALIZING MIXED AUDIO SIGNALS Independent Component Analysis (ICA) is a computationally efficient blind source separation technique for many practical applications in various fields of science and engineering. This paper studies the method of applying maximum likelihood estimation on ICA and propose evaluating the convergence of the algorithm via iteration number to improve the algorithm’s speed. Keywords: ICA, ML estimation. Nhận bài ngày 20 tháng 07 năm 2014 Hoàn thiện ngày 18 tháng 08 năm 2014 Chấp nhận đăng ngày 15 tháng 09 năm 2014 Địa chỉ: * Học viện Kỹ thuật Quân sự. Email: nguyenhuyenhvktqs@gmail.com. Phone: 0912959582 Email : tronghanhmai@yahoo.com

Các file đính kèm theo tài liệu này:

14_nguyen_thi_huyen_106_115_9342_2149256.pdf