Luận văn Ma trận xác định dương: bài toán bảo toàn tuyến tính và tính đơn điệu của trung bình nhân

Tài liệu Luận văn Ma trận xác định dương: bài toán bảo toàn tuyến tính và tính đơn điệu của trung bình nhân: ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC SƯ PHẠM ? ? ?F ? ?? HUỲNH ĐÌNH TUÂN MA TRẬN XÁC ĐỊNH DƯƠNG: BÀI TOÁN BẢO TOÀN TUYẾN TÍNH VÀ TÍNH ĐƠN ĐIỆU CỦA TRUNG BÌNH NHÂN KHOÁ LUẬN TỐT NGHIỆP Chuyên ngành : Đại số Cán bộ hướng dẫn PGS. TS. ĐOÀN THẾ HIẾU Huế, tháng 5 năm 2011 i LỜI CẢM ƠN Khóa luận này được hoàn thành dưới sự hướng dẫn nhiệt tình, chu đáo của PGS. TS. Đoàn Thế Hiếu. Tôi xin phép được gửi đến Thầy sự kính trọng và lòng biết ơn sâu sắc về sự tận tâm của Thầy đối với bản thân tôi không những trong thời gian làm khóa luận mà còn trong suốt quá trình học tập. Đồng thời, tôi xin được bày tỏ nguyện vọng tiếp tục tìm hiểu toán học dưới sự hướng dẫn của Thầy. Tôi cũng xin phép được gửi lời cám ơn chân thành đến quý Thầy cô đã giảng dạy lớp Toán B trường ĐHSP Huế cũng như toàn thể quý thầy cô Khoa Toán trường ĐHSP Huế, những người đã cho tôi kiến thức, quan tâm động viên, nhiệt tình giúp đỡ tôi trong suốt quá trình học tập cũng như trong thời gian thực hiện đề tài. Cuối cù...

60 trang | Chia sẻ: hunglv | Lượt xem: 4042 | Lượt tải: 1Free

Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Ma trận xác định dương: bài toán bảo toàn tuyến tính và tính đơn điệu của trung bình nhân, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC SƯ PHẠM ? ? ?F ? ?? HUỲNH ĐÌNH TUÂN MA TRẬN XÁC ĐỊNH DƯƠNG: BÀI TOÁN BẢO TOÀN TUYẾN TÍNH VÀ TÍNH ĐƠN ĐIỆU CỦA TRUNG BÌNH NHÂN KHOÁ LUẬN TỐT NGHIỆP Chuyên ngành : Đại số Cán bộ hướng dẫn PGS. TS. ĐOÀN THẾ HIẾU Huế, tháng 5 năm 2011 i LỜI CẢM ƠN Khóa luận này được hoàn thành dưới sự hướng dẫn nhiệt tình, chu đáo của PGS. TS. Đoàn Thế Hiếu. Tôi xin phép được gửi đến Thầy sự kính trọng và lòng biết ơn sâu sắc về sự tận tâm của Thầy đối với bản thân tôi không những trong thời gian làm khóa luận mà còn trong suốt quá trình học tập. Đồng thời, tôi xin được bày tỏ nguyện vọng tiếp tục tìm hiểu toán học dưới sự hướng dẫn của Thầy. Tôi cũng xin phép được gửi lời cám ơn chân thành đến quý Thầy cô đã giảng dạy lớp Toán B trường ĐHSP Huế cũng như toàn thể quý thầy cô Khoa Toán trường ĐHSP Huế, những người đã cho tôi kiến thức, quan tâm động viên, nhiệt tình giúp đỡ tôi trong suốt quá trình học tập cũng như trong thời gian thực hiện đề tài. Cuối cùng, tôi xin phép được gửi lời cảm ơn đến những người thân, bạn bè đã quan tâm động viên giúp đỡ tôi trong suốt quãng đường học tập vừa qua. Huế, tháng 5 năm 2011 Huỳnh Đình Tuân ii MỤC LỤC Trang phụ bìa i Lời cảm ơn ii MỤC LỤC 1 MỞ ĐẦU 3 CÁC KÝ HIỆU SỬ DỤNG TRONG KHÓA LUẬN 5 1 MA TRẬN XÁC ĐỊNH DƯƠNG 6 1.1 Ma trận đối xứng - ma trận Hermite - ma trận trực giao - ma trận Unita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2 Ma trận nửa xác định dương - ma trận xác định dương . . . . . . . 8 1.3 Một số phép toán trên không gian các ma trận . . . . . . . . . . . . 12 1.4 Căn bậc hai của ma trận . . . . . . . . . . . . . . . . . . . . . . . . 14 1.5 Một số bất đẳng thức ma trận và các tính chất liên quan đến ma trận khối . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.6 Hàm lồi, lõm, đơn điệu trên tập các ma trận xác định dương . . . . 18 1.7 Phương trình ma trận . . . . . . . . . . . . . . . . . . . . . . . . . 19 2 BÀI TOÁN BẢO TOÀN TUYẾN TÍNH 21 2.1 Bài toán bảo toàn tuyến tính . . . . . . . . . . . . . . . . . . . . . 21 2.2 Bảo toàn tuyến tính hạng của ma trận . . . . . . . . . . . . . . . . 22 2.3 Bài toán bảo toàn định thức . . . . . . . . . . . . . . . . . . . . . . 23 2.4 Bảo toàn tuyến tính chuẩn và tập các ma trận Unita . . . . . . . . 24 2.5 Bảo toàn tuyến tính miền số học và bán kính số học . . . . . . . . . 25 2.6 Bài toán bảo toàn tuyến tính chỉ số quán tính . . . . . . . . . . . . 26 2.7 Toán tử tuyến tính xác định dương . . . . . . . . . . . . . . . . . . 28 2.8 Bài toán bảo toàn tuyến tính chỉ số (n, 0, 0) . . . . . . . . . . . . . 29 2.9 Một số kết quả mới . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1 3 TRUNG BÌNH NHÂN CỦA CÁC MA TRẬN 37 3.1 Trung bình của hai ma trận xác định dương và một số tính chất . . 37 3.2 Một số biểu diễn của trung bình nhân hai ma trận . . . . . . . . . . 40 3.3 Mở rộng khái niệm trung bình nhân bằng phương pháp quy nạp . . 43 3.4 Mở rộng khái niệm trung bình nhân dựa vào hình học Riemann . . 49 KẾT LUẬN 56 TÀI LIỆU THAM KHẢO 57 2 MỞ ĐẦU Lý thuyết về ma trận xác định dương chiếm một vị trí quan trọng trong đại số tuyến tính. Có nhiều định lý liên quan đến ma trận xác định dương đơn giản song có ứng dụng lớn. Hiện nay, còn rất nhiều bài toán mở liên quan mật thiết đến ma trận xác định dương. Các bài toán bảo toàn tuyến tính là một hướng nghiên cứu sôi động trong lý thuyết ma trận và lý thuyết toán tử. Các bài toán này đề cập đến các toán tử bảo toàn một hàm, một tập con, một quan hệ nào đó trên không gian các ma trận. Hiện nay, lĩnh vực này thu hút sự quan tâm của nhiều nhà toán học. Dù đã có hàng trăm công trình trong lĩnh vực này nhưng vẫn còn rất nhiều vấn đề mở cần được nghiên cứu, đặc biệt là bài toán bảo toàn tuyến tính chỉ số quán tính. Cho đến nay, việc xác định tất cả các toán tử tuyến tính bảo toàn chỉ số (n, 0, 0), tức bảo toàn tập các ma trận xác định dương vẫn nằm ngoài mọi hướng tiếp cận. Trung bình ma trận là sự mở rộng khái niệm trung bình trên tập hợp các số dương sang tập hợp các ma trận xác định dương. Đối với trung bình cộng và trung bình điều hòa, việc mở rộng là đơn giản. Việc xây dựng khái niệm trung bình nhân cho hai ma trận xác định dương đã được thực hiện. Khi người ta tìm cách mở rộng khái niệm trung bình nhân cho trường hợp n ma trận xác định dương thì có nhiều khó khăn nảy sinh. Hiện nay, có hai hướng tiếp cận chủ yếu đối với vấn đề này. Nếu dựa vào phương pháp quy nạp, khái niệm trung bình nhân đưa ra quá phức tạp. Một hướng khác đơn giản hơn là dựa vào hình học Riemann. Tuy vậy, đối với phương pháp này, việc chứng minh tính đơn điệu của trung bình nhân vẫn còn là một vấn đề mở. Khóa luận nhằm mục tiêu tìm hiểu, hệ thống hóa các tính chất của ma trận xác định dương, tổng quan các kết quả đã được nghiên cứu về bài toán bảo toàn tuyến tính, các hướng xây dựng khái niệm trung bình nhân ma trận, phát triển một số kết quả đã có về bài toán bảo toàn tập các ma trận xác định dương. Nội dung của khóa luận chia làm ba chương. Chương một hệ thống hóa các kiến thức về ma trận xác định dương, trình bày một số kiến thức cần thiết cho các chương tiếp theo. Chương hai tổng quan một số kết quả đạt được trong lĩnh vực bảo toàn tuyến 3 tính, các kết quả đạt được trong các đề tài khoa học đã thực hiện. Chương này cũng trình bày một số kết quả mới về bài toán bảo toàn tính xác định dương. Chương ba giới thiệu khái niệm trung bình ma trận, một số loại trung bình và hai phương pháp xây dựng khái niệm trung bình nhân ma trận tổng quát: phương pháp quy nạp và phương pháp dựa vào hình học Riemann. 4 CÁC KÝ HIỆU SỬ DỤNG TRONG KHÓA LUẬN At Chuyển vị của ma trận A A∗ Chuyển vị liên hợp của ma trận A Matm×n(K) Không gian các ma trận cỡ m× n trên trường K Matn(K) Không gian các ma trận vuông cấp n trên trường K Sn(R) Không gian các ma trận đối xứng thực cấp n Hn Không gian các ma trận Hermite cấp n Sn Không gian Sn(R) hoặc không gian Hn Un Không gian các ma trận tam giác trên cấp n GLn(K) Nhóm các ma trận khả nghịch cấp n trên trường K với phép nhân ma trận On Nhóm các ma trận trực giao cấp n Un Nhóm các ma trận Unita cấp n diag(a1, · · · , an) Ma trận đường chéo với các phần từ a1, · · · , an trên đường chéo chính ‖.‖2 Chuẩn phổ ‖.‖∗ Chuẩn vết ‖.‖F Chuẩn Frobenius S(A,B) Tích đối xứng của hai ma trận A,B A⊗B Tích Tensor (tích Kronecker) của hai ma trận A,B A ◦B Tích Hadamard (tích Schur) của hai ma trận A,B A]B Trung bình nhân của hai ma trận A,B logA Logarit tự nhiên của ma trận A expA Lũy thừa cơ số e của ma trận A A ∼= B A và B tương đương Unita A ∼ B A và B tương đẳng 5 Chương 1 MA TRẬN XÁC ĐỊNH DƯƠNG Trong chương này, chúng tôi nêu định nghĩa ma trận đối xứng, ma trận Hermite, ma trận nửa xác định dương, ma trận xác định dương và một số tính chất cơ bản. Chúng tôi tập trung mô tả một số tính chất đặc trưng của ma trận xác định dương và một số kiến thức liên quan đến ma trận xác định dương như: căn bậc hai của ma trận, phương trình ma trận, bất đẳng thức ma trận, hàm lồi, lõm, đơn điệu trên tập các ma trận xác định dương. Chúng tôi cũng giới thiệu tích đối xứng, tích Schur, tích Kronecker và các tính chất liên quan đến ma trận xác định dương của chúng. 1.1 Ma trận đối xứng - ma trận Hermite - ma trận trực giao - ma trận Unita Ma trận vuông A trên trường số thực R được gọi là đối xứng nếu At = A. Ta đã biết tập hợp Sn(R) các ma trận đối xứng thực cấp n là không gian con của không gian các ma trận vuông cấp n trên trường số thực Matn(R). Tương ứng với khái niệm ma trận đối xứng trên trường số thực là khái niệm ma trận Hermite trên trường số phức. Ma trận vuông A trên trường số phức C được gọi là Hermite nếu A∗ = A, ở đây ký hiệu A∗ để chỉ chuyển vị liên hợp của ma trận A. Tương tự tập hợp Sn(R), tập hợp Hn các ma trận Hermite cấp n tạo thành một không gian con của không gian các ma trận vuông cấp n trên trường số phức Matn(C). Các ma trận đối xứng và ma trận Hermite có một tính chất chung rất quan trọng, mọi giá trị riêng của chúng đều là các số thực. Từ nay trở đi, ta sử dụng ký hiệu Sn để chỉ một trong hai không gian Sn(R) hoặc Hn. Để khảo sát các tính chất của ma trận đối xứng và ma trận Hermite cũng như một số tính chất khác, ta cần tìm hiểu thêm về ma trận trực giao và ma trận Unita. Ma trận Q thuộc Matn(R) được gọi là trực giao nếu QtQ = In. Tập hợp On 6 các ma trận trực giao cấp n trên trường số thực là nhóm con của nhóm GLn(R) các ma trận thực khả nghịch cấp n với phép nhân ma trận. Tương ứng với khái niệm ma trận trực giao trên trường số thực là khái niệm ma trận Unita trên trường số phức. Ma trận U thuộc Matn(C) được gọi là Unita nếu U∗U = In. Cũng vậy, tập hợp Un các ma trận Unita cấp n trên trường số phức là nhóm con của nhóm GLn(C) các ma trận phức khả nghịch cấp n với phép nhân ma trận. Liên quan đến khái niệm ma trận trực giao và ma trận Unita, hai định lý về chéo hóa ma trận dưới đây đóng vai trò quan trọng. Định lý 1.1.1. [10] (Định lý phân tích SVD đối với không gian phức) Cho ma trận A ∈ Matm×n(C). Khi đó tồn tại các ma trận Unita U ∈ Matm(C), V ∈ Matn(C) và ma trận S ∈ Matm×n(C), S = diag(σ1, · · · , σp), σ1 ≥ σ2 ≥ · · · ≥ σp, p = min{m,n} sao cho A = USV . Định lý 1.1.2. [10] (Định lý phân tích SVD đối với không gian thực) Cho ma trận A ∈ Matm×n(R). Khi đó tồn tại các ma trận trực giao P ∈ Matm(R), Q ∈ Matn(R) và ma trận S ∈ Matm×n(R) S = diag(σ1, · · · , σp), σ1 ≥ σ2 ≥ · · · ≥ σp, p = min{m,n} sao cho A = PSQ. Các phần tử trên đường chéo của ma trận S trong hai định lý trên được gọi là các giá trị kỳ dị của A. Đây có thể xem là một sự mở rộng khái niệm giá trị riêng của các ma trận vuông. Trên các không gian Sn(R) và Hn, các định lý về chéo hóa ma trận dưới đây sẽ được sử dụng nhiều trong khuôn khổ khóa luận này. Định lý 1.1.3. [10] Cho A ∈ Sn(R). Khi đó tồn tại ma trận trực giao Q ∈ Matn(R) sao cho QtAQ là ma trận chéo. Định lý 1.1.4. [10] Cho A ∈ Hn. Khi đó tồn tại ma trận Unita U ∈ Matn(C) sao cho U∗AU là ma trận chéo. Dưới đây là một vài tính chất của các ma trận thuộc Sn thu được từ các định lý trên và chúng sẽ được nhắc đến trong các phần tiếp theo. Định lý 1.1.5. [10] Cho A ∈ Sn(R). Khi đó rank(A) = r khi và chỉ khi A =∑r i=1 kixix t i, trong đó ki ∈ {−1, 1} ∀ i = 1, 2, · · · , r và x1, · · · , xr là các vector độc lập tuyến tính. Chứng minh. Theo Định lý 1.1.3 tồn tại ma trận trực giao Q sao cho QtAQ = D = diag(λ1, · · · , λn), trong đó λ1, · · · , λn là các giá trị riêng của A. Do rank(A) = r 7 nên tồn tại đúng r giá trị riêng của A khác không. Không mất tính tổng quát, giả sử λ1, · · · , λr là các giá trị riêng khác 0 của A, lúc đó A = QDQt = r∑ i=1 Q(λieie T i )Q t = r∑ i=1 sign(λi)( √ |λi|Qei)(( √ |λi|Qei)t. Đặt xi = √|λi|Qei, ki = sign(λi), ta có ngay A = ∑ri=1 kixixti. Do Q khả nghịch và e1, · · · , er độc lập tuyến tính nên x1, · · · , xr độc lập tuyến tính. Đảo lại, giả sử A = ∑r i=1 kixix t i, trong đó ki ∈ {−1, 1} ∀i = 1, 2, · · · , r và x1, · · · , xr là các vector độc lập tuyến tính. Bổ sung vào hệ {x1, · · · , xr} các vector xr+1, · · · , xn để được cơ sở của Rn. Đặt P = [x1 x2 · · ·xn], ở đây các vector xi được viết theo cột, ta có P khả nghịch và A = Pdiag(k1, · · · , kr, 0, · · · , 0)P t. Vậy rank(A) = r. Định lý 1.1.6. Giả sử A ∈ Sn(R), đặt W (A) = {xtAx, ||x|| = 1}, khi đó ta có W (A) = [λmin(A), λmax(A)]. Chứng minh. Giả sử λmin(A) = λ1 ≤ · · · ≤ λn = λmax(A) là dãy không giảm các giá trị riêng của A. Khi đó theo Định lý 1.1.3 tồn tại ma trận trực giao Q sao cho QtAQ = D = diag(λ1, · · · , λn). Đặt y = Qtx = (y1 · · · yn)t, khi đó y21 + · · · + y2n = yty = (Qtx)t(Qtx) = xt(QQt)x = xtx = 1. Mặc khác ta có xtAx = xtQDQtx = ytDy = λ1y21 + · · · + λny2n. Từ đây ta suy ra ngay điều cần chứng minh. Nhận xét 1.1.7. Nếu ta thay các cụm từ "ma trận trực giao", "chuyển vị" trong các phát biểu trên không gian thực bởi các cụm từ "ma trận Unita", "chuyển vị liên hợp" đối với không gian phức thì các tính chất trên vẫn còn đúng trên không gian Hn. Trong phần lớn các trường hợp thì các kết quả trên hai không gian này là tương tự nhau. Do vậy trong các phát biểu và chứng minh, thông thường ta chỉ xét trên không gian Sn(R) hoặc Hn mà thôi. Đối với các trường hợp có sự khác biệt giữa hai không gian này, ta sẽ nói rõ cụ thể. 1.2 Ma trận nửa xác định dương - ma trận xác định dương Định nghĩa 1.2.1. Giả sử A là ma trận trên không gian Sn. 1. A được gọi là nửa xác định dương trên Sn(R) nếu xtAx ≥ 0 ∀ x ∈ Rn. 8 2. A được gọi là xác định dương trên Sn(R) nếu A là nửa xác định dương và xtAx = 0 ⇐⇒ x = 0. 3. A được gọi là nửa xác định dương trên Hn nếu x∗Ax ≥ 0 ∀ x ∈ Cn. 4. A được gọi là xác định dương trên Hn nếu A là nửa xác định dương và x∗Ax = 0 ⇐⇒ x = 0. 5. Ta dùng ký hiệu A ≥ 0 (A > 0) để chỉ ma trận A là nửa xác định dương (xác định dương). 6. A được gọi là nửa xác định âm (xác định âm) nếu −A là nửa xác định dương (xác định dương), kí hiệu A ≤ 0 (A < 0). 7. Nếu A−B > 0 (A−B ≥ 0) thì ta viết A > B (A ≥ B) hay B < A (B ≤ A). 8. Tập hợp các ma trận nửa xác định dương cấp n được ký hiệu là Pn, tập hợp các ma trận xác định dương cấp n được ký hiệu là Pn. Nhận xét 1.2.1. Từ định nghĩa ta thấy ngay một số tính chất sau 1. Quan hệ A ≥ B ⇐⇒ A−B ≥ 0 là quan hệ thứ tự trên Sn. 2. Pn là một nón lồi trong không gian Sn. 3. Pn là một nón lồi và là một tập mở trong không gian Sn. Tiếp theo ta tìm hiểu một số dấu hiệu nhận biết ma trận nửa xác định dương - ma trận xác định dương. Để thuận tiện ta sẽ làm việc trên trên không gian Sn(R). Ta đã biết một số dấu hiệu quen thuộc sau để nhận biết các ma trận nửa xác định dương - xác định dương: 1. A > 0 khi và chỉ khi A ≥ 0 và det(A) 6= 0. 2. A ≥ 0 (> 0) khi và chỉ khi các giá trị riêng của A không âm (dương). 3. A ≥ 0 (> 0) khi và chỉ khi các định thức con chính của A không âm (dương). Dưới đây là một số dấu hiệu nhận biết các ma trận nửa xác định dương khi đã biết hạng của chúng. Định lý 1.2.2. [4] Cho A ≥ 0. Khi đó rank(A) = r khi và chỉ khi A = ∑ri=1 xixti, trong đó x1, · · · , xr là các vector độc lập tuyến tính. 9 Chứng minh. Suy ra ngay từ Định lý 1.1.5 Định lý 1.2.3. [4] Cho A ≥ 0 và rank(A) = r. Khi đó tồn tại ma trận khả nghịch W với A = W ( ∑r i=1 Eii)W t, trong đó Eii = eieti với mọi i = 1, 2 · · · , n. Chứng minh. Theo Định lý 1.1.3, tồn tại ma trận trực giao Q sao cho QtAQ = D = diag(λ1, · · · , λr, 0, · · · , 0) trong đó λi 6= 0 với mọi i = 1, 2, · · · , r. Do A là ma trận nửa xác định dương nên λi > 0 với mọi i = 1, 2, · · · , r. Ta có A = QDQt = Q( ∑r i=1 λiEii)Q t. Đặt K = diag( √ λ1, · · · , √ λr, 1, · · · , 1), thế thì K khả nghịch và A = QK( ∑r i=1 Eii)KQ t = W ( ∑r i=1 Eii)W t với W = QK là ma trận khả nghịch. Hệ quả 1.2.4. [4] Nếu A ≥ 0 thì tồn tại ma trận W sao cho A = WW t. Nếu A xác định dương thì W khả nghịch. Hơn thế nữa, người ta còn chứng minh được nếu A ≥ 0 thì có thể biểu diễn A = UU t, trong đó U là ma trận nửa tam giác trên và diag(U) ≥ 0. Biểu diễn này được gọi là phân tích Cholesky của ma trận A. Định lý 1.2.5. [4] A = (aij)n×n nửa xác định dương khi và chỉ khi tồn tại các vector x1, · · · , xn sao cho aij = 〈xi, xj〉 ∀ i, j = 1, 2, · · · , n. A > 0 khi và chỉ khi {x1, · · · , xn} độc lập tuyến tính. Chứng minh. Giả sử có các vector x1, · · · , xn sao cho aij = 〈xi, xj〉 ∀ i, j = 1, 2, · · · , n. Đặt P = [x1, · · · , xn] ta có A = P tP , do đó A ≥ 0. Đảo lại, nếu A ≥ 0, ta viết A = QtDQ, trong đó Q là ma trận trực giao và D = diag(λ1, · · · , λn), ở đây λi > 0, i = 1, · · · , n. Đặt A12 = Qtdiag( √ λ1, · · · , √ λn)Q, xj = A 1 2ej, j = 1, · · · , n ta có aij = 〈ei, Aej〉 = 〈A12ei, A12ej〉 = 〈xi, xj〉. Trong phần tiếp theo, ta tìm hiểu một số tính chất về chéo hóa của các ma trận xác định dương. Định lý 1.2.6. Giả sử A,B ∈ Sn(R), A > 0. Khi đó tồn tại ma trận W khả nghịch để W tAW = In,W tBW = diag(λ1, · · · , λn). Hơn nữa {λ1, · · · , λn} chính là tập các giá trị riêng của ma trận A−1B. Chứng minh. Theo Định lý 1.1.3, tồn tại ma trận trực giao Q sao cho QtAQ = D = diag(α1, · · · , αn). Do A là ma trận xác định dương nên αi > 0 với mọi 10 i = 1, 2, · · · , n. Đặt K = diag( 1√ α1 , · · · , 1√ αn ), khi đó ta có KtQtAQK = In. Đặt B′ = KtQtBQK, theo Định lý 1.1.3 tồn tại ma trận trực giao P sao cho P TB′P = diag(λ1, · · · , λn). Ma trận W = QKP thỏa mãn các yêu cầu đặt ra ban đầu. DoW tAW = In,W tBW = diag(λ1, · · · , λn) nênW−1(A−1B)W = diag(λ1, · · · , λn). Vậy {λ1, · · · , λn} chính là tập các giá trị riêng của ma trận A−1B. Định lý 1.2.7. [10] Giả sử A,B ∈ Sn(R), A > 0. Khi đó ma trận AB chéo hóa được và có số giá trị riêng dương, âm, bằng không như ma trận B. Chứng minh. Tương tự chứng minh Định lý 1.2.5, ta đặt A = (A 1 2 )2. Khi đó ma trận AB đồng dạng với ma trận (A 1 2 )−1(AB)A 1 2 = A 1 2BA 1 2 . Với mọi vector x ∈ Rn thì tồn tại vector y để x = A 1 2y và khi đó xtBx = yt(A 1 2BA 1 2 )y. Vậy ma trận AB chéo hóa được và có số giá trị riêng dương, âm, bằng không như ma trận B. Dưới đây là một số tính chất liên quan đến ma trận nửa xác định dương - xác định dương được sử dụng trong các phần tiếp theo của khóa luận này. Mệnh đề 1.2.8. Giả sử A ∈ Sn(R) là ma trận nửa xác định dương và diag(A) > 0. Khi đó tồn tại vector x ∈ Rn sao cho mọi thành phần của x đều khác 0 và ma trận nửa xác định dương B ∈ Sn(R) để A = xxt +B. Chứng minh. Giả sử xi = (xi1, · · · , xin). Đặt u1 = α1x1 + β1x2 = (u11, · · · , u1n), v1 = β1x1 − α1x2, ở đây α1, β1 được chọn sao cho α1, β1 > 0, α21 + β21 = 1 và nếu x1k 6= 0 hoặc x2k 6= 0 thì u1k 6= 0. Hiển nhiên ta có u1ut1 + v1vt1 = x1xt1 + x2xt2. Tương tự đặt u2 = α2u1+β2x3 và tiếp tục quá trình trên ta được A = ur−1utr−1+∑r−1 i=1 viv t i . Đặt x = ur−1 và B = ∑r−1 i=1 viv t i ta có đpcm. Mệnh đề 1.2.9. Giả sử B ∈ Sn(R). 1. Nếu B ∈ Pn, B 6= 0 thì với mọi ma trận xác định dương A ∈ Sn(R) ta có tr(AB) > 0. 2. Nếu B /∈ Pn thì tồn tại ma trận A ∈ Sn(R), A > 0 sao cho tr(AB) < 0. Chứng minh. 1. Theo Hệ quả 1.2.4 tồn tại ma trận khả nghịch W sao cho A = WW t. Ta có AB ∼ W−1ABW = W tBW . Do B là ma trận nửa xác định dương khác 0 nên W tBW cũng là ma trận nửa xác định dương khác 0. Do vậy tr(AB) = tr(W tBW ) > 0. 2. Theo Định lý 1.1.3, tồn tại ma trận trực giao Q sao cho D = Q−1BQ là ma trận chéo. Do B không phải là ma trận nửa xác định dương nên tồn tại phần tử λi < 0 11 trên đường chéo chính của D. Chọn ma trận chéo C > 0 sao cho tr(CD) < 0. Đặt A = QCQ−1 ta có A > 0 và tr(AB) = tr(Q−1AQQ−1BQ) = tr(CD) < 0. Mệnh đề 1.2.10. Nếu A,B ∈ Sn(R) là các ma trận xác định dương thì tồn tại số thực dương α sao cho A > αB. Chứng minh. Theo Định lý 1.2.6, tồn tại ma trận W khả nghịch để WAW t = In,WBW t = diag(λ1, · · · , λn). Chọn α là số thực dương nhỏ hơn 1 λmin , ở đây λmin = min{λi, i = 1, · · · , n} ta có A > αB. 1.3 Một số phép toán trên không gian các ma trận Định nghĩa 1.3.1. Giả sử A,B là các ma trận thuộc Matn(R). Tích đối xứng của A,B, ký hiệu S(A,B) được xác định bởi S(A,B) = AB +BA. Nhận xét 1.3.1. Nếu A,B là các ma trận đối xứng thì S(A,B) cũng là ma trận đối xứng. Tuy vậy, nếu A > 0, B > 0 thì chưa chắc S(A,B) ≥ 0. Thực vậy, với A = ( 1 0 0 ² ) , B = ( 1 α α 1 ) trong đó ² là số dương đủ nhỏ và α gần bằng 1 ta có A > 0, B > 0 nhưng S(A,B) = ( 2 α(1 + ²) α(1 + ²) 2² ) không phải là ma trận nửa xác định dương. Định lý 1.3.2. [4] Giả sử A,B ∈ Sn(R), A > 0. Nếu S(A,B) > 0 (≥ 0) thì B > 0 (B ≥ 0). Chứng minh. Giả sử B = Qtdiag(β1, · · · , βn)Q, trong đó Q là ma trận trực giao. Đặt S′ = QtS(A,B)Q,A′ = QtAQ và gọi s′ii, a ′ ii là phần tử thứ i trên đường chéo chính của S′ và A′. Ta có S′ = A′diag(β1, · · · , βn) + diag(β1, · · · , βn)A′, do vậy s′ii = 2βia ′ ii, i = 1, · · · , n. Do S′ ≥ 0, A′ > 0 nên s′ii ≥ 0, a′ii > 0, i = 1, · · · , n. Vậy βi ≥ 0, i = 1, · · · , n, suy ra B ≥ 0. Định nghĩa 1.3.2. Cho A = (aij)m×n, B = (bij)m×n là hai ma trận thuộc Matm×n(K). Tích Hadamard (tích Schur) giữa A và B, ký hiệu A ◦ B được định nghĩa bởi A ◦B = (aijbij)m×n. 12 Định lý 1.3.3. [10] (Định lý Schur) Nếu A ≥ 0, B ≥ 0 thì A ◦B ≥ 0. Chứng minh. Giả sử rank(A) = r, rank(B) = s, khi đó tồn tại r vector độc lập tuyến tính x1, · · · , xr, tồn tại s vector độc lập tuyến tính y1, · · · , ys sao cho A =∑r i=1 xix t i, B = ∑s i=1 yiy t i . Ta có A ◦B = r∑ i=1 xix t i ◦ s∑ i=1 yiy t i = ∑ i,j (xix t i) ◦ (yjytj) = ∑ i,j (xi ◦ yj)(xi ◦ yj)t ≥ 0 (do mỗi thành phần của tổng ∑ i,j(xi ◦ yj)(xi ◦ yj)t đều là các ma trận nửa xác định dương). Hơn thế nữa chúng ta có Mệnh đề 1.3.4. Nếu A > 0, B ≥ 0,diag(B) > 0 thì A ◦B > 0. Chứng minh. Theo Mệnh đề 1.2.8 tồn tại vector x ∈ R sao cho mọi thành phần của x đều khác 0 và ma trận nửa xác định dương C ∈ Sn(R) để B = xxt +C. Do A là ma trận xác định dương nên tồn tại n vector độc lập tuyến tính x1, · · · , xn sao cho A = ∑n i=1 xix t i. Ta có A ◦ (xxt) = ∑n i=1 xix t i ◦ (xxT ) = ∑n i=1(xi ◦x)t. Ta sẽ chỉ ra các vector x1 ◦ x, · · · , xn ◦ x là độc lập tuyến tính. Thực vậy, xét biểu thức∑n i=1 αi(xi ◦ x) = 0, αi ∈ R, i = 1, · · · , n ta có n∑ i=1 αi(xi ◦ x) = 0 ⇐⇒ ( n∑ i=1 αixi) ◦ x = 0 ⇐⇒ n∑ i=1 αixi = 0 ⇐⇒ α1 = · · · = αn = 0. Điều này chứng tỏ x1 ◦ x, · · · , xn ◦ x độc lập tuyến tính, suy ra ma trận A ◦ xxt xác định dương. Do C ≥ 0 nên A ◦ C ≥ 0. Từ đó A ◦ B = A ◦ (xxt + C) = A ◦ xxt + A ◦ C > 0. Vậy A ◦B là ma trận xác định dương. Mệnh đề 1.3.5. Nếu B không phải là ma trận nửa xác định dương trên Sn(R) thì tồn tại ma trận A xác định dương trên Sn(R) sao cho A ◦B không phải là ma trận xác định dương. Chứng minh. Do B không phải là ma trận xác định dương nên tồn tại x ∈ Rn sao cho xtBx < 0. Với mỗi ² ∈ R đặt A² = (1)n + ²In,trong đó (1)n là ma trận vuông cấp n với mọi phần tử đều là 1. Khi đó A² là ma trận xác định dương với mọi ² > 0. Ta có A² ◦B = (1)n ◦B + ²In ◦B = B + ²diag(B), trong đó diag(B) là ma 13 trận đường chéo với các phần tử trên đường chéo chính tương ứng là các phần tử trên đường chéo chính của B. Chọn ² > 0 đủ bé sao cho xtBx+ ²xtdiag(B)x < 0, khi đó A² xác định dương và A² ◦ B không xác định dương do tồn tại x ∈ R sao cho xt(A² ◦B)x < 0. Định nghĩa 1.3.3. Cho A = (aij)m×n ∈ Matm×n(R), B = (bij)p×q ∈ Matp×q(R). Tích Tensor (tích Kronecker) của A và B, ký hiệu A⊗B được xác định bởi A⊗B =  a11B · · · a1nB a21B · · · a2nB · · · am1B · · · amnB  . Nhận xét 1.3.6. Giả sử A ∈ Matn(R) có các giá trị riêng λi, i = 1, · · · , n, B ∈ Matm(R) có các giá trị riêng µj, j = 1, · · · ,m. Khi đó tập các giá trị riêng của A⊗B là {λiµj, i = 1, · · · , n, j = 1, · · · ,m}. Từ đây ta thấy ngay nếu A,B là các ma trận nửa xác định dương thì A⊗B cũng là ma trận nửa xác định dương. 1.4 Căn bậc hai của ma trận Trong mục này, ta chỉ tìm hiểu sơ lược về căn bậc hai của của ma trận trong một số trường hợp đặc biệt. Để hiểu sâu hơn lý thuyết về căn bậc n của ma trận tổng quát, có thể tham khảo trong [11]. Định lý 1.4.1. [4] Cho A ∈ Sn(R). A ≥ 0 khi và chỉ khi tồn tại duy nhất ma trận B ∈ Sn(R), B ≥ 0 sao cho A = B2. Chứng minh. Theo Định lý 1.1.3 ta cóA = QtDQ, trong đóQ là ma trận trực giao, D = diag(λ1, · · · , λn), λi ≥ 0, i = 1, · · · , n. Đặt B = Qtdiag( √ λ1, · · · , √ λn)Q, ta có ngay B ∈ Sn(R), B ≥ 0 và B2 = A. Giả sử có ma trận C ≥ 0, C ∈ Sn(R) để C2 = A, đặt C ′ = QCQt ta có ngay C ′2 = D. Do vậy, tồn tại ma trận trực giao W sao cho C ′ = W tdiag( √ λ1, · · · , √ λn)W . Từ C ′2 = D ta có W tDW = D, suy ra C ′ = W tdiag( √ λ1, · · · , √ λn)W = diag( √ λ1, · · · , √ λn). Vậy B = C. Ta có đpcm. Định nghĩa 1.4.1. Ma trận B trong Định lý 1.4.1 được gọi là căn bậc hai của ma trận A, ký hiệu A 1 2 . Nhận xét 1.4.2. Hoàn toàn tương tự ta có thể đưa ra khái niệm căn bậc n của ma trận nửa xác định dương. Hơn thế nữa, có thể chứng minh rằng nếu A ∈ Matn(R) 14 là ma trận chéo hóa được có các giá trị riêng không âm thì tồn tại duy nhất ma trận B ∈ Matn(R) có các giá trị riêng không âm để A = B2. Ma trận B trong trường hợp này cũng được gọi là căn bậc hai của ma trận A, ký hiệu A 1 2 . 1.5 Một số bất đẳng thức ma trận và các tính chất liên quan đến ma trận khối Cũng như bất đẳng thức số, các bất đẳng thức ma trận là một lĩnh vực rất phong phú. Tuy vậy, giữa chúng cũng có nhiều sự khác biệt nhất định. Một số bất đẳng thức không còn đúng trong trường hợp ma trận. Trong mục này, chúng tôi chỉ trình bày một số bất đẳng thức đơn giản. Một vài bất đẳng thức thú vị khác sẽ được giới thiệu trong chương 3. Mệnh đề 1.5.1. [4] Nếu A,B là các ma trận xác định dương và A > B thì A 1 2 > B 1 2 . Chứng minh. Đặt X = A 1 2 , Y = B 1 2 ta có A−B = X2 − Y 2 = 1 2 S(X + Y,X − Y ). Do X + Y > 0, X2 − Y 2 > 0 nên theo Định lý 1.3.2 ta có X − Y > 0. Nhận xét 1.5.2. Nếu A ≥ B ≥ 0 thì chưa chắc A2 ≥ B2. Thực vậy, với A = ( 2 1 1 1 ) , B = ( 1 1 1 1 ) ta có ngay A ≥ B ≥ 0 nhưng A2 −B2 = ( 3 1 1 0 ) 0. Mệnh đề 1.5.3. [4] Nếu A,B là các ma trận nửa xác định dương thì A ≥ B khi và chỉ khi A−1 ≤ B−1. Chứng minh. Theo Định lý 1.2.6, tồn tại ma trận W khả nghịch sao cho W tAW = In,W tBW = D, ở đây D là ma trận chéo. Ta có A ≥ B ⇔ In ≥ D ⇔ In ≤ D−1 ⇔ A−1 ≤ B−1. Định nghĩa 1.5.1. Toán tử A ∈ Matn(K) được gọi là co nếu ‖A‖ ≤ 1. Mệnh đề 1.5.4. [4] Toán tử A ∈ Matn(C) co khi và chỉ khi ( I A A∗ I ) ≥ 0. 15 Chứng minh. Giả sử phân tích SVD của ma trậnA làA = USV , S = diag(s1, · · · , sn). khi đó ta có( I A A∗ I ) = ( I USV V ∗SU∗ I ) = ( U O O V ∗ )( I S S I )( U∗ O O V ) ∼= ( I S S I ) . Hiển nhiên ma trận ( I S S I ) tương đương Unita với ma trận ( 1 s1 s1 1 ) ⊕ ( 1 s2 s2 1 ) ⊕ · · · ⊕ ( 1 sn sn 1 ) . Vậy ( I A A∗ I ) ≥ 0 khi và chỉ khi si ≤ 1, i = 1, · · · , n. Nói cách khác, ( I A A∗ I ) ≥ 0 khi và chỉ khi A là toán tử co. Mệnh đề 1.5.5. [4] Giả sử A,B là các ma trận nửa xác định dương. Khi đó( A X X∗ B ) ≥ 0 khi và chỉ khi tồn tại toán tử co K để X = A12KB 12 . Chứng minh. Trước hết, ta chứng minh bài toán với A,B là các ma trận xác định dương. Với giả thiết này ta có( A X X∗ B ) ∼ ( A− 1 2 O O B− 1 2 )( A X X∗ B )( A− 1 2 O O B− 1 2 ) = ( I A− 1 2XB− 1 2 B− 1 2X∗A− 1 2 I ) . Đặt K = A− 1 2XB− 1 2 , theo Mệnh đề 1.5.4 ta có ngay đpcm. Trong trường hợp A,B là các ma trận nửa xác định dương, áp dụng kết quả trên đối với các ma trận xác định dương A + ²In, B + ²In, ² > 0 và cho ² dần về 0 ta thu được kết quả bài toán. Mệnh đề 1.5.6. [4] Giả sử A,B là các ma trận xác định dương. Khi đó ( A X X∗ B ) ≥ 0 khi và chỉ khi A ≥ XB−1X∗. Chứng minh. Ta có( A X X∗ B ) ∼ ( I −XB−1 O I )( A X X∗ B )( I O −B−1X∗ I ) = ( A−XB−1X∗ O O B ) . Do B > 0 nên ( A X X∗ B ) ≥ 0 khi và chỉ khi A ≥ XB−1X∗. 16 Dưới đây là một vài kết quả được suy ra trực tiếp từ mệnh đề trên. Hệ quả 1.5.7. [4] Nếu A > 0 thì ( A I I A−1 ) ≥ 0 Hệ quả 1.5.8. [4] Giả sử B là ma trận xác định dương và X là ma trận bất kỳ, khi đó ta có XB−1X∗ = min { A : ( A X X∗ B ) ≥ 0 } . Hệ quả 1.5.9. [4] Giả sử A,B là các ma trận nửa xác định dương và X là ma trận bất kỳ, khi đó ta có A−XB−1X∗ = max { Y : ( A X X∗ B ) ≥ ( Y O O O )} . Mệnh đề 1.5.10. [4] Giả sử A,B là các ma trận xác định dương, khi đó ta có(A+B 2 )−1 ≤ A −1 +B−1 2 . Chứng minh. Theo Hệ quả 1.5.7 ta có ( A I I A−1 ) ≥ 0, ( B I I B−1 ) ≥ 0. Do vậy( A+B 2I 2I A−1 +B−1 ) cũng là ma trận nửa xác định dương. Theo Mệnh đề 1.5.6 ta có A−1 +B−1 ≥ 4(A+B)−1, hay(A+B 2 )−1 ≤ A −1 +B−1 2 . Mệnh đề 1.5.11. [10] (Bất đẳng thức Fiedler) Nếu A là ma trận xác định dương cấp n thì A ◦ A−1 ≥ In. Chứng minh. Với các ma trận xác định dương A,B bất kỳ, theo Hệ quả 1.5.7 thì( A I I A−1 ) ≥ 0, ( B I I B−1 ) ≥ 0. Theo Định lý 1.3.3 ta có ( A ◦B I I A ◦B ) ≥ 0. Theo Mệnh đề 1.5.6 ta có A ◦ B ≥ (A−1 ◦ B−1)−1. Thay B = A−1 vào bất đẳng thức trên ta được A ◦ A−1 ≥ (A−1 ◦ A)−1 = (A ◦ A−1)−1. Vậy A ◦ A−1 ≥ In. 17 1.6 Hàm lồi, lõm, đơn điệu trên tập các ma trận xác định dương Hàm ma trận và các tính chất lồi, lõm, đơn điệu của nó có thể xem là sự tổng quát hóa hàm số và các tính chất. Lý thuyết tương đối hoàn chỉnh về hàm ma trận có thể được tìm thấy trong [11]. Định nghĩa 1.6.1. Ánh xạ f : Sn −→ Sn được gọi là lồi nếu f((1− α)A+ αB) ≤ (1− α)f(A) + αf(B) ∀ A,B ∈ Sn, ∀ α ∈ [0, 1]. (1.6.1) Định nghĩa 1.6.2. Ánh xạ f : Sn −→ Sn được gọi là lõm nếu f((1− α)A+ αB) ≥ (1− α)f(A) + αf(B) ∀ A,B ∈ Sn, ∀ α ∈ [0, 1]. (1.6.2) Tương tự trong trường hợp hàm số, nếu hàm ma trận f là liên tục thì f lồi (lõm) khi và chỉ khi f (A+B 2 ) ≤ (≥)f(A) + f(B) 2 ∀ A,B ∈ Sn. Nhận xét 1.6.1. Nếu K là tập con của Sn thì ta gọi f là lồi (lõm) trên K nếu bất đẳng thức (1.6.1) ((1.6.2)) đúng với mọi A,B ∈ K. Ví dụ 1.6.2. Theo Mệnh đề 1.5.10 với mọi ma trận xác định dương A,B ta có(A+B 2 )−1 ≤ A −1 +B−1 2 . Do vậy ánh xạ f : A −→ A−1 lồi trên tập Pn. Ví dụ 1.6.3. Ánh xạ f : A −→ A2 lồi trên tập Pn. Mệnh đề 1.6.4. [4] Ánh xạ f : Pn ×Matn(C) −→ Pn, (B,X) −→ XB−1X∗ lồi theo cả hai biến B và X. Chứng minh. Theo Mệnh đề 1.5.6 với các ma trận B1, B2 ∈ Pn, X1, X2 ∈ Matn(C) ta có ( X1B −1 1 X ∗ 1 X1 X∗1 B1 ) ≥ 0, ( X2B −1 2 X ∗ 2 X2 X∗2 B2 ) ≥ 0. Do vậy X1B −1 1 X ∗ 1 +X2B −1 2 X ∗ 2 2 X1 +X2 2(X1 +X2 2 )∗ B1 +B2 2  ≥ 0. Lại theo Mệnh đề 1.5.6 ta có 1 2 (X1B −1 1 X ∗ 1 +X2B −1 2 X ∗ 2) ≥ (X1 +X2 2 )(B1 +B2 2 )−1(X1 +X2 2 )∗ . Bất đẳng thức trên chứng tỏ f lồi theo cả hai biến. 18 Định nghĩa 1.6.3. Ánh xạ f : Sn −→ Sn được gọi là đơn điệu tăng (giảm) nếu với mọi A,B ∈ Sn, A ≥ B =⇒ f(A) ≥ (≤)f(B). Ánh xạ đơn điệu tăng, giảm gọi chung là ánh xạ đơn điệu. Ví dụ 1.6.5. Ánh xạ A −→ A12 đơn điệu tăng trên Pn, trong khi ánh xạ A −→ A2 không phải là hàm đơn điệu trên Pn. Mệnh đề 1.6.6. [4] Ánh xạ f : Pn×Pn×Sn −→ Sn, (A,B,X) −→ A−XB−1X∗ lõm theo cả ba biến A,B,X và đơn điệu tăng theo các biến A,B. Mệnh đề 1.6.7. [4] Ánh xạ f(A) = Ar trên Pn đơn điệu nếu 0 ≤ r ≤ 1 và lồi nếu 1 ≤ r ≤ 2. 1.7 Phương trình ma trận Phương trình ma trận ẩn X có dạng f(X) = A, trong đó f : Matn(K) −→ Matn(K), X −→ f(X) là một ánh xạ trên không gian các ma trận cấp n. Ví dụ 1.7.1. Phương trình Lyapunov là phương trình ma trận có dạng A∗X +XA = W. (1.7.1) Người ta chứng minh được rằng nếu các giá trị phổ của A nằm trong nửa mặt phẳng bên phải thì phương trình Lyapunov (1.7.1) có duy nhất nghiệm. Hơn thế nữa, nếu W là ma trận nửa xác định dương thì nghiệm của phương trình trên cũng là nửa xác định dương. Trong trường hợp A = diag(α1, · · · , αn) thì nghiệm của phương trình Lyapunov được cho bởi công thức X = [ 1 αi + αj ] n×n ◦ W. (1.7.2) Ví dụ 1.7.2. Phương trình Stein là phương trình ma trận có dạng X − F ∗XF = W. (1.7.3) Nếu các giá trị phổ của F chứa trong hình cầu mở đơn vị thì phương trình Stein (1.7.3) có nghiệm duy nhất cho bởi công thức X = ∞∑ m=0 F ∗mWFm. (1.7.4) Trong trường hợp F = diag(β1, · · · , βn) thì nghiệm của phương trình Stein được cho bởi công thức X = [ 1 1− βiβj ] n×n ◦ W. (1.7.5) 19 Phương trình ma trận Riccati dưới đây đóng vai trò quan trọng trong các khảo sát ở chương 3. Định nghĩa 1.7.1. Phương trình Riccati là phương trình ma trận có dạng XAX = B. (1.7.6) Mệnh đề 1.7.3. [4] Nếu A > 0, B ≥ 0 thì nghiệm nửa xác định dương của phương trình Riccati (1.7.6) tồn tại duy nhất và được cho bởi công thức X = A− 1 2 (A 1 2BA 1 2 ) 1 2A− 1 2 . (1.7.7) Chứng minh. Từ phương trình (1.7.6) ta có A 1 2XAXA 1 2 = A 1 2BA 1 2 . Lấy căn bậc hai hai vế ta thu được A 1 2XA 1 2 = (A 1 2BA 1 2 ) 1 2 . Vậy nghiệm nửa xác định dương của phương trình (1.7.6) tồn tại duy nhất và được cho bởi công thức (1.7.7). 20 Chương 2 BÀI TOÁN BẢO TOÀN TUYẾN TÍNH Trong chương này, chúng tôi giới thiệu lớp bài toán bảo toàn tuyến tính, đặc biệt là lớp bài toán bảo toàn tuyến tính chỉ số quán tính. Chúng tôi tổng quan một số kết quả trong lĩnh vực này và giới thiệu một số kết quả đạt được trong các đề tài thực hiện trong các năm 2009, 2010. Trong quá trình thực hiện khóa luận, chúng tôi cũng đã thu được một số kết quả mới. Cụ thể, chúng tôi đưa ra một điều kiện đủ để toán tử tuyến tính hạng 3 bảo toàn chỉ số (n, 0, 0). Ngoài ra, chúng tôi đưa ra một lớp toán tử hạng r bảo toàn chỉ số này. 2.1 Bài toán bảo toàn tuyến tính Các bài toán bảo toàn tuyến tính là một hướng nghiên cứu sôi động trong lĩnh vực toán tử và lĩnh vực ma trận. Các bài toán này đề cập đến các toán tử bảo toàn trong không gian các ma trận hay toán tử. Các bài toán bảo toàn có thể là bảo toàn một hàm, một tập con, một quan hệ. Bài báo đầu tiên đề cập đến vấn đề này xuất hiện năm 1897. Kể từ đó đến nay, rất nhiều những công trình ra đời nhằm trả lời cho loại câu hỏi này. Hiện nay lĩnh vực này đang thu hút nhiều nhà toán học quan tâm, nổi bật là Chi-Kwong Li và Stephen Pierce. Vẫn đang còn rất nhiều vấn đề mở cần nghiên cứu về bài toán bảo toàn tuyến tính, đặc biệt là bài toán bảo toàn tuyến tính chỉ số quán tính. Trong lớp bài toán này, bài toán bảo toàn chỉ số (n, 0, 0), tức bài toàn bảo toàn tính xác định dương hiện nay vẫn nằm ngoài mọi cách tiếp cận. Trong phần này, ta giả sử T : Matm×n(K) −→ Matm×n(K) là một toán tử tuyến tính. Trước hết, chúng ta sẽ đề cập đến ba vấn đề bảo toàn tuyến tính quan trọng. 21 Bảo toàn tuyến tính hàm Toán tử tuyến tính T gọi là bảo toàn hàm f : Matm×n(K) −→ K nếu f(A) = f(T (A)) với mọi A ∈ Matm×n(K). Chẳng hạn khi f = det và Matm×n(K) ≡ Matn(K), ta có bài toán bảo toàn định thức. Bảo toàn tuyến tính tập con Giả sử ξ là một tập con của Matm×n(K). Toán tử tuyến tính T được gọi là bảo toàn tập ξ nếu T (ξ) ⊆ ξ. Chẳng hạn khi Matm×n(K) ≡ Matn(C) và ξ là nhóm các ma trận unita Un, ta có bài toán bảo toàn nhóm Un. Bảo toàn tuyến tính một quan hệ hoặc quan hệ tương đương Giả sử Φ là một quan hệ hay là một quan hệ tương đương trên Matm×n(K). Toán tử tuyến tính T gọi là bảo toàn quan hệ Φ nếu T (A)ΦT (B) khi AΦB hoặc T (A)ΦT (B) khi và chỉ khi AΦB. Chẳng hạn ở đây quan hệ Φ được định nghĩa bởi AΦB khi AB = BA. Trong phần tiếp theo, ta tìm hiểu sơ lược một số dạng bài toán bảo toàn tuyến tính và các kết quả đã biết. 2.2 Bảo toàn tuyến tính hạng của ma trận Toán tử tuyến tính T được gọi là bảo toàn hạng k nếu với mọi ma trận A thuộc Matm×n(K) sao cho rank(A) = k ta có rank(T (A)) = k. Đối với bài toàn bảo toàn hạng 1, người ta đã giải quyết trên không gian Matm×n(K), với K là trường đại số đóng với đặc số bằng 0. Năm 1959, Marus và Moyls chứng minh được định lý sau Định lý 2.2.1. [13] Giả sử T là một toán tử tuyến tính bảo toàn hạng 1 trên Matn(C), khi đó tồn tại hai ma trận khả nghịch P và Q sao cho T (A) = PAQ, ∀ A ∈ Matn(C), (2.2.1) hoặc T (A) = PAtQ, ∀ A ∈ Matn(C). (2.2.2) Trong trường hợp T là toán tử tuyến tính trên Matm×n(C),m 6= n, người ta chứng minh được rằng T có dạng (2.2.1) với P ∈ Matm(C), Q ∈ Matn(C) là các ma trận khả nghịch. Người ta còn xét bài toán bảo toàn hạng 1 trên các không gian khác và thu được 22 nhiều kết quả thú vị. Chẳng hạn xét trên không gian các ma trận Hermite cấp n ta có kết quả sau Định lý 2.2.2. [7] Xét T là toán tử tuyến tính trên Hn bảo toàn hạng 1. Giả sử tồn tại một ma trận Hermite có ảnh là khả nghịch. Khi đó tồn tại một ma trận khả nghịch S trên Matn(C) và ε ∈ {−1, 1} sao cho T (A) = εSAS∗, ∀ A ∈ Hn, hoặc T (A) = εSAtS∗, ∀ A ∈ Hn. Bài toán bảo toàn hạng k đã được giải quyết trong trường hợp Matn(C). Một toán tử tuyến tính bảo toàn hạng k trên Matn(C) sẽ có dạng (2.2.1) hoặc (2.2.2). 2.3 Bài toán bảo toàn định thức Toán tử tuyến tính T trênMatn(C) được gọi là bảo toàn định thức nếu det(A) = det(T (A)) với mọi ma trận A ∈ Matn(C). Bài toán bảo toàn định thức là bài toán được đề cập đầu tiên trong lĩnh vực bảo toàn tuyến tính và đã được giải quyết triệt để vào năm 1897 bởi Ferdinand Georg Frobenius (1849 - 1917). Định lý 2.3.1. [13] Giả sử T là một toán tử tuyến tính bảo toàn định thức trên Matn(C), khi đó tồn tại hai ma trận nghịch đảo P và Q với det(PQ) = 1 sao cho T (A) = PAQ, ∀ A ∈ Matn(C), hoặc T (A) = PAtQ, ∀ A ∈ Matn(C). Chúng ta thấy rằng dạng của toán tử tuyến tính bảo toàn định thức và bảo toàn hạng 1 trên Matn(C) là hoàn toàn giống nhau. Thực ra hoàn toàn có thể quy bài toán bảo toàn định thức về bài toán bảo toàn hạng 1. Đối với bài toán bảo toàn định thức, người ta còn quan tâm đến những toán tử T thỏa mãn det(A+ λB) = det(T (A) + λT (B)), ∀ A,B ∈ Matn(C), ∀ λ ∈ C. (2.3.1) Năm 2002, Dolinar và Semrl chỉ ra rằng nếu toán tử T toàn ánh và đồng thời thỏa mãn (2.3.1) thì T là tuyến tính. Theo công trình mới của Wang Fei, có thể bỏ đi giả thiết T toàn ánh. 23 Định lý 2.3.2. [7] Giả sử T : Matn(C) −→ Matn(C) là một toán tử xác định trên không gian Matn(C) sao cho det(A + λB) = det(T (A)) + λT (B)) với mọi A,B ∈ Matn(C) và λ ∈ C. Khi đó T là tuyến tính. Bằng cách hạn chế không gian đang xét, người ta thu được một số kết quả khá thú vị. Đây cũng là một hướng nghiên cứu đáng được quan tâm. Chẳng hạn, xét Un là không gian các ma trận tam giác trên cấp n, ta có Định lý 2.3.3. [7] Giả sử T là một toán tử tuyến tính đi từ Un vào chính nó và det(A+ λB) = det(T (A) + λT (B)), ∀A,B ∈ Un, ∀ λ ∈ C. Khi đó tồn tại một hoán vị σ của {1, 2, · · · , n} và các số không âm c1, c2, · · · , cn với ∏n i=1 ci = 1 sao cho với mỗi A ∈ Un ta có [T (A)]ii = ci(A)σ(i)σ(i), i = 1, 2, · · · , n. Đồng thời, người ta còn quan tâm đến việc mô tả những toán tử tuyến tính bảo toàn định thức và một tính chất khác nữa. Chẳng hạn, người ta đã chỉ ra rằng nếu toán tử tuyến tính T trên Matn(C) bảo toàn định thức và vết thì T (A) = PAP−1 với mọi A ∈ Matn(C) hoặc T (A) = PAtP−1 với mọi A ∈ Matn(C), ở đây P là một ma trận khả nghịch. 2.4 Bảo toàn tuyến tính chuẩn và tập các ma trận Unita Trong mục này ta dùng ký hiệu T ∗ để chỉ toán tử đối ngẫu của toán tử tuyến tính T . Định nghĩa 2.4.1. Giả sử A ∈ Matm×n(C) 1. Chuẩn phổ (spectral norm) của A, ký hiệu ‖A‖2 được xác định bởi ‖A‖2 = √ λmax(A∗A) = σmax(A), ở đây ký hiệu λmax(X), σmax(X) để chỉ giá trị riêng lớn nhất, giá trị kỳ dị lớn nhất của ma trận X. 2. Chuẩn vết (trace norm, Ky Fan norm) của A, ký hiệu ‖A‖∗ được xác định bởi ‖A‖∗ = min{m,n}∑ i=1 σi. 24 Định lý 2.4.1. [14] Giả sử T là toán tử tuyến tính trên Matn(C), khi đó các khẳng định sau đây là tương đương. 1. T bảo toàn chuẩn phổ. 2. T (Un) = Un. 3. T bảo toàn chuẩn vết. 4. T ∗ biến tập các ma trận với giá trị kỳ dị 1, 0, · · · , 0 thành chính nó. 5. T có dạng T (A) = UAV, ∀A ∈ Matn(C) hoặc T (A) = UAtV, ∀A ∈ Matn(C), ở đây U, V là các ma trận Unita. 6. T ∗ có dạng T (A) = UAV, ∀A ∈ Matn(C) hoặc T (A) = UAtV, ∀A ∈ Matn(C), ở đây U, V là các ma trận Unita. 2.5 Bảo toàn tuyến tính miền số học và bán kính số học Định nghĩa 2.5.1. Với mỗi ma trận A ∈ Matn(C) ta định nghĩa 1. Miền số học của A là tập W (A) = {x∗Ax : x ∈ Cn, x∗x = 1}, ở đây x là vector cột và x∗ là chuyển vị liên hợp của x. 2. Bán kính số học của A được xác định bởi đẳng thức r(A) = max{|z| : z ∈ W (A)}. Bài toán bảo toàn tuyến tính miền số học và bán kính số học đã được Chi - Kwong Li giải quyết triệt để. Định lý 2.5.1. [12] Toán tử tuyến tính T : Matn(C) −→ Matn(C) thỏa mãn điều kiện r(T (A)) = r(A) ∀A ∈ Matn(C) 25 nếu và chỉ nếu tồn tại ma trận unita U ∈ Matn(C) và ξ ∈ C với |ξ| = 1 sao cho T (A) = ξUAU∗, ∀A ∈ Matn(C) hoặc T (A) = ξUAtU∗, ∀A ∈ Matn(C). Định lý 2.5.2. [12] Toán tử tuyến tính T : Hn −→ Hn thỏa mãn điều kiện r(T (A)) = r(A) ∀A ∈ Hn nếu và chỉ nếu tồn tại ma trận unita U ∈ Matn(C) và ξ ∈ {−1, 1} sao cho T (A) = ξUAU∗, ∀A ∈ Hn hoặc T (A) = ξUAtU∗, ∀A ∈ Hn. Định lý 2.5.3. [12] Giả sử T : Matn(C) −→ Matn(C) là toán tử tuyến tính. Khi đó các khẳng định sau đây là tương đương 1. W (T (A)) = W (A), ∀A ∈ Matn(C). 2. W (T (A)) = W (A), ∀ A ∈ Hn. 3. Tồn tại ma trận unita U ∈ Matn(C) sao cho T (A) = UAU∗, ∀A ∈ Matn(C) hoặc T (A) = UAtU∗, ∀A ∈ Matn(C). 2.6 Bài toán bảo toàn tuyến tính chỉ số quán tính Bài toán bảo toàn tuyến tính chỉ số quán tính là một bài toán quan trọng trong lĩnh vực bảo toàn tuyến tính. Đây là một trong những mảng còn có nhiều vấn đề chưa được giải quyết. Trong mục này, ta quan tâm đến không gian các ma trận đối xứng trên trường số thực Sn(R) và không gian các ma trận Hermite Hn. Các ma trận đối xứng trên trường số thực và các ma trận Hermite luôn có các giá trị riêng thực, do đó ta có thể đưa ra định nghĩa sau Định nghĩa 2.6.1. Ma trận A được gọi là có chỉ số quán tính (r, p, q) nếu A có r giá trị riêng dương, p giá trị riêng âm và q giá trị riêng bằng 0. 26 Ký hiệu G(r, p, q) là tập các ma trận với chỉ số quán tính (r, p, q). Ta thấy ngay G(n, 0, 0) = Pn. Toán tử tuyến tính T được gọi là bảo toàn chỉ số (r, p, q) nếu T (G(r, p, q)) ⊂ G(r, p, q). (2.6.1) Vấn đề bảo toàn tuyến tính chỉ số quán tính là một vấn đề khó và còn nhiều bài toán mở. Đặc biết hiện nay, người ta còn đang gặp nhiều khó khăn trong việc giải quyết được bài toán trong trường hợp (n, 0, 0). Kết quả quan trọng đầu tiên trong quá trình giải quyết bài toán bảo toàn tập các ma trận xác định dương được đưa ra vào năm 1965 bởi Schneider. Tác giả đã hoàn toàn xác định được lớp các phép biến đổi tuyến tính biến tập tất cả các ma trận nửa xác định dương thành chính nó. Định lý 2.6.1. [20] Cho T là phép biến đổi tuyến tính trên Hn. Nếu T (Pn) = Pn thì T có dạng T (A) = X∗AX, ∀A ∈ Hn, (2.6.2) hoặc T (A) = X∗AtX, ∀A ∈ Hn (2.6.3) trong đó X là một ma trận phức khả nghịch cấp n× n. Mở rộng kết quả của Schneider, trong [8], Johnson và Pierce đã xác định được các toán tử tuyến tính biến tập G = G(k, n− k, 0) vào chính nó. Nếu k 6= n− k và T là một toán tử tuyến tính trên Matn(C) biến G thành chính nó thì T sẽ có dạng nêu trong Định lý 2.6.1, trong đó ma trận A được lấy trên không gian Matn(C). Trong trường hợp k = n−k thì T biến G thành chính nó nếu và chỉ nếu T có dạng T (A) = εX∗AX, ∀A ∈ Matn(C) (2.6.4) hoặc T (A) = εX∗AtX, ∀A ∈ Matn(C) (2.6.5) với ε ∈ {−1, 1}, X là một ma trận phức khả nghịch cấp n× n. Tuy vậy ở đây, giả thiết T (G) = G là mạnh hơn rất nhiều so với (2.6.1). Tiếp tục mở rộng kết quả này, trong [9] Johnson và Pierce tiếp tục xác định được tất cả các toán tử tuyến tính không suy biến bảo toàn các lớp chỉ số quán tính ngoại trừ bốn trường hợp (n, 0, 0), (0, n, 0), (0, 0, n), (n2 , n 2 , 0). Cụ thể, giả sử ta có r, s, t là những số nguyên không âm thỏa mãn r + s + t = n và (r, s, t) /∈ {(n, 0, 0), (0, n, 0), (0, 0, n), (n2 , n2 , 0)} và T là một toán tử tuyến tính không suy biến trên Hn bảo toàn chỉ số (r, s, t). Nếu r 6= s thì T có dạng nêu trong Định lý 27 2.6.1. Nếu r = n − r thì T có dạng (2.6.4) hoặc (2.6.5), trong đó ma trận A được lấy trên không gian Hn. Không những thế, trong [9], vấn đề bảo toàn tuyến tính các lớp chỉ số (n−1, 1, 0) và (k+1, k, 0) đã được giải quyết triệt để. Nếu (r, s, t) ∈ {(n−1, 1, 0), (k+1, k, 0)} và T là toán tử tuyến tính trên Hn bảo toàn chỉ số (r, s, t) thì T cũng sẽ có dạng nêu trong Định lý 2.6.1. Phải đến năm 1988, Stephen Pierce và Leiba Rodman mới xác định được các toán tử tuyến tính không suy biến bảo toàn lớp chỉ số (n2 , n 2 , 0). Định lý 2.6.2. [19] Giả sử n = 2k, k ∈ N, k ≥ 2 và T là toán tử tuyến tính không suy biến trên Hn bảo toàn chỉ số (k, k, 0). Khi đó T có dạng T (A) = εX∗AX, ∀A ∈ Hn hoặc T (A) = εX∗AtX, ∀A ∈ Hn với ε ∈ {−1, 1}, X là một ma trận phức khả nghịch cấp n× n. Định lý 2.6.3. [19] Giả sử Dr,s : H2 −→ H2 được xác định bởi Dr,s : ( a u+ iv u− iv b ) −→ ( a ru+ siv ru− siv b ) . Nếu T là toán tử tuyến tính không suy biến trên H2 bảo toàn chỉ số (1, 1, 0) thì T là tích của các toán tử có dạng được đưa ra trong Định lý 2.6.2 và toán tử có dạng Dr,s với |r|, |s| ≥ 1. 2.7 Toán tử tuyến tính xác định dương Bài toán bảo toàn tuyến tính chỉ số (n, 0, 0), tức bài toán bảo toàn tính xác định dương có mối quan hệ chặt chẽ với lý thuyết về các toán tử tuyến tính xác định dương. Toán tử tuyến tính T : Matn(K) −→ Matm(K) được gọi là nửa xác định dương (xác định dương) nếu T (A) ≥ 0 (> 0) khi A ≥ 0 (> 0). Dễ thấy toán tử tuyến tính nửa xác định dương T là xác định dương khi T (In) > 0. Ví dụ 2.7.1. 1. T (A) = trA là phiếm hàm tuyến tính nửa xác định dương. 2. T (A) = X∗AX với X ∈ Matn×m(K) là toán tử tuyến tính nửa xác định dương đi từ Matn(K) đến Matm(K). 28 3. Nếu B là ma trận nửa xác định dương thì T (A) = A⊗B là toán tử nửa xác định dương. 4. Nếu B là ma trận nửa xác định dương thì T (A) = A ◦ B là toán tử nửa xác định dương. Nếu B là ma trận nửa xác định dương và diag(B) > 0 thì T (A) = A ◦B là toán tử xác định dương. Còn nhiều vấn đề mở được đặt ra khi khảo sát các toán tử tuyến tính xác định dương. Chẳng hạn, người ta chứng tỏ được rằng nếu T : Matn(K) −→ Matm(K) là toán tử tuyến tính nửa xác định dương thì ‖T‖ = ‖T (In)‖. Ngược lại, người ta dự đoán rằng toán tử tuyến tính T thỏa ‖T‖ = ‖T (In)‖ và T (In) ≥ 0 thì T là toán tử nửa xác định dương. Cho đến nay giả thuyết này vẫn chưa được giải quyết. Một lớp toán tử tuyến tính nửa xác định dương được đặc biệt quan tâm là lớp các toán tử hoàn toàn nửa xác định dương. Xét Matm(Matn(C)) là không gian các m × m ma trận khối [[Aij]] với vị trí thứ i, j là phần tử của Matn(C). Với mỗi toán tử tuyến tính T : Matn(C) −→ Matk(C), ta có toán tử tuyến tính Tm : Matm(Matn(C)) −→ Matm(Matk(C)) xác định bởi Tm([[Aij]]) = [[T (Aij)]]. (2.7.1) Toán tử T được gọi là m − nửa xác định dương nếu Tm là nửa xác định dương. Dễ thấy các toán tử tuyến tính nửa xác định dương là 1 − nửa xác định dương . Nếu Tm nửa xác định dương với mọi m ∈ N∗ thì toán tử T được gọi là hoàn toàn nửa xác định dương. Lớp các toán tử tuyến tính hoàn toàn nửa xác định dương đã được mô tả một cách đầy đủ. Định lý 2.7.2. [4] (Choi, Kraus) Giả sử T : Matn(C) −→ Matk(C) là toán tử tuyến tính hoàn toàn nửa xác định dương. Khi đó tồn tại các ma trận Vi ∈ Matn×k(C), i = 1, · · · , nk sao cho T (A) = nk∑ i=1 V ∗i AVi, ∀ A ∈ Matn(C). 2.8 Bài toán bảo toàn tuyến tính chỉ số (n, 0, 0) Trong phần này, chúng tôi tóm lược một số kết quả thu được trong các đề tài thực hiện vào các năm 2009, 2010. Như đã biết, bài toán bảo toàn tuyến tính chỉ số quán tính, đặc biệt là bảo toàn lớp chỉ số (n, 0, 0) vẫn còn là một bài toán mở mặc dù ta có thể dễ dàng chỉ ra 29 nhiều dạng toán tử bảo toàn lớp chỉ số này, chẳng hạn T : Sn(R) −→ Sn(R), A −→∑r i=1 WiAW t i , ở đây Wi, i = 1, · · · , n là các ma trận khả nghịch. Về những khó khăn trong trường hợp này, có thể thấy trong [13]. Hướng tìm hiểu của chúng tôi là khảo sát bài toán này với một số giả thiết bổ sung. Cụ thể chúng tôi đưa ra dạng của toán tử tuyến tính bảo toàn hạng của các ma trận Eii và bảo toàn lớp chỉ số (n, 0, 0). Định lý 2.8.1. [1] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính bảo toàn hạng của các ma trận Eii, i = 1, 2, · · · , n và bảo toàn các ma trận xác định dương trên Sn(R). Khi đó, tồn tại ma trận nửa xác định dương H ∈ Sn(R) với các phần tử trên đường chéo chính khác 0, tồn tại ma trận khả nghịch W sao cho T (A) = W (H ◦ A)W t,∀ A ∈ Sn(R). Từ định lý trên ta suy ra ngay kết quả sau Mệnh đề 2.8.2. [2] Cho toán tử tuyến tính T : Sn(R) −→ Sn(R) xác định bởi T (A) = r∑ i=1 Wi(Hi ◦ A)W ti , ∀ A ∈ Sn(R), ở đây Wi, i = 1, · · · , r khả nghịch, Hi ∈ Sn(R), i = 1, · · · , r là các ma trận nửa xác định dương có các phần tử trên đường chéo chính khác 0. Khi đó T bảo toàn lớp chỉ số (n, 0, 0). Trong [15], Chi-Kwong-Ly và Hugo J. Woerdeman khảo sát vấn đề tương tự trên không gian Matn(K) và thu được các kết quả sau Định lý 2.8.3. [15] Giả sử T : Matn(R) −→ Matn(R) là toán tử tuyến tính bảo toàn tập các ma trận nửa xác định dương. Khi đó các mệnh đề sau đây là tương đương 1. (T (A))ii = Aii ∀ A ∈ Matn(R), ∀ 1 ≤ i ≤ n. 2. T (Eii) = Eii ∀ 1 ≤ i ≤ n. 3. Tồn tại ma trận nửa xác định dương H với các phần tử trên đường chéo chính bằng 1 và toán tử tuyến tính T˜ : {X ∈ Matn(R) : X = −Xt} −→ {X ∈ Matn(R) : Xii = 0, i = 1, · · · , n} sao cho T (A) = A ◦H + T˜ (A− At), ∀ A ∈ Matn(R). 30 Định lý 2.8.4. [15] Giả sử T : Matn(C) −→ Matn(C) là toán tử tuyến tính bảo toàn tập các ma trận nửa xác định dương. Khi đó các mệnh đề sau đây là tương đương 1. (T (A))ii = Aii ∀ A ∈ Matn(C), ∀ 1 ≤ i ≤ n. 2. T (Eii) = Eii ∀ 1 ≤ i ≤ n. 3. T (A) = A ◦ In + A ◦H + At ◦K, ∀ A ∈ Matn(C), trong đó H,K ∈ Hn là các ma trận với đường chéo chính bằng 0 thỏa mãn I +D∗KD+DHD∗ ≥ 0 với mọi ma trận đường chéo Unita D. Tuy vậy, việc mô tả một cách tường minh điều kiện "H,K ∈ Hn là các ma trận với đường chéo chính bằng 0 thỏa mãn I +D∗KD +DHD∗ ≥ 0 với mọi ma trận đường chéo Unita D" là rất khó khăn khi n ≥ 3. Hiện nay vấn đề này vẫn chưa được giải quyết triệt để. Từ Định lý 2.8.1, chúng tôi đưa ra một số lớp toán tử tuyến tính khả nghịch bảo toàn tập các ma trận xác định dương trên Sn(R). Định lý 2.8.5. [2] Cho toán tử tuyến tính T : Sn(R) −→ Sn(R) là toán tử tuyến tính. Các mệnh đề sau đây là tương đương 1. T bảo toàn chỉ số (n, 0, 0) và bảo toàn tập các ma trận suy biến. 2. T bảo toàn chỉ số (n, 0, 0) và bảo toàn tập các ma trận nửa xác định dương suy biến. 3. T (G(n, 0, 0)) = G(n, 0, 0). 4. T (Pn) = Pn. 5. Tồn tại ma trận khả nghịch W ∈ Matn(R) sao cho T (A) = WAW t, ∀A ∈ Sn(R). Một hướng tiếp cận khác của chúng tôi là xác định các toán tử tuyến tính bảo toàn chỉ số (n, 0, 0) với hạng cụ thể. Trong phần này, gọi λmin(A), λmax(A) lần lượt là các giá trị riêng nhỏ nhất và lớn nhất của ma trận A. Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính hạng r và {U1, · · · , Ur} là một cơ sở của Im(T ). Dễ thấy rằng nếu T bảo toàn chỉ số (n, 0, 0) thì U1, · · · , Ur có thể chọn trong tập Pn. Giả sử T (Eii) = ∑r k=1 b k iiUk và T (Eij + Eji) = ∑r k=1(b k ij + b k ji)Uk, b k ij = b k ji, k = 31 1, 2, · · · , r; i, j = 1, 2, · · · , n. Đặt Bk = (bkij)n×n, khi đó dễ thấy rằng với mọi ma trận A ∈ Sn(R) ta có T (A) = r∑ k=1 tr(ABk)Uk. (2.8.1) Từ Mệnh đề 1.2.9 ta suy ra kết quả sau Mệnh đề 2.8.6. [15] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính xác định bởi T (A) = r∑ k=1 tr(ABk)Uk, trong đó {U1, · · · , Ur} ⊂ Pn là hệ độc lập tuyến tính. Nếu Bk > 0 ∀ k = 1, · · · , r thì T bảo toàn chỉ số (n, 0, 0). Tuy vậy điều kiện Bk > 0 ∀ k = 1, · · · , r là rất mạnh nên lớp các toán tử thu được trong trường hợp này trở nên hẹp. Chúng tôi đặt vấn đề giảm nhẹ điều kiện trên và thu được một số kết quả trong trường hợp toán tử T có hạng 1, 2. Chúng tôi cũng giải quyết bài toán trong trường hợp hạng T bằng r với một giả thiết bổ sung. Định lý 2.8.7. [1] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính hạng 1 bảo toàn chỉ số (n, 0, 0) trên Sn(R). Khi đó, tồn tại ma trận nửa xác định dương khác không B1 ∈ Sn(R) và ma trận xác định dương U1 ∈ Sn(R) sao cho T (A) = tr(AB1)U1, ∀ A ∈ Sn(R). Định lý 2.8.8. [2] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính có dạng T (A) = tr(AB1)U1 + tr(AB2)U2, ∀A ∈ Sn(R) (2.8.2) với U1, U2 ∈ Sn(R) là các ma trận xác định dương độc lập tuyến tính. T bảo toàn chỉ số (n, 0, 0) khi và chỉ khi B1+λmin(U −1 1 U2)B2, B1+λmax(U −1 1 U2)B2 là các ma trận nửa xác định dương khác 0. Mệnh đề 2.8.9. [2] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính có dạng (2.8.1) trong đó {U1, · · · , Ur} là hệ các ma trận xác định dương độc lập tuyến tính sao cho tồn tại ma trận khả nghịch W để W tUkW = diag(λ1k, · · · , λnk), k = 1, · · · , r. T bảo toàn chỉ số (n, 0, 0) khi và chỉ khi ∑rk=1 λikUk, i = 1, · · · , n là các ma trận nửa xác định dương khác 0. 32 2.9 Một số kết quả mới Tiếp tục hướng xác định các lớp toán tử tuyến tính bảo toàn tập các ma trận xác định dương với hạng cụ thể, chúng tôi đưa ra một điều kiện đủ để toán tử dạng (2.8.1) bảo toàn chỉ số (n, 0, 0) trong trường hợp hạng T bằng 3. Trước hết, ta cần có một số bổ đề sau. Bổ đề 2.9.1. Giả sử A,B,C ∈ Sn(R) là các ma trận xác định dương. Khi đó, nếu đặt E = {(α, β, γ) ∈ R3 : αA+ βB + γC > 0} thì ta có E = {(α, β, γ) ∈ R3 : γ + λmin[C−1(αA+ βB)] > 0}. (2.9.1) Chứng minh. Với (α, β, γ) ∈ R3, theo Định lý 1.2.6 tồn tại ma trận khả nghịch W để WCW t = In,W (αA + βB)W t = diag(µ1, · · · , µn) ∼ C−1(αA + βB). Do αA + βB + γC > 0 khi và chỉ khi W (αA+ βB + γC)W t > 0 nên E = {(α, β, γ) ∈ R3 : γ + λmin[C−1(αA+ βB)] > 0}. Bổ đề 2.9.2. Cho A ∈ Sn(R) là ma trận xác định dương, B ∈ Sn(R), khi đó λmin(A −1B) ≥ min{λmin(B) λmax(A) , λmin(B) λmin(A) }. Chứng minh. Ký hiệu các ma trận W,P,K,Q tương tự chứng minh Định lý 1.2.6. Ta có λmin(A−1B) = λmin(WBW t) = min‖x‖=1 xtWBW tx. Đặt y = W tx ta có yty = xtPK2P tx = ztK2z, trong đó z = P tx. Hiển nhiên ‖z‖ = 1. Do vậy ‖y‖2 ∈ [λmax(K2), λmin(K2)] = [ 1 λmax(A) , 1λmin(A) ]. Ta có λmin(A −1B) ≥ min ‖y‖2∈[ 1λmax(A) , 1 λmin(A) ] ytBy = min ‖y‖2∈{ 1λmax(A) , 1 λmin(A) } ytBy = min{λmin(B) λmax(A) , λmin(B) λmin(A) }. Mệnh đề 2.9.3. Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính có dạng T (A) = tr(AM)In + tr(AN)D + tr(AP )K ∀A ∈ Sn(R) (2.9.2) 33 trong đó D = diag(µ1, · · · , µn) > 0, K > 0 và {In, D,K} là hệ độc lập tuyến tính. Ký hiệu µmin = min{µi, i = 1, · · · , n}, µmax = max{µi, i = 1, · · · , n}. Nếu λmax(K)P + M + µminN , λmax(K)P + M + µmaxN , λmin(K)P + M + µmaxN , λmin(K)P +M + µminN là các ma trận nửa xác định dương khác 0 thì T bảo toàn chỉ số (n, 0, 0). Chứng minh. Từ giả thiết và theo Mệnh đề 1.2.9, với mọi ma trận xác định dương A ∈ Sn(R) thì  tr(A(λmax(K)P +M + µminN)) > 0 tr(A(λmax(K)P +M + µmaxN)) > 0 tr(A(λmin(K)P +M + µminN)) > 0 tr(A(λmin(K)P +M + µmaxN)) > 0. Do vậy, nếu ký hiệu α = tr(AM), β = tr(AN), γ = tr(AP ) thì ta có γλmax(K) + α+ βµmin > 0 γλmax(K) + α+ βµmax > 0 γλmin(K) + α+ βµmin > 0 γλmin(K) + α+ βµmax > 0. Do vậy γλmax(K) + λmin(αIn + βD) > 0, γλmin(K) + λmin(αIn + βD) > 0. Theo Bổ đề 2.9.2 ta có γ + λmin[K −1(αIn + βD)] ≥ γ +min{λmin(αIn + βD) λmax(K) , λmin(αIn + βD) λmin(K) } = min{γ + λmin(αIn + βD) λmax(K) , γ + λmin(αIn + βD) λmin(K) } > 0. Theo Bổ đề 2.9.1 ta có αIn + βD + γD > 0, hay T (A) > 0 (đpcm). Mệnh đề 2.9.4. Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính có dạng T (A) = tr(AM)B1 + tr(AN)B2 + tr(AP )B3 ∀A ∈ Sn(R) (2.9.3) trong đó {B1, B2, B3} là hệ các ma trận xác định dương độc lập tuyến tính. Nếu M + λmin(B −1 1 B2)N + λmax(B −1 1 B3), M + λmax(B −1 1 B2)N + λmax(B −1 1 B3), M + λmin(B −1 1 B2)N+λmin(B −1 1 B3), M+λmax(B −1 1 B2)N+λmin(B −1 1 B3) là các ma trận nửa xác định dương khác 0 thì T bảo toàn tập các ma trận xác định dương. Chứng minh. Theo Định lý 1.2.6 tồn tại ma trận khả nghịch W sao cho WB1W t = In,WB2W t = D = diag(µ1, · · · , µn),WB3W t = K > 0. Đặt T1 : Sn(R) −→ 34 Sn(R), T1(A) = WT (A)W t. Khi đó T bảo toàn chỉ số (n, 0, 0) khi và chỉ khi T1 bảo toàn chỉ số (n, 0, 0) đồng thời T1(A) = tr(AM)In + tr(AN)D + tr(AP )K ∀A ∈ Sn(R). Áp dụng Mệnh đề 2.9.4 và Định lý 1.2.6 ta có đpcm. Tiếp tục theo hướng này, chúng tôi đưa ra một điều kiện đủ để toán tử tuyến tính dạng (2.8.1) bảo toàn chỉ số (n, 0, 0). Bổ đề 2.9.5. Với các ma trận X1, · · · , Xr ∈ Sn(R) ta có λmin( r∑ i=1 Xi) ≥ r∑ i=1 λmin(Xi). Chứng minh. Ta có λmin( r∑ i=1 Xi) = min‖x‖=1 xt( r∑ i=1 Xi)x = min ‖x‖=1 r∑ i=1 xt(Xi)x ≥ r∑ i=1 min ‖x‖=1 xt(Xi)x = r∑ i=1 λmin(Xi). Bổ đề 2.9.6. Với mọi ma trận X1, · · · , Xr ∈ Sn(R), với mọi α1, · · · , αr ∈ R, đặt B = {∑ri=1 αiλ(Xi), λ ∈ {λmin, λmax}}. Khi đó ta có λmin( r∑ i=1 αiXi) ≥ minB. Chứng minh. Áp dụng Bổ đề 2.9.5 với chú ý rằng với X ∈ Sn(R), α ∈ R thì λmin(αX) ∈ {αλmin(X), αλmax(X)}. Mệnh đề 2.9.7. Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính hạng r có dạng T (A) = r∑ k=1 tr(ABk)Uk, ∀ A ∈ Sn(R), ở đây Uk, k = 1, · · · , r là các ma trận xác định dương độc lập tuyến tính. Nếu∑r k=1 λ(Uk)Bk, λ ∈ {λmin, λmax} là các ma trận nửa xác định dương khác 0 thì T bảo toàn chỉ số (n, 0, 0). 35 Chứng minh. Từ giả thiết và Mệnh đề 1.2.9 ta có ∑r k=1 λ(Uk)tr(ABk) > 0, λ ∈ {λmin, λmax}, suy ra min{ ∑r k=1 λ(Uk)tr(ABk), λ ∈ {λmin, λmax}} > 0. Theo Bổ đề 2.9.6 ta có λmin( ∑r k=1 tr(ABk)Uk) ≥ minB > 0. Vậy T (A) > 0 (đpcm). Nhận xét 2.9.8. Điều kiện trên chỉ là một điều kiện đủ để T bảo toàn chỉ số (n, 0, 0). Thực vậy, xét n = r = 2, U1 = ( 1 0 0 2 ) , U2 = ( 6 2 2 3 ) . Khi đó các giá trị riêng của ma trận U−11 U2 là λ1 = 15 + √ 113 4 , λ2 = 15−√113 4 . Rõ ràng với B1 = ( −1.05 0 0 −1.05 ) , B2 = ( 1 0 0 1 ) thì B1 + λ1B2, B1 + λ2B2 là các ma trận nửa xác định dương khác 0. Theo Định lý 2.8.8 thì toán tử tuyến tính T xác định bởi T (A) = tr(AB1)U1 + tr(AB2)U2, ∀A ∈ S2(R) bảo toàn chỉ số (2, 0, 0). Bằng tính toán cụ thể ta có ngay λmax(U1)B1+λmin(U2)B2 = 2[B1 +B2] = ( −0.1 0 0 −0.1 ) không phải là ma trận nửa xác định dương. 36 Chương 3 TRUNG BÌNH NHÂN CỦA CÁC MA TRẬN Trong chương này, chúng tôi giới thiệu khái niệm trung bình của các ma trận xác định dương như là một sự mở rộng khái niệm trung bình nhân của các số nguyên dương. Trên cơ sở đó, chúng tôi trình bày một số loại trung bình ma trận, đặc biệt là trung bình nhân của hai ma trận xác định dương, các tính chất và một số biểu diễn của nó. Chúng tôi cũng trình bày hướng mở rộng khái niệm trung bình nhân của nhiều ma trận xác định dương dựa vào quy nạp được T. Ando, Chi-Kwong Li, Roy Mathias đưa ra trong [3]. Cuối cùng, chúng tôi tóm lược cách tiếp cận mới nhất trong lĩnh vực này được M. Moakher và Rajendra Bhatia, John Holbrook đưa ra trong [17], [5]. 3.1 Trung bình của hai ma trận xác định dương và một số tính chất Giả sử a, b là hai số nguyên dương. Ta đã biết trung bình số học, trung bình nhân, trung bình điều hòa của a, b lần lượt là các đại lượng A(a, b) = a+ b 2 ; G(a, b) = √ ab; H(a, b) = ( a−1 + b−1 2 )−1 . Một cách tổng quát, hàm số M : R∗+×R∗+ → R∗+ có thể xem là hàm trung bình nếu các tính chất sau đây được thỏa mãn với mọi số dương a, b : 1. M(a, b) > 0. 37 2. Nếu a ≤ b thì a ≤ M(a, b) ≤ b. 3. M(a, b) = M(b, a). 4. M(a, b) đơn điệu tăng theo a, b. 5. M(αa, αb) = αM(a, b), ∀α > 0. 6. M(a, b) liên tục. Giữa trung bình cộng, trung bình nhân và trung bình điều hòa ta có bất đẳng thức quen thuộc sau H(a, b) ≤ G(a, b) ≤ A(a, b). (3.1.1) Bây giờ ta sẽ mở rộng khái niệm trung bình của các số nguyên dương cho trường hợp các ma trận xác định dương. Rõ ràng một hàm ma trận được coi là trung bình nếu nó thỏa mãn một số tính chất nhất định tương tự như hàm trung bình của các số nguyên dương. Tính chất 5 được viết dưới dạng tương đương là M(xax, xbx) = xM(a, b)x ∀x ∈ C, x 6= 0. Một cách tự nhiên, hàm ma trận M : Pn × Pn → Pn được xem là hàm trung bình nếu các tính chất sau đây được thỏa mãn với mọi ma trận xác định dương A,B : 1. M(A,B) > 0. 2. Nếu A ≤ B thì A ≤ M(A,B) ≤ B. 3. M(A,B) = M(B,A). 4. M(A,B) đơn điệu tăng theo A,B. 5. M(X∗AX,X∗BX) = X∗M(A,B)X với mọi ma trận X khả nghịch. 6. M(A,B) liên tục. Ví dụ 3.1.1. Có thể mở rộng khái niệm trung bình số học và trung bình điều hòa của hai số nguyên dương sang cho trường hợp ma trận xác định dương một cách hợp lý A(A,B) = A+B 2 ; H(A,B) = ( A−1 +B−1 2 )−1 . 38 Tuy vậy, đối với trong trường hợp trung bình nhân thì không đơn giản. Định nghĩa G(A,B) = A 1 2B 1 2 sẽ không hợp lý vì ma trận này không phải luôn là ma trận đối xứng. Định nghĩa G(A,B) = A 1 2B 1 2 +B 1 2A 1 2 2 cũng không hợp lý vì tính chất 1 không phải lúc nào cũng xảy ra (xem Nhận xét 1.3.1). Đối với hai ma trận đường chéo A > 0, B > 0 thì có thể định nghĩa G(A,B) = A 1 2B 1 2 . Với mỗi X ∈ GLn(C), đặt TX(A) = X∗AX, ∀A ∈ Matn(C). Toán tử TX xác định như trên được gọi là phép tương đẳng. Dễ thấy {TX |X ∈ GLn(C)} là một nhóm với phép hợp thành bảo toàn tập các ma trận xác định dương. Ta cũng dùng ký hiệu TX(A,B) để chỉ (TX(A), TX(B)). Giả sử A > 0, B > 0, khi đó T A− 1 2 (A,B) = (I, A− 1 2BA− 1 2 ). Lấy ma trận Unita U sao cho U∗A− 1 2BA− 1 2U = D, với D là ma trận đường chéo, ta có T A− 1 2U (A,B) = (I,D). Theo nhận xét ban đầu của ta, đối với các ma trận đường chéo I,D thì G(I,D) = D 1 2 = U∗(A− 1 2BA− 1 2 ) 1 2U. (3.1.2) Mặc khác, hàm trung bình nhân phải thỏa mãn tính chất 5, do vậy từ đẳng thức (3.1.2) ta hoàn toàn xác định được trung bình nhân của hai ma trận A,B. Định nghĩa 3.1.1. Trung bình nhân của hai ma trận A,B, ký hiệu A]B (hoặc G(A,B)) được xác định bởi A]B = A 1 2 (A− 1 2BA− 1 2 ) 1 2A 1 2 . (3.1.3) Nhận xét 3.1.2. A]B là nghiệm xác định dương duy nhất của phương trình Riccati XA−1X = B. (3.1.4) Từ định nghĩa, ta suy ra ngay một số tính chất của trung bình nhân hai ma trận. Mệnh đề 3.1.3. [4] Nếu A,B là các ma trận xác định dương thì (A]B)−1 = A−1]B−1 Mệnh đề 3.1.4. [4] Nếu A,B là các ma trận xác định dương thì A]B = B]A 39 Chứng minh. Nếu X0 là nghiệm xác định dương của phương trình 3.1.4 thì X0 cũng là nghiệm xác định dương của phương trình ma trận XB−1X = A. Mệnh đề 3.1.5. [4] Nếu A,B là các ma trận xác định dương thì( A A]B A]B B ) ≥ 0. (3.1.5) Chứng minh. Ta có A = (A]B)B−1(A]B). Theo Mệnh đề 1.5.6 ta có ngay bất đẳng thức cần chứng minh. Mệnh đề 3.1.6. [4] Nếu A,B là các ma trận xác định dương thì H(A,B) ≤ A]B ≤ A(A,B). (3.1.6) Chứng minh. Ta có (A− 1 2BA− 1 2 − I)2 ≥ 0 ⇒ 4A−12BA−12 ≤ (A−12BA−12 + I)2 ⇒ (A−12BA−12 )12 ≤ I + A −12BA− 1 2 2 ⇒ (A−12BA−12 )12 ≤ A−12 ( A+B 2 ) A− 1 2 ⇒ A]B ≤ A(A,B). Áp dụng bất đẳng thức vừa chứng minh cho hai ma trận A−1, B−1 và Mệnh đề 3.1.3 ta có H(A,B) ≤ A]B. Như vậy, khái niệm trung bình nhân hai ma trận ma ta vừa xây dựng thỏa mãn 6 yêu cầu đặt ra ban đầu đối với một hàm trung bình. Hơn thế nữa, bất đẳng thức giữa trung bình cộng, trung bình nhân và trung bình điều hòa cũng được thỏa mãn. 3.2 Một số biểu diễn của trung bình nhân hai ma trận Mệnh đề 3.2.1. [4] Nếu A,B là các ma trận xác định dương thì A]B = max { X ∈ Hn : ( A X X B ) ≥ 0 } . (3.2.1) 40 Chứng minh. Ta có( A X X B ) ≥ 0 ⇒ A ≥ XB−1X ⇒ B−12AB−12 ≥ B−12XB−1XB−12 ⇒ B−12AB−12 ≥ (B−12XB−12 )2 ⇒ (B−12AB−12 )12 ≥ B−12XB−12 . Tác động T B 1 2 vào hai vế ở đẳng thức cuối ta có đpcm. Nếu đặt U = (A− 1 2BA− 1 2 ) 1 2A 1 2B− 1 2 thì ta có U là ma trận Unita và A]B = A 1 2UB 1 2 . Hơn nữa ta có kết quả sau Mệnh đề 3.2.2. [4] Nếu A,B > 0 và U là ma trận unita sao cho A 1 2UB 1 2 > 0 thì A]B = A 1 2UB 1 2 . Chứng minh. Đặt G = A 1 2UB 1 2 , ta có( A G G B ) = ( A 1 2 O O B 1 2 )( I U U∗ I )( A 1 2 O O B 1 2 ) ∼ ( I U U∗ I ) ∼ ( O O O I ) . Mặc khác ta có ( A G G B ) ∼ ( A−GB−1G O O B ) . Vậy A − GB−1G = 0, hay G là nghiệm của phương trình Riccati A = XB−1X. Do đó G = A]B. Mệnh đề 3.2.3. [4] A]B = A(A−1B) 1 2 = (AB−1) 1 2B. Chứng minh. Ta có A− 1 2BA− 1 2 = A 1 2A−1BA− 1 2 = [A 1 2 (A−1B) 1 2A− 1 2 ]2. Lấy căn bậc hai hai vế ta được (A− 1 2BA− 1 2 ) 1 2 = A 1 2 (A−1B) 1 2A− 1 2 . Vậy A]B = A(A−1B) 1 2 . Chứng minh hoàn toàn tương tự ta được A]B = (AB−1) 1 2B. Mệnh đề 3.2.4. [4] A]B = (A+B)[(A+B)−1A(A+B)−1B] 1 2 . 41 Chứng minh. Áp dụng đồng nhất thức X = (X−1 + I)−1(I +X) đối với ma trận A−1B ta được A−1B = (B−1A+ I)−1(I + A−1B) = (A+B)−1(AB−1)−1(A+B). Lấy căn bậc hai hai vế ta được (A−1B) 1 2 = (A+B)−1(AB−1)− 1 2 (A+B). Biến đổi ta được A(A−1B) 1 2 (A+B)−1(AB−1) 1 2B = A(A+B)−1B. Theo Mệnh đề 3.2.3, đẳng thức vừa thu được có thể viết lại dưới dạng A]B(A+B)−1A]B = A(A+B)−1B. Nhân hai vế đẳng thức trên với (A+B)−1 và lấy căn bậc hai hai vế ta có đpcm. Trong trường hợp n = 2, ta có công thức biểu diễn trung bình nhân khá đẹp mắt. Mệnh đề 3.2.5. [4] Giả sử A,B ∈ P2,det(A) = det(B) = 1, khi đó ta có A]B = A+B√ det(A+B) . (3.2.2) Chứng minh. Đặt X = (A−1B) 1 2 ta có ngay det(X) = 1. Gọi λ, 1 λ là các giá trị riêng của X (λ > 0). Ta có det(A+B) = det(A(I +X2) = det(I +X2) = (λ+ 1 λ )2. Do vậy tr(X) = λ + 1 λ = √ det(A+B). Theo định lý Caley - Hamilton, X là nghiệm của phương trình X2 − √ det(A+B)X + I. Do vậy ta có A−1B − √ det(A+B)(A−1B) 1 2 + I. Nhân hai vế đẳng thức trên cho A và rút gọn ta có đpcm. Hệ quả 3.2.6. [4] Giả sử A,B ∈ P2,det(A) = α2,det(B) = β2, α, β > 0, khi đó ta có A]B = √ αβ√ det(α−1A+ β−1B) (α−1A+ β−1B). (3.2.3) 42 3.3 Mở rộng khái niệm trung bình nhân bằng phương pháp quy nạp Ở mục trước, chúng ta đã định nghĩa trung bình hình học của hai ma trận xác định dương A,B là ma trận A]B = A 1 2 (A− 1 2BA− 1 2 ) 1 2A 1 2 . Trong mục này, chúng ta trình bày phương pháp xây dựng khái niệm trung bình hình học tổng quát của T. Ando, Chi-Kwong Li và Roy Mathias. Ý tưởng chủ yếu của phương pháp này xuất phát từ một kết quả đơn giản trong giải tích. Xét ba dãy số xn, yn, zn được xác định bằng truy hồi x0 = a, y0 = b, z0 = c, xn+1 = xn + yn 2 , yn+1 = xn + zn 2 , zn+1 = yn + zn 2 , n ∈ N. Khi đó ta có lim n→∞ xn = limn→∞ yn = limn→∞ zn = a+ b+ c 3 . Chúng ta lưu ý rằng a+ b+ c 3 chính là trung bình cộng của a, b, c. Về mặt hình học, nếu ta xem ba vector a, b, c biểu diễn ba đỉnh của tam giác A0B0C0 thì các vector x1, y1, z1 sẽ biểu diễn ba trung điểm A1, B1, C1 của tam giác A0B0C0. Ta dễ dàng nhận thấy tam giác AiBiCi dần về trọng tâm của tam giác A0B0C0 khi n dần ra vô cùng. Một cách tổng quát, giả sử M là hàm trung bình hai biến và a, b, c là ba số thực dương bất kỳ cho trước, ta xây dựng bằng truy hồi các dãy số xn, yn, zn như sau: x0 = a, y0 = b, z0 = c, xn+1 = M(xn, yn), yn+1 = M(xn, zn), zn+1 = M(yn, zn), n ∈ N. Khi đó ta có lim n→∞ xn = limn→∞ yn = limn→∞ zn. Một cách tự nhiên, ta coi giới hạn này chính là M(a, b, c). Dựa trên ý tưởng này ta đưa ra khái niệm trung bình nhân của các ma trận xác định dương trong trường hợp tổng quát bằng quy nạp. Trước hết, ta cần có một số kiến thức chuẩn bị. Ký hiệu ρ(X) là bán kính phổ của X. Với hai ma trận xác định dương A,B ta có ρ(A−1B) = ρ(A −1 2 BA −1 2 ) = ρ(B 1 2A−1B 1 2 ) = min{α ∈ R : B ≤ αA}. (3.3.1) Đặt R(A,B) = max{ρ(A−1B), ρ(B−1A)} (3.3.2) ta có 43 Định lý 3.3.1. Hàm R : Pn × Pn → R+ thỏa mãn các tính chất sau đây: R(A,B) ≥ 1, R(A,B) = 1 ⇔ A = B; (3.3.3) R(A,C) ≤ R(A,B)R(B,C) ∀ A,B,C > 0; (3.3.4) R(A,B)−1A ≤ B ≤ R(A,B)A; (3.3.5) ‖A−B‖ ≤ (R(A,B)− 1) ‖A‖ ; (3.3.6) R(G(A1, A2), G(B1, B2)) ≤ [R(A1, B1)R(A2, B2)]12 . (3.3.7) Chứng minh. Các tính chất từ (3.3.3) - (3.3.6) có thể dễ dàng suy ra từ lý thuyết về ma trận xác định dương trình bày trong chương 1. Để chứng minh (3.3.7), ta chú ý rằng Bi ≤ ρ(A−1i Bi)Ai, i = 1, 2. Sử dụng tính đơn điệu của trung bình nhân ta có G(B1, B2) ≤ √ ρ(A−11 B1)ρ(A −1 2 B2)G(A1, A2). Từ (3.3.1) ta có ρ(G(A1, A2) −1G(B1, B2)) ≤ [R(A1, B1)R(A2, B2)]12 . Hoàn toàn tương tự ta có ρ(G(B1, B2) −1G(A1, A2)) ≤ [R(A1, B1)R(A2, B2)]12 . Vậy (3.3.7) đúng. Bây giờ, ta bắt đầu xây dựng khái niệm trung bình nhân tổng quát cho n ma trận. Trước hết, xét trường hợp n = 3. Trong [3], hàm G : P3n → Pn được coi là trung bình nhân nếu nó thỏa mãn các tính chất sau 1. G(A,B,C) = (ABC) 1 3 khi A,B,C giao hoán. 2. G(αA, βB, γC) = (αβγ) 1 3G(A,B,C) với mọi α, β, γ > 0. 3. Với mọi hoán vị pi của (A,B,C) ta có G(A,B,C) = G(pi(A,B,C)). 4. G đơn điệu tăng. 5. G liên tục. 6. Với mọi ma trận khả nghịch S ta cóG(S∗AS, S∗BS, S∗CS) = S∗G(A,B,C)S. 44 7. Với mọi λ ∈ (0, 1) ta cóG(λA1+(1−λ)A2, λB1+(1−λ)B2, λC1+(1−λ)C2) ≥ λG(A1, B1, C1) + (1− λ)G(A2, B2, C2). 8. G(A,B,C) = G(A−1, B−1, C−1)−1. 9. detG(A,B,C) = (detA.detB.detC) 1 3 . Rõ ràng trong trường hợp n = 2, định nghĩa G(A,B) = A]B thỏa 9 tính chất trên. Giả sử ta đã định nghĩa được trung bình nhân G(X1, · · · , Xk) của k ma trận xác định dương X1, · · · , Xk bất kỳ. Với k + 1 ma trận xác định dương A1, · · · , Ak+1, xét A = (A1, · · · , Ak+1) và đặt Tk+1(A) = (G((Ai)i6=1), G((Ai)i6=2), · · · , G((Ai)i 6=k+1)). Định nghĩa 3.3.1. 1. Khi k = 2 ta định nghĩa G(A1, A2) = A1]A2. 2. Giả sử ta đã định nghĩa trung bình nhân G(X1, · · · , Xk) của k ma trận xác định dương X1, · · · , Xk bất kỳ. Khi đó, dãy {T rk+1(A)}∞r=1 hội tụ về (A˜, · · · , A˜). Ta định nghĩa G(A1, · · · , Ak+1) = A˜. Dưới đây ta sẽ chỉ ra định nghĩa ở trên là hoàn toàn hợp lý. Định lý 3.3.2. [3] Giả sử A1, · · · , Ak+1 là các ma trận xác định dương. Đặt A(r+1) = Tk+1(A(r)), khi đó dãy {A(r)1 , · · · , A(r)k+1}∞r=1 hội tụ về (A˜, · · · , A˜) và khái niệm trung bình hình học định nghĩa ở trên thỏa mãn 9 tính chất đã nêu ban đầu, hơn nữa ta có R(G(A1, · · · , Ak), G(B1, · · · , Bk)) ≤ [ k∏ i=1 R(Ai, Bi)] 1 k , k = 2, 3, . . . (3.3.8) Chứng minh. Ta chứng minh bằng quy nạp. Với k = 2 định lý đúng do các tính chất của A]B. Giả sử ta đã xây dựng được khái niệm trung bình nhân cho k ma trận và định lý đúng đến k. Ta chứng minh định lý đúng với k + 1. Đặt S = {(1, 2), (2, 3), · · · , (k, k + 1), (k + 1, 1)}, lúc đó với mọi (p, q) ∈ S, theo giả thiết quy nạp, với mọi r ≥ 1 ta có R(A(r+1)p , A (r+1) q ) ≤ R(A(r)p , A(r)q ) 1 k . Đặt Rr = ∏ (p,q)∈S R(A (r) p , A (r) q ) từ bất đẳng thức trên ta có 1 ≤ Rr+1 ≤ (Rr) 1k . (3.3.9) 45 Lấy i 6= j (không mất tính tổng quát ta giả sử j < i), áp dụng bất đẳng thức tam giác nhiều lần ta có R(A(r)j , A (r) i ) ≤ i−1∏ k=j R(A(r)k , A (r) k+1) ≤ Rr (3.3.10) Sử dụng các bất đẳng thức (3.3.9) và (3.3.10) ta được R(A(r+1)i , A (r) i ) = R(G((A (r) j )j 6=i), A (r) i ) = R(G((A(r)j )j 6=i), G(A (r) i , · · · , A(r)i )) ≤ ∏ j 6=i R(A(r)j , A (r) i ) 1 k ≤ ∏ j 6=i R 1 k r = Rr ≤ R 1 k r−1 ≤ · · · ≤ R 1 kr−1 1 . Đặt R1 = 1 + α,M = max{‖Ai‖ : i = 1, · · · , k + 1} ta có∥∥∥A(r+1)i − A(r)i ∥∥∥ ≤ (R 1kr−11 − 1)M ≤ 1kr−1αM. Do chuỗi ∑∞ r=1 1 kr−1 hội tụ nên dãy (A(r)i )r là dãy Cauchy. Không gian Matn(C) đủ nên dãy trên hội tụ về A˜i. Từ bất đẳng thức (3.3.9) cho r dần ra vô cùng ta được ∏ (p,q)∈S R(A˜p, A˜q) = 1. Từ đây ta có ngay A˜1 = A˜2 = · · · , A˜k+1. Tiếp theo, ta chứng minh (3.3.8). Giả sử A1, · · · , Ak+1, B1, · · · , Bk+1 là các ma trận xác định dương. Với mọi r ≥ 1 và j ∈ {1, · · · , k + 1}, theo giả thiết quy nạp ta có R(A(r+1)j , B (r+1) j ) = R(G((A (r) i )i6=j), G((B (r) i )i6=j)) ≤ [ ∏ i 6=j R(A(r)i , B (r) i )] 1 k . Do vậy k+1∏ j=1 R(A(r+1)j , B (r+1) j ) ≤ k+1∏ j=1 [ ∏ i6=j R(A(r)i , B (r) i )] 1 k = k+1∏ j=1 R(A(r)j , B (r) j ). Sử dụng bất đẳng thức trên k lần, cuối cùng ta thu được: k+1∏ j=1 R(A(r+1)j , B (r+1) j ) ≤ k+1∏ j=1 R(Aj, Bj). 46 Cho r dần ra vô cùng ta có R(A˜, B˜)k+1 ≤ k+1∏ j=1 R(Aj, Bj). Lấy căn bậc k + 1 cả hai vế ta có đpcm. Cuối cùng, các tính chất 1 - 9 được suy từ các tính chất của giới hạn. Ta chứng minh tính chất 3. Các tính chất còn lại là hiển nhiên. Ta vẫn giả sử kết quả đã đúng đến k. Giả sử (i1, · · · , ik+1) là một hoán vị của (1, · · · , k + 1). Đặt Bj = Aij , j = 1, · · · , k + 1. Trước hết bằng quy nạp theo r ta chỉ ra với mọi j = 1, · · · , k + 1, với mọi r ≥ 1 ta có B(r)j = A(r)ij . Với r = 1, kết quả hiển nhiên đúng theo cách đặt Bj. Giả sử kết quả đúng đến r. Ta chứng minh nó đúng với r + 1. Ta có B (r+1) j = G((B (r) l )l 6=j) = G((A (r) il )l 6=j) = G((A (r) m )m 6=ij) = A (r+1) ij . Từ đây ta có ngay (B˜, B˜, · · · , B˜) = lim r→∞(B (r) 1 , · · · , B(r)k+1) = limr→∞(A (r) i1 , · · · , A(r)ik+1) = (A˜, A˜, · · · , A˜). Do vậy G(Ai1, · · · , Aik+1) = B˜ = A˜ = G(A1, · · · , Ak+1). Tóm lại, ta đã mở rộng khái niệm trung bình nhân cho trường hợp tổng quát. Tuy vậy, cách xây dựng bằng quy nạp khá phức tạp và không thuận lợi cho tính toán. Ví dụ dưới đây cho ta thấy ngay điều đó. Ví dụ 3.3.3. [3] Tính trung bình nhân của các ma trận A = ( 2 1 1 1 ) , B =( 1 1 1 2 ) , C = I2. Đặt (A0, B0, C0) = (A,B,C) và Ar+1 = Br]Cr, Br+1 = Cr]Ar, Cr+1 = Ar]Br, ∀r ≥ 0. Bằng quy nạp ta sẽ chứng tỏ với mọi số tự nhiên r, tồn tại αr, βr ≥ 0 sao cho Ar = αrA+ βrB + βrC, Br = βrA+ αrB + βrC, Cr = βrA+ βrB + αrC. 47 Với r = 0, kết quả trên hiển nhiên đúng, giả sử kết quả trên đúng với r ≥ 1, ta chứng minh nó cũng đúng với r + 1. Gọi Θ là phép toán trên Mat2(C) xác định bởi Θ(X) = ( x22 −x12 −x21 x11 ) , với X = ( x11 x12 x21 x22 ) . Rõ ràng Θ là ánh xạ tuyến tính, đồng thời nếu hai ma trận X, Y có định thức bằng 1 thì ta có det(X + Y ) = 2 + tr(Θ(X).Y ). Do det(Ar) = det(Br) = det(Cr) = 1 nên theo Mệnh đề 3.2.5 ta có Ar+1 = 1√ 2 + tr(Θ(Br).Cr) (Br + Cr), Br+1 = 1√ 2 + tr(Θ(Cr).Ar) (Cr + Ar), Cr+1 = 1√ 2 + tr(Θ(Ar).Br) (Ar +Br). Từ các đẳng thức tr(Θ(A).A) = tr(Θ(B).B) = tr(Θ(C).C) = 2, tr(Θ(A).B) = tr(Θ(A).C) = 3, tr(Θ(B).C) = tr(Θ(B).A) = 3, tr(Θ(C).A) = tr(Θ(C).B) = 3 và giả thiết quy nạp ta tính được tr(Θ(Ar).Br) = tr(Θ(Br).Cr) = tr(Θ(Cr).Ar) = 3α 2 r + 10αrβr + 11β 2 r = γr. Theo giả thiết quy nạp ta có Ar+1 = Br]Cr = Br + Cr√ 2 + tr(Θ(Br).Cr) = (2βr)A+ (αr + βr)B + (αr + βr)C√ 2 + γr , Br+1 = Ar]Cr = Ar + Cr√ 2 + tr(Θ(Ar).Cr) = (αr + βr)A+ (2βr)B + (αr + βr)C√ 2 + γr , Ar+1 = Br]Cr = Ar +Br√ 2 + tr(Θ(Ar).Br) = (αr + βr)A+ (αr + βr)B + (2βr)C√ 2 + γr . Vậy kết quả đúng với r + 1. Do các ma trận A,B,C độc lập tuyến tính và G(A,B,C) = lim r→∞Ar = limr→∞Br = limr→∞Cr 48 ta có ngay lim r→∞αr = limr→∞ βr = α. Vậy G(A,B,C) = α(A+B + C). Do det(G(A,B,C)) = 1 nên ta tính được ngay α = 1√ 12 . Tóm lại G(A,B,C) = 1√ 3 ( 2 1 1 2 ) . Cũng bằng phương pháp tương tự trên, trong [18] De’nes Petz đưa ra cách xây dựng trung bình nhân ma trận khá sơ cấp cho trường hợp n = 3. Trong trường hợp 0 < A ≤ B ≤ C và M2 là hàm trung bình hai biến tổng quát, Petz chỉ ra rằng các dãy (An)n, (Bn)n, (Cn)n xác định bởi A1 = A,B1 = B,C1 = C và An+1 = M2(An, Bn), Bn+1 = M2(An, Cn), Cn+1 = M2(Bn, Cn) sẽ có giới hạn chung M3(A,B,C) = lim n An = lim n Bn = lim n Cn. Trong trường hợp A,B,C là các ma trận xác định dương, bằng cách sử dụng kết quả trên cho các ma trận A ≤ αB ≤ γC, có thể dễ dàng chỉ ra các dãy truy hồi (An)n, (Bn)n, (Cn)n xác định bởi A1 = A,B1 = B,C1 = C, An+1 = An]Bn, Bn+1 = An]Cn, Cn+1 = Bn]Cn tồn tại giới hạn chung. 3.4 Mở rộng khái niệm trung bình nhân dựa vào hình học Riemann Có một cách tiếp cận khác đối với các hàm trung bình. Ký hiệu x0 = argminf để chỉ x0 là điểm duy nhất mà tại đó hàm f đạt giá trị nhỏ nhất, khi đó ta có A(x1, · · · , xn) = argmin x>0 n∑ i=1 de(x, xk) 2, ở đây de(x, y) = |x− y| là khoảng cách Euclid trên R. Tương tự ta có G(x1, · · · , xn) = argmin x>0 n∑ i=1 dh(x, xk) 2, 49 ở đây dh(x, y) = | log x− log y| là khoảng cách Hyperbolic trên R. Một cách tổng quát, trung bình M(x1, · · · , xn) của các số dương x1, · · · , xn được xác định bởi M(x1, · · · , xn) = argmin x>0 n∑ i=1 d(x, xk) 2, trong đó d là một metric trên R. Bây giờ ta sẽ tìm cách mở rộng hướng tiếp cận trên cho trường hợp các ma trận xác định dương. Muốn vậy, ta cần xác định metric trên Pn tương ứng với trung bình nhân. Như sẽ thấy dưới đây, tập Pn khi được trang bị một metric sẽ là một đa tạp Riemann. Ta đã biết Matn(C) là không gian Hilbert với tích vô hướng Euclid (còn gọi là tích vô hướng Frobenius) 〈A,B〉 = trA∗B và chuẩn tương ứng ‖A‖F = (tr(A∗.A)) 1 2 . Ta cũng biết Hn là không gian con của Matn(C) và Pn là tập mở của Hn, do đó Pn là một đa tạp khả vi. Cũng vì Pn là tập mở của Hn nên với mỗi A ∈ Pn, ta đồng nhất không gian tiếp xúc TA của Pn tại A với Hn. Tích vô hướng trên Hn cảm sinh một metric Riemann trên đa tạp Pn. Trên không gian tiếp xúc tại A ∈ Pn, tích vô hướng và chuẩn tương ứng được xác định bởi 〈H,K〉A = tr(A−1HA−1K); ‖H‖A = 〈H,H〉 1 2 A = ∥∥∥A−12HA−12∥∥∥ F . (3.4.1) Nếu γ : [a, b] −→ Pn là đường khả vi thì độ dài của γ được xác định bởi L(γ) = ∫ b a ∥∥γ′(t)∥∥ γ(t) dt = ∫ b a ∥∥∥γ−12 (t)γ′(t)γ−12 (t)∥∥∥ F dt. (3.4.2) Dễ dàng chứng minh được L(TX ◦ γ) = L(γ) với mọi X ∈ GLn(C) và với mọi đường khả vi γ. Với hai điểm A,B ∈ Pn, đặt δ2(A,B) = inf {L(γ) : γ là đường khả vi nối A và B}. (3.4.3) Khi đó δ2 cũng là một metric trên Pn và dưới đây ta sẽ chỉ ra rằng có duy nhất một đường khả vi γ0 nối A và B để δ2(A,B) = L(γ0). Đường γ0 như thế được gọi là đường trắc địa nối A và B. Ta dùng ký hiệu [A,B] để chỉ đường trắc địa nối hai điểm A,B ∈ Pn. Đồng thời, với hai điểm H,K ∈ Hn, ký hiệu [H,K] được dùng để chỉ đoạn thẳng H(t) = (1− t)H + tK, 0 ≤ t ≤ 1 nối hai điểm H,K trên Hn. Để chứng tỏ sự tồn tại của các đường trắc địa nêu trên, cần một số kiến thức về các hàm ma trận eX , logX mà ta không có điều kiện trình bày ở đây. Người 50 ta chứng minh được rằng với công thức tính đạo hàm của hàm lũy thừa tại điểm H ∈ Hn cho bởi DeH(K) = lim t→0 eH+tK − eH t thì ∥∥∥e−H2 DeH(K)e−H2 ∥∥∥ F ≥ ‖K‖F , ∀ H,K ∈ Hn. (3.4.4) Từ bất đẳng thức trên và công thức (3.4.2) ta có ngay nếu H(t), a ≤ t ≤ b là một đường khả vi bất kỳ trên Hn và γ(t) = eH(t) thì L(γ) ≥ ∫ b a ∥∥H ′(t)∥∥ F dt. (3.4.5) Giả sử γ(t) là một đường khả vi bất kỳ nối A,B ∈ Pn, khi đó H(t) = log γ(t) là đường khả vi nối logA và logB trên Hn. Độ dài đường khả vi này không nhỏ hơn độ dài đoạn thẳng nối logA và logB. Do vậy, từ bất đẳng thức (3.4.5) ta có Định lý 3.4.1. [5] Với hai điểm A,B ∈ Pn ta có δ2(A,B) ≥ ‖logA− logB‖F . (3.4.6) Bây giờ ta sẽ chứng minh sự tồn tại của các đường trắc địa, trước hết cho trường hợp hai ma trận giao hoán. Mệnh đề 3.4.2. [5] Giả sử A,B ∈ Pn là các ma trận giao hoán. Khi đó ánh xạ lũy thừa biến đoạn thẳng [logA, logB] trong Hn thành đường trắc địa [A,B] trong Pn. Trong trường hợp này ta có δ2(A,B) = ‖logA− logB‖F . Chứng minh. Ta sẽ chứng tỏ rằng đường γ(t) = exp((1− t) logA+ t logB), 0 ≤ t ≤ 1, là đường duy nhất có độ dài ngắn nhất nối A,B trong không gian (Pn, δ2). Do A,B giao hoán nên γ(t) = A1−tBt và γ′(t) = (logA− logB)γ(t). Theo công thức (3.4.2) ta có L(γ) = ∫ b a ‖logA− logB‖F dt = ‖logA− logB‖F . Từ Định lý 3.4.1 ta thấy γ chính là đường ngắn nhất nối A và B. Giả sử γ˜ là một đường nối A và B sao cho L(γ˜) = L(γ). Khi đó H˜(t) = log γ˜(t) là đường nối logA và logB trong Hn. Từ bất đẳng thức (3.4.5) ta có độ dài của H˜(t) bằng 51 ‖logA− logB‖F . Thế nhưng ta đã biết trong không gian Euclid thì đoạn thẳng chính là đường duy nhất có độ dài nhỏ nhất nối hai điểm cho trước. Do đó H˜ là tham số của đoạn thẳng [logA, logB]. Vậy γ˜ là một tham số khác của γ. Mệnh đề 3.4.3. [5] Giả sử A,B là các ma trận bất kỳ thuộc Pn. Tồn tại duy nhất đường trắc địa [A,B] nối A và B có tham số γ(t) = A 1 2 (A− 1 2BA− 1 2 )tA 1 2 , 0 ≤ t ≤ 1, (3.4.7) đồng thời δ2(A, γ(t)) = tδ2(A,B). (3.4.8) Hơn thế nữa, chúng ta có δ2(A,B) = ∥∥∥logA−12BA−12∥∥∥ F . (3.4.9) Chứng minh. Các ma trận I và A− 1 2BA− 1 2 giao hoán. Áp dụng Mệnh đề 3.4.2, đường tham số γ0(t) = (A −12BA− 1 2 )t chính là đường trắc địa nối I và A− 1 2BA− 1 2 . Đồng thời ta có δ2(I, γ0(t)) = tδ2(I, A −12BA− 1 2 ). Do vậy γ(t) = T A 1 2 (γ0(t)) = A 1 2 (A− 1 2BA− 1 2 )tA 1 2 là đường trắc địa nối T A 1 2 (I) = A với T A 1 2 (A− 1 2BA− 1 2 ) = B, đồng thời δ2(A, γ(t)) = tδ2(A,B). Cũng theo Mệnh đề 3.4.2 ta có δ2(A,B) = δ2(I, A −12BA− 1 2 ) = ∥∥∥log I − log(A−12BA− 12 )∥∥∥ F = ∥∥∥logA−12BA−12∥∥∥ F . Tóm lại, ta đã chỉ ra được sự tồn tại của các đường trắc địa, đồng thời, công thức (3.4.9) cho ta một biểu diễn tường minh metric δ2 được định nghĩa ở (3.4.3). Từ định nghĩa chuẩn ‖.‖F và tính chất của hàm log người ta chỉ ra được δ2(A,B) = ( n∑ i=1 log2 λi(A −1B)) 1 2 , (3.4.10) ở đây λi, i = 1, · · · , n là các giá trị riêng của ma trận A−1B. 52 Nhận xét 3.4.4. Giả sử A,B ∈ Pn và ma trận đơn vị I nằm trên đường trắc địa [A,B]. Khi đó, theo Mệnh đề 3.4.3 ta có I = A 1 2 (A− 1 2BA− 1 2 )ξA 1 2 , ở đây ξ = δ2(A, I)/δ2(A,B). Từ đó ta có B = A − (1−ξ)ξ . Do vậy A,B là các ma trận giao hoán và logB = −1− ξ ξ logA, trong đó ξ = δ2(A, I)/δ2(A,B). Nhận xét 3.4.5. Từ các công thức (3.4.8) và (3.4.9) ta thấy trung bình nhân A]B của hai ma trận A,B chính là trung điểm của đường trắc địa γ nối A và B trong không gian (Pn, δ2). Tiếp theo ta sẽ khảo sát một số tính chất của không gian (Pn, δ2) cần thiết cho việc xây dựng khái niệm trung bình nhân. Mệnh đề 3.4.6. [5] Không gian metric (Pn, δ2) là không gian đủ. Chứng minh. Xét (Am)m là một dãy Cauchy bất kỳ trong (Pn, δ2) và đặt Hm = logAm,m ∈ N. Từ Định lý 3.4.1 ta có (Hm)m là dãy Cauchy trong (Hn, ‖.‖F ), do vậy (Hm)m hội tụ về H ∈ Hn. Khi đó, với metric tương ứng với chuẩn ‖.‖F ta có dãy e−HmeH hội tụ về I. Do vậy các giá trị riêng λi(e−HmeH), i = 1, · · · , n hội tụ về 1. Từ đẳng thức (3.4.10) ta có δ2(eHm, eH) dần về 0 khi m dần ra vô cùng. Nói cách khác dãy (Am)m hội tụ về A = eH trong không gian (Pn, δ2). Vậy (Pn, δ2) là không gian đủ. Trong không gian (Pn, δ2), quy tắc hình bình hành có dạng sau Định lý 3.4.7. [5] Giả sử A,B ∈ Pn và M = A]B là trung điểm của đường trắc địa [A,B]. Khi đó với mọi C ∈ Pn ta có δ22(M,C) ≤ δ22(A,C) + δ 2 2(B,C) 2 − δ 2 2(A,B) 4 . (3.4.11) Chứng minh. Bằng cách tác động T M− 1 2 vào hai vế của bất phương trình đã nêu, không mất tính tổng quát ta có thể giả sử M = I. Theo Nhận xét 3.4.4 ta có các ma trận A,B giao hoán, do đó δ2(A,B) = ‖logA− logB‖F . Các ma trận I, C giao hoán nên δ2(I, C) = ‖log I − logC‖F . 53 Quy tắc hình bình hành trên không gian Hilbert (Hn, ‖.‖F ) cho ta ‖log I − logC‖2F = ‖logA− logC‖2F + ‖logB − logC‖2F 2 − ‖logA− logB‖ 2 F 4 . Từ các đẳng thức trên và Định lý 3.4.1 ta có đpcm. Nhận xét 3.4.8. Xét A là một ma trận bất kỳ thuộc Pn và đặt f(X) = δ22(A,X). Khi đó với mọi ma trận X1, X2 ∈ Pn, X1 6= X2, từ quy tắc hình bình hành ta có f(X1]X2) < 1 2 [f(X1) + f(X2)]. Do f liên tục nên f là hàm lồi ngặt trên Pn. Từ quy tắc hình bình hành, ta chứng tỏ được kết quả quan trọng sau Định lý 3.4.9. [5] Giả sử A,B ∈ Pn, xét hàm f xác định bởi f(X) = δ22(A,X) + δ 2 2(B,X), ∀X ∈ Pn. (3.4.12) Khi đó X0 = A]B là điểm duy nhất mà tại đó hàm f đạt giá trị nhỏ nhất. Chứng minh. Từ quy tắc hình bình hành, với mọi ma trận X ∈ Pn ta có δ22(A]B,X) ≤ 1 2 f(X)− 1 4 δ22(A,B) = 1 2 f(X)− 1 2 f(A]B). Hay f(A]B) ≤ f(X)− 2δ22(A]B,X). Từ bất đẳng thức này ta có ngay đpcm. Như vậy, trong trường hợp n = 2, metric δ2 của ta tương ứng với trung bình nhân ma trận. Một cách tự nhiên, ta nghĩ đến việc định nghĩa trung bình nhân của các ma trận A1, · · · , Am bởi G(A1, · · · , Am) = argmin m∑ i=1 δ22(Ai, X). (3.4.13) Dưới đây ta sẽ chỉ ra định nghĩa như trên là hoàn toàn hợp lý. Định lý 3.4.10. [5] Giả sử A1, A2, · · · , Am là các ma trận thuộc Pn và f là hàm được xác định bởi f(X) = m∑ i=1 δ22(Ai, X), ∀X ∈ Pn. (3.4.14) Khi đó tồn tại duy nhất điểm X0 ∈ Pn để hàm f đạt giá trị nhỏ nhất. 54 Chứng minh. Đặt a = inf f(X), khi đó tồn tại dãy (Xr)r ⊂ Pn sao cho f(Xr) → a, r →∞. Với mọi i = 1, · · · ,m, với mọi r, s ∈ N, áp dụng quy tắc hình bình hành ta có δ22(Xr]Xs, Ai) ≤ δ22(Xr, Ai) + δ 2 2(Xs, Ai) 2 − δ 2 2(Xr, Xs) 4 . Cộng vế theo vế m bất đẳng thức trên ta được f(Xr]Xs) ≤ 1 2 (f(Xr) + f(Xs))− m 4 δ22(Xr, Xs). Do vậy m 4 δ22(Xr, Xs) ≤ 1 2 (f(Xr) + f(Xs))− f(Xr]Xs) ≤ 1 2 (f(Xr) + f(Xs))− a. Điều này chứng tỏ (Xr)r là dãy Cauchy trong không gian (Pn, δ2). Do đây là không gian đủ nên tồn tại X0 ∈ Pn để Xr hội tụ về X0 khi r dần ra vô cùng. Vậy hàm f đạt giá trị nhỏ nhất tại X0. Theo Nhận xét 3.4.8 ta có f là hàm lồi ngặt. Do vậy f đạt giá trị nhỏ nhất duy nhất tại X0. Tóm lại, ta đã xây dựng được trung bình nhân của các ma trận xác định dương trong trường hợp tổng quát. Người ta còn chứng minh được rằng trung bình nhân xác định như trên chính là nghiệm của phương trình ma trận m∑ i=1 X−1 log(XA−1i ) = 0. (3.4.15) Phương pháp xây dựng trung bình nhân nêu trên được đưa ra độc lập bởi M. Moakher và Rajendra Bhatia, John Holbrook. Bài báo [17] của M. Moakher công bố sớm hơn, song Rajendra Bhatia và John Holbrook là những người đầu tiên chứng minh sự tồn tại duy nhất giá trị nhỏ nhất của hàm f trong Định lý 3.4.10. Các kết quả trong [5] cũng phong phú hơn nhiều. Phương pháp xây dựng trung bình nhân mới này tương đối đơn giản hơn so với phương pháp xây dựng bằng quy nạp. Tuy vậy, với cách xây dựng này, người ta chưa chứng minh được tính đơn điệu của trung bình nhân. Ngoài ra, việc xác định điều kiện để hai định nghĩa trung bình nhân trên trùng nhau vẫn còn là một vấn đề mở. 55 KẾT LUẬN Luận văn bao gồm 3 phần: mở đầu, nội dung và kết luận. Phần nội dung được trình bày trong 3 chương: Chương 1, chương 2 và chương 3. Kết quả chính của khóa luận nằm ở chương 2 và chương 3. Trong chương 1, chúng tôi hệ thống hóa các kiến thức đã biết về ma trận xác định dương. Các kiến thức này là cần thiết cho việc theo dõi các chương tiếp theo. Trong chương 2, chúng tôi tổng quan một số kết quả đã có trong lĩnh vực bảo toàn tuyến tính. Đi sâu tìm hiểu bài toán bảo toàn tính xác định dương, chúng tôi đưa ra được một số điều kiện đủ để toán tử tuyến tính T bảo toàn tập các ma trận xác định dương trong trường hợp rank(T ) = 3, rank(T ) = r. Trong chương 3, chúng tôi tổng quan phương pháp xây dựng khái niệm trung bình nhân ma trận tổng quát. Hai hướng tiếp cận chính đó là hướng quy nạp của T. Ando, Chi-Kwong Li, Roy Mathias và hướng dựa vào hình học Riemann của M. Moakher và Rajendra Bhatia, John Holbrook đã được chúng tôi trình bày khá đầy đủ. Chúng tôi đã cố gắng dẫn dắt, phân tích để người đọc có được cái nhìn tổng thể, biết được các vấn đề nào đã được giải quyết, vấn đề nào vẫn còn đang là vấn đề mở. Từ đó, giúp những ai quan tâm đến các vấn đề này có thể tiếp tục đi sâu tìm hiểu. Tác giả đã cố gắng để hoàn thành luận văn một cách tốt nhất có thể. Tuy nhiên, do hạn chế của bản thân và thời gian có hạn, chắc chắn không thể tránh khỏi nhiều thiếu sót. Tác giả rất mong nhận được sự nhận xét và góp ý chân thành của quý thầy cô và bạn đọc để tác giả hoàn thiện hơn. Tác giả xin chân thành cám ơn và tiếp thu. 56 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Huỳnh Đình Tuân, Trần Thị Nhã Trang (2009), Báo cáo tổng kết đề tài nghiên cứu khoa học cấp trường: Bài toán bảo toàn tuyến tính chỉ số quán tính, T.09- TN-37. [2] Huỳnh Đình Tuân, Trần Thị Nhã Trang (2010), Báo cáo tổng kết đề tài nghiên cứu khoa học cấp trường: Bài toán bảo toàn tuyến tính chỉ số quán tính, T.10- TN-70. Tiếng Anh [3] T. Ando, Chi-Kwong Li, Roy Mathias (2004), Geometric Means, Linear Alge- bra and its Applications Volume 385, Pages 305-334. [4] Rajendra Bhatia (2007), Positive Definite Matrices, Princeton University Press. [5] Rajendra Bhatia, John Holbrook (2006), Riemannian geometry and matrix geometric means, Linear Algebra Appl., 413(2-3), Pages 594-618. [6] Manfredo P. do Carmo (1992), Riemannian Geometry, Birkha¨user Boston. [7] Wang Fei (2003), Some problems on linear preservers, Derpartment of Math- ematics National University of Singapore. [8] C. R. Johnson, S. Pierce (1985), Linear maps on Hermitian matrices: The stabilizer of an inertia class, Can. Math. Bull.28, 401-404. [9] C. R. Johnson, S. Pierce (1986), Linear maps on Hermitian matrices: The stabilizer of an inertia class II, Can. Math. Bull. 19, 21-31. [10] Leslie Hogben (2007), Handbook of Linear Algebra, Taylor & Francis Group. 57 [11] R. A. Horn, C. R. Johnson (1991), Topics in Matrix Analysis, Cambridge University Press. [12] Chi-Kwong Li (1987), Linear operators preserving the numercial radius of ma- trices, Proceedings of the American Mathematical Society, Volume 99, Number 4. [13] Chi-Kwong Li, S. Pierce (2001), Linear preserver problems, Amer. Math. Monthly, 108: 519-605. [14] Chi-Kwong Li, Nam Kiu Tsing (1992), Linear Preserver Problems : A brief Introduction and Some Special Techniques, Linear algebra and its applications 162-164: 217-235. [15] Chi-Kwong Li, Hugo J.Woerdeman (1997), Special Classes of Positive and Completely Positive Maps, Linear Algebra and its Applications Volume 255, Issues 1-3, Pages 247-258. [16] R. Loewy (1990), Linear maps which preserve a blanced nonsingular inertia class, Linear Algebra Appl. 134: 165-179. [17] M. Moakher (2005), A differential geometric approach to the geometric mean of symmetric positive-definite matrices, SIAM J. Matrix Anal, Pages 735-747. [18] Denes Petz (2005), Means of positive matrices: Geometry and a conjecture, Annales Mathematicae et Informaticae 32, Pages 129-139. [19] Stephen Pierce, Leiba Rodman (1988), Linear Preservers of the class of Her- mitian matrices with balanced inertia, SIAM J. MATRIX ANAL. APPL. Vol. 9, No. 4. [20] H. Schneider (1965), Positive Operators and an inertia theorem, Numer. Math. 7, 11-17. 58

Các file đính kèm theo tài liệu này:

HuynhDinhTuan.pdf