Luận văn Nghiên cứu phương pháp nhận dạng hình dạng

Tài liệu Luận văn Nghiên cứu phương pháp nhận dạng hình dạng: Bộ giáo dục và đào tạo Tr−ờng đại học bách khoa Hà nội --------------------------------------------- Luận văn thạc sĩ khoa học Nghiên cứu ph−ơng pháp nhận dạng hình dạng Ngành: xử lý thông tin và truyền thông M∙ số: 421 đinh thị kim ph−ợng Ng−ời h−ớng dẫn khoa học: T.S. Nguyễn kim anh Hà nội 2006 - 2 - Lời cam đoan Tôi xin cam đoan bản luận văn này là kết quả nghiên cứu của bản thân d−ới sự h−ớng dẫn của TS. Nguyễn Kim Anh. Nếu có gì sai phạm, tôi xin hoàn toàn chịu trách nhiệm. Ng−ời làm cam đoan Đinh Thị Kim Ph−ợng - 3 - Mục Lục Lời cam đoan..........................................................................................................2 Mục Lục .................................................................................................................3 Danh Mục Các từ viết tắt........................................................................................6 Danh mục hình vẽ...........................................

pdf90 trang | Chia sẻ: haohao | Lượt xem: 1042 | Lượt tải: 0download
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Nghiên cứu phương pháp nhận dạng hình dạng, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Bộ giáo dục và đào tạo Tr−ờng đại học bách khoa Hà nội --------------------------------------------- Luận văn thạc sĩ khoa học Nghiên cứu ph−ơng pháp nhận dạng hình dạng Ngành: xử lý thông tin và truyền thông M∙ số: 421 đinh thị kim ph−ợng Ng−ời h−ớng dẫn khoa học: T.S. Nguyễn kim anh Hà nội 2006 - 2 - Lời cam đoan Tôi xin cam đoan bản luận văn này là kết quả nghiên cứu của bản thân d−ới sự h−ớng dẫn của TS. Nguyễn Kim Anh. Nếu có gì sai phạm, tôi xin hoàn toàn chịu trách nhiệm. Ng−ời làm cam đoan Đinh Thị Kim Ph−ợng - 3 - Mục Lục Lời cam đoan..........................................................................................................2 Mục Lục .................................................................................................................3 Danh Mục Các từ viết tắt........................................................................................6 Danh mục hình vẽ...................................................................................................7 Lời nói đầu .............................................................................................................9 Ch−ơng 1:Tổng quan về tìm kiếm ảnh dựa trên hình dạng .Error! Bookmark not defined. 1.1. Giới thiệu...................................................................................................12 1.2. Trích chọn đặc tr−ng..................................................................................13 1.2.1.Biến đổi Fourier ...................................................................................12 1.2.1.1.Chuỗi Fourier....................................................................................13 1.2.1.2. Sự hội tụ của chuỗi Fourier..............................................................14 1.2.1.3. Biến đổi Fourier...............................................................................14 1.2.1.4. Biến đổi Fourier rời rạc ...................................................................15 1.2.1.5. Biến đổi Fourier hai chiều ...............................................................16 1.2.1.6. Phạm vi của biến đổi Fourier...........................................................16 1.2.2. Không gian độ chia (Scale space).......................................................17 1.2.2.1. Cơ sở ................................................................................................17 1.2.2.2. Không gian độ chia Gaussian..........................................................19 1.2.2.3. Phạm vi của sự không tạo các đặc tr−ng mới ..................................19 1.2.2.4. Không gian độ chia mâu thuẫn với việc đa quyết định ...................20 1.2.3.Thảo luận .............................................................................................22 1.3. Phép đo t−ơng đ−ơng và thực hiện phép đo...............................................22 1.3.1. Phép đo sự giống nhau........................................................................23 1.3.1.1. Không gian phép đo khoảng cách (Distance Metric Spaces) .........24 1.3.1.2. Khoảng cách dạng Minkowski ........................................................24 1.3.1.3. Khoảng cách Cosin..........................................................................24 1.3.1.4. Thông tin thống kê 2χ ...................................................................25 1.3.1.5. Đ−ờng giao biểu đồ .........................................................................25 - 4 - 1.3.1.6. Khoảng cách bậc hai........................................................................26 1.3.1.7. Khoảng cách Mahalanobis ..............................................................27 1.3.2.Thực hiện phép đo ...............................................................................27 1.3.2.1. Độ nhạy và độ chính xác(RPP). ......................................................28 1.3.2.2. Tỷ lệ trọng số thành công (PWH- Percentage of Weighted Hits) ...28 1.3.2.3. Phần trăm của thứ bậc giống nhau (PSR-Percentage of Similarity Ranking ) ......................................................................................................29 1.3.2.4. Thảo luận .........................................................................................30 1.3.3. Trích chọn đặc tr−ng hình dạng..........................................................30 1.4. Thảo luận...................................................................................................32 Ch−ơng 2 Ph−ơng pháp tách contrario .................................................................33 2.1. Cluster có thứ bậc và đánh giá giá trị........................................................34 2.1.1.Giá trị nhóm Contrario ........................................................................34 2.1.1.1. Cơ sở: ...............................................................................................34 2.1.1.2. Nhóm có ý nghĩa. ............................................................................35 2.1.2. Tiêu chuẩn kết hợp tốt nhất. ...............................................................37 2.1.3. Vấn đề tính toán .................................................................................40 2.1.3.1. Lựa chọn vùng thử. ..........................................................................40 2.1.3.2. Riêng rẽ và cực đại. .........................................................................42 2.2.1. Nhiễu điểm .........................................................................................43 2.2.2. Phân đoạn ...........................................................................................43 2.3. Kết cấu nhóm và không gian t−ơng ứng....................................................46 2.3.1. Tại sao phải tách kết cấu không gian. ................................................46 2.3.2. Đối sánh nhân tố hình dạng................................................................47 2.3.3. Biến đổi mô tả.....................................................................................49 2.3.3.1. Tr−ờng hợp t−ơng đồng ...................................................................49 2.3.3.2. Tr−ờng hợp biến đổi mối quan hệ ...................................................50 2.3.4. Cluster có ý nghĩa của biến đổi ..........................................................52 2.3.4.1. Phép đo sự không t−ơng đ−ơng giữa các biến đổi. ..........................52 2.3.4.2 Ph−ơng thức nền ...............................................................................52 2.3.4.3. Kỹ thuật nhóm .................................................................................54 2.4. Thảo luận...................................................................................................55 Ch−ơng 3:Ph−ơng pháp ra quyết định Contrario..................................................56 3.1. Một quyết định Contrario ......................................................................58 3.1.1. Ph−ơng pháp hình dạng trái ng−ợc ph−ơng pháp nền ........................58 3.1.2. Ph−ơng thức quyết định Contrario......................................................59 3.1.3. Ước l−ợng xác suất cảnh báo sai ........................................................61 - 5 - 3.1.4. Luật ra quyết định Contrario ..............................................................61 3.2. Tự động thiết lập ng−ỡng khoảng cách .................................................62 3.2.1. Số các cảnh báo sai NFA....................................................................62 3.2.2. Đối sánh có ý nghĩa ............................................................................63 3.2.3. Ng−ỡng nhận dạng t−ơng ứng với ngữ cảnh.......................................64 3.2.4. Tại sao quyết định Contrario ..............................................................65 3.3. Xây dựng đặc tr−ng độc lập thống kê....................................................66 3.4.Chuẩn hóa nhân tố hình dạng từ ảnh cho đặc tr−ng độc lập...................68 3.4.1. Biểu diễn hình dạng bằng các mức đ−ờng..........................................68 3.4.2.Tiêu chuẩn hóa và mã hóa bán cục bộ.................................................70 3.4.2.1. Mã hóa / Tiêu chuẩn hóa trị không đổi t−ơng đ−ơng ......................71 3.4.2.2. Mã hóa / Chuẩn hóa quan hệ bất biến .............................................73 3.4.3. Từ chuẩn hóa nhân tố hình dạng đến đặc tr−ng độc lập. ....................73 3.5. Thảo luận ...............................................................................................76 Ch−ơng 4Thử nghiệm...........................................................................................78 4.1. Thử nghiệm ph−ơng pháp nền...................................................................78 4.2. Thử nghiệm ph−ơng pháp Contrario..........................................................80 4.2.1. Hai ảnh không quan hệ với nhau ........................................................80 4.2.2. Méo dạng quan sát xa gần ..................................................................81 4.2.3. Quan hệ với sự nghẽn cục bộ và thay đổi độ t−ơng phản...................83 Kết luận ................................................................................................................88 Tài liệu tham khảo................................................................................................89 Tóm tắt luận văn...................................................................................................90 - 6 - Danh Mục Các từ viết tắt STT Từ viết tắt ý nghĩa 1 CBIR Content Based Image Retrieval 2 FD Fourie Descriptor 3 FFT Fast Fourie Transform 4 CSDL Cơ sở dữ liệu 5 NFA Number of Fasle Alarm 6 PFA Pridicion Fasle Alarm 7 FT Fourie Transform 8 NFAg NFA of region 9 NFAgg NFA of region-region 10 Pro Proposition 11 PFA Probability of False Alarm - 7 - Danh mục hình vẽ Hình 1.1: Đối t−ợng bị làm nhiễu bởi biến đổi phổ. ............................................13 Hình 1.2: ảnh và các biến đổi khác .....................................................................13 Hình 1.3: Điểm qua 0 tại vị trí x và độ chia t của tín hiệu ...................................20 Hình 1.4: (a) Khoảng cách Ocolit, .......................................................................25 (b) khoảng cách Cosin, (c) khoảng cách L1.........................................................25 Hình 1:a) ảnh ký tự,b) mức đ−ờng t−ơng ứng, c) Đoạn mức đ−ờng ...................31 Hình 2.2: Nhóm dữ liệu 950 điểm đồng dạng......................................................37 Hình 2.5: Vấn đề quan trọng của phân bố ph−ơng thức nền................................43 Hình 2.6: Phân đoạn ảnh đã scan và 71 đ−ờng mức có mức ý nghĩa cực đại. .....44 Hình 2.7: Nhóm với mối quan hệ tới h−ớng.........................................................45 Hình 2.8: Nhóm trong không gian(toạ độ x, h−ớng)............................................46 Hình 2.9: Thử nghiệm Guernica...........................................................................48 Hình 2.10: Thử nghiệm “ Guernica “ quan hệ t−ơng ứng ý nghĩa không đổi ......49 Hình 2.11: Hai đoạn mức đ−ờng và khung t−ơng ứng .........................................50 Hình 2.12: Thử nghiệm “ Guernica “ ...................................................................51 Hình 3.1: Trích chọn mức đ−ờng có ý nghĩa.......................................................70 Hình 3.3: Mã hoá sự không đổi t−ơng đ−ơng bán cục bộ ....................................73 Hình 3.4 : Mã hóa bán cục bộ mối quan hệ không đổi. . .....................................74 Hình 3.5 : Mã hóa hình dạng bán cục bộ quan hệ bất biến..................................75 - 8 - Hình 3.6: Mã hoá sự t−ơng đồng không đổi.........................................................76 Hình 4.1: ảnh và mức đ−ờng có ý nghĩa .............................................................80 Hình 4.2: Thử nghiệm hitchcook..........................................................................82 Hình 4.3: Ph−ơng pháp nhận dạng bán cục bộ quan hệ không đổi ......................83 Hình 4.4: Ph−ơng pháp nhận dạng quan hệ bán cục bộ không đổi ......................83 Hình 4.5 Ph−ơng pháp nhận dạng bán cục bộ .....................................................84 Hình 4.6: Tập các đoạn đ−ờng mức đối sánh với ảnh trong CSDL......................85 Hình 4.7: Ph−ơng pháp bán cục bộ t−ơng đồng không đổi ..................................85 Hình 4.8: ảnh gốc và mức đ−ờng có ý nghĩa.......................................................86 Hình 4.9: ảnh Menima và mức đ−ờng có ý nghĩa ...............................................86 - 9 - Lời nói đầu Ngày nay thông tin nói chung sử dụng trong ảnh là phổ biến. Rất nhiều lĩnh vực sử dụng ảnh nh− một công cụ để thực hiện công việc. Những năm gần đây, chứng kiến tốc độ gia tăng mạnh của ảnh số trên toàn thế giới, bởi sự gia tăng mạnh mẽ của các trạm làm việc tại mặt đất cũng nh− trạm vệ tinh, khó khăn trong l−u trữ, chi phí cao cho xử lý và internet. Sự đa dạng các ứng dụng của ảnh góp phần ra đời thế hệ ảnh số. Các ứng dụng của ảnh bao gồm: giải trí số, th− viện số, giáo dục và World Wide Web (www). Các ứng dụng ngày càng trở nên phụ thuộc vào việc sử dụng ảnh gốc. Lợi ích tr−ớc mắt của ảnh số gồm cả mặt xã hội và th−ơng mại. Sử dụng ảnh gốc giúp sáng tạo sản phẩm mới, tiết kiệm thời gian và tiền bạc. Tuy nhiên, độ lớn của kho l−u trữ ảnh số trên toàn thế giới có giới hạn, sự tận dụng ảnh số từ CSDL hiện tại khó hơn. Điều này là vì thiếu cách đánh chỉ mục và quản lý ảnh số chuẩn. Thông th−ờng các ảnh đ−ợc l−u trữ trong CSDL sử dụng d−ới dạng các thông tin thuộc tính. Thuận lợi của việc đánh chỉ mục thuộc tính ảnh: nó có thể cung cấp cho ng−ời sử dụng từ khoá tìm kiếm l−ớt qua mục lục, thậm chí thông qua giao diện truy vấn; ví dụ nh− ngôn ngữ truy vấn cấu trúc (SQL). Tuy nhiên, nhìn từ bên ngoài có hạn chế; một trong những hạn chế đó là thời gian tính toán khi CSDL lớn, nó d−ờng nh− không thể chú giải thủ công tất cả các ảnh. Mặt khác các đặc tr−ng thị giác của ảnh rất khó mô tả bằng từ ngữ một cách khách quan, có một tiêu điểm mới trên việc phát triển công nghệ đánh chỉ mục ảnh, đó là khả năng tìm kiếm ảnh dựa trên ngữ cảnh: nó có thể độc lập và có thể tự động hoá. Các công nghệ hiện tại đa phần qui về tìm kiếm ảnh dựa trên ngữ nghĩa (CBIR). CBIR đ−ợc giới thiệu nh− phần bổ xung cho việc tiến tới đánh chỉ mục thuộc tính truyền thống, nó là cần thiết để cấu thành CSDL multimedia. Vì những - 10 - tiềm năng ứng dụng rộng rãi của nó, CBIR đã thu hút đ−ợc số l−ợng lớn các chú ý trong những năm gần đây (KAT 92, NIB 93, YOS 99). Trong CBIR, ảnh trong CSDL là dữ liệu không cấu trúc, ảnh số hoàn toàn chỉ bao gồm mảng các pixel độ chói, không có ý nghĩ vốn có. Một trong những chìa khoá bắt nguồn CBIR là sự cần thiết để trích chọn thông tin hữu ích từ dữ liệu thô, để phản ánh ngữ nghĩa ảnh. Vì vậy việc trích chọn hiệu quả các đặc tr−ng ngữ nghĩa đó là điều cốt yếu sự thành công của CBIR. Nghiên cứu trên những yêu cầu của ng−ời sử dụng đối với ảnh từ bộ s−u tập ảnh biểu thị những đặc tr−ng nguyên thuỷ đó nh− màu sắc, kết cấu, hình dạng hoặc hỗn hợp của chúng là rất hữu ích đối với việc mô tả và khôi phục ảnh (EAK 99). Những đặc tr−ng này là khách quan và trực tiếp bắt nguồn từ tự bản thân ảnh mà không cần tham khảo bất kỳ một kiến thức cơ bản nào từ bên ngoài. Vì vậy đặc tr−ng nguyên thuỷ của ảnh ở mức thấp có thể đ−ợc bắt nguồn và khai thác để khuyến khích việc CBIR tự động hoá. *Đối t−ợng nghiên cứu Từ các thông tin cơ bản trên đây các ảnh trong CSDL có thể đ−ợc đánh chỉ mục bằng cách sử dụng thông tin thuộc tính hoặc thông tin ngữ nghĩa. Ngữ nghĩa của ảnh có thể đ−ợc mô tả sử dụng các đặc tr−ng nguyên thuỷ; ví dụ: màu sắc, cấu trúc, hình dạng hoặc tổ hợp của chúng. Kết quả nghiên cứu này chấp nhận tiến tới CBIR, đó là việc đánh chỉ mục và tìm kiếm ảnh bằng ngữ nghĩa của ảnh. Đặc biệt, việc tìm kiếm hội tụ ở việc đánh chỉ mục và tìm kiếm ảnh dựa trên hình dạng. Mục đích chủ yếu của cách tìm kiếm này là tìm kiếm và khai thác hình dạng rất khả thi để tìm kiếm và nhận dạng hình dạng. Điều tra các công nghệ và phát triển trong nghiên cứu này có thể là trực tiếp ứng dụng cho các ứng dụng đặc thù; ví dụ tìm kiếm nhãn mác, nhận dạng đối t−ợng… hoặc có thể hợp nhất trong bất cứ hệ thống CBIR nào để dễ dàng nhận dạng hình dạng sử dụng các đặc tr−ng hỗn hợp của ảnh. - 11 - Nhận dạng nói chung hội tụ các vấn đề của nhận dạng trực quan dựa trên thông tin hình dạng hình học. Ph−ơng pháp nhận dạng hình dạng th−ờng bao gồm 3 tiến trình: trích chọn đặc tr−ng, đối sánh (cốt lõi của tiến trình này là định nghĩa 1 khoảng cách hoặc phép đo sự t−ơng đồng giữa các đặc tr−ng hình dạng đ−ợc mô tả) và ra quyết định. Phần này chủ yếu nghiên cứu vấn đề ra quyết định cho đối sánh hình dạng, đặc biệt trong khung chung giữa hai hình dạng giống nhau để đối sánh, nó có thể đi tới quyết định nh− thế nào? Mục đích để định nghĩa tiêu chuẩn thống kê dẫn tới quyết định 2 hình dạng là giống hay không. Nghiên cứu các tiến trình thực hiệnnhận dạng hình dạng theo trình tự các công đoạn: từ công đoạn sơ khai biểu diễn ảnh, trích chọn đặc tr−ng, tách nhóm nhân tố hình dạng thành 1 hình dạng và chủ yếu là ph−ơng pháp ra quyết định Contrario cho nhận dạng hình dạng. *Cấu trúc luận văn Ch−ơng 1 : Tổng quan về tìm kiếm ảnh dựa trên hình dạng Ch−ơng 2: Tách nhóm Ch−ơng 3: Ph−ơng pháp Contrario cho nhận dạng hình dạng Ch−ơng 4: Thử nghiệm Do thời gian và khả năng có hạn nên luận văn này sẽ còn nhiều thiếu sót. Rất mong đ−ợc sự góp ý và thông cảm của các thầy giáo, cô giáo. Hà nội, ngày 6 tháng 11 năm 2006 Học viên Đinh Thị Kim Ph−ợng - 12 - Ch−ơng 1 Tổng quan tìm kiếm ảnh dựa trên hình dạng 1.1. Giới thiệu Vấn đề cơ bản của tìm kiếm ảnh dựa trên hình dạng là phép đo sự t−ơng đồng giữa các các hình dạng đ−ợc mô tả bởi các đặc tr−ng của chúng. Vì vậy, hai b−ớc cần thiết trong tìm kiếm và nhận dạng ảnh dựa trên hình dạng đó là trích chọn đặc tr−ng và phép đo t−ơng đ−ơng giữa các đặc tr−ng đã đ−ợc trích chọn. Hai công cụ cơ bản cần thiết đ−ợc sử dụng trong trích chọn đặc tr−ng hình dạng là biến đổi Fourier và không gian độ chia. Mặc dù trích chọn đặc tr−ng là mấu chốt để tìm kiếm ảnh dựa trên hình dạng và nhận dạng hình dạng, phép đo sự t−ơng đồng giữa các đặc tr−ng đ−ợc trích chọn cũng rất quan trọng. yêu cầu hiệu quả tìm kiếm ảnh đó là nhận biết nhanh các hình dạng t−ơng đồng - sự t−ơng đồng trong giới hạn của các đặc tr−ng đ−ợc trích chọn. 1.2. Công cụ trích chọn đặc tr−ng Biến đổi Fourie là một công cụ kinh điển. Nó đã đ−ợc sử dụng từ nhiều năm nay trong mọi hệ thống xử lý tín hiệu và hệ thống máy tính. Còn không gian độ chia là một công cụ mới đang đ−ợc chú ý gần đây. 1.2.1.Biến đổi Fourier Biến đổi Fourie là mấu chốt trong xử lý ảnh nó đ−ợc ứng dụng rộng rãi trong lý thuyết cũng nh− trong thực tế. Nguyên tắc cơ bản của biến đổi Fourie đó là một đối t−ợng đ−ợc coi nh− một tín hiệu và nh− vậy có thể biểu diễn đối t−ợng thành các thành phần cơ bản của tín hiệu. Biến đổi Fourie rất hữu ích cho phân tích các đối t−ợng khác nhau: có thể đối t−ợng bị làm nhiễu bởi biến đổi phổ - 13 - (Hình 1.1), trong khi các đối t−ợng t−ơng đ−ơng khác sẽ có biến đổi phổ t−ơng tự thậm chí cả khi chúng bị ảnh h−ởng bởi nhiễu và các biến đổi khác(hình 1.2). Hình 1.1: Đối t−ợng bị làm nhiễu bởi biến đổi phổ. Hình 1.2: ảnh và các biến đổi khác 1.2.1.1.Chuỗi Fourier Đặt f(x) là hàm tuần hoàn chu kỳ 2π và nguyên trong một chu kỳ, theo lý thuyết Fourie f(x) có thể khai triển thành chuỗi fourie nh− sau: (1.1) (1.2) - 14 - Với chu kỳ T: 1.2.1.2. Sự hội tụ của chuỗi Fourier Nếu một hàm f(x) là tuần hoàn và nguyên trong chu kỳ của nó thì sẽ tồn tại chuỗi Fourie nh−ng không đảm bảo chắc chắn rằng chuỗi Fourie sẽ hội tụ tới f(x). Tuy nhiên theo điều kiện Fourie Dirichcle phần lớn hoặc các lớp chung của hàm có thể biểu diễn bằng chuỗi Fourie. Điều kiện chuỗi Fourie Dicrichcle nếu là một đoạn hàm f(x) liên tục : 1. Giới hạn số các điểm không liên tục 2. Giới hạn các điểm cực trị. Hàm này có thể mở rộng thành chuỗi Fourie hội tụ tại các điểm liên tục và ý nghĩa của điểm giới hạn thực và giới hạn ảo của hàm tại điểm giới hạn: Đối với tín hiệu số hoặc đối t−ợng số điều kiện Dirichcle đ−ợc chứng minh vì vậy nó có thể đ−ợc biểu diễn bởi chuỗi Fourie: 1.2.1.3. Biến đổi Fourier (1.3) (1.4) (1.5) (1.6) - 15 - Nếu hàm f(x) có thể biểu diễn bằng chuỗi Fourie của nó. Sau đó f(x) đ−ợc xác định duy nhất bởi hệ số Cn. Ng−ợc lại nếu hệ số Cn của chuỗi Fourie của hàm đã biết tr−ớc thì f(x) có thể đ−ợc xây dựng lại từ tập Cn. Chuỗi Fourie thiết lập mối quan hệ duy nhất giữa f(x) và hệ số Cn. Biểu diễn theo công thức : T−ơng ứng công thức: 1.2.1.4. Biến đổi Fourier rời rạc Biến đổi Fourie đặc biệt hữu ích đối với phân tích đối t−ợng số vì đối t−ợng số tồn tại ở dạng rời rạc. Để biến đổi công thức 1.7 và 1.8 thành dạng rời rạc, f(x) đ−ợc lấy N mẫu trong chu kỳ [0, T] f(x0); f(x0+∆x); f(x0+2∆x);… f(x0+(N-1)∆x) ∆x gọi là b−ớc lấy mẫu trong phạm vi không gian xem xét f(x) biểu diễn thành: B−ớc lấy mẫu ∆u trong miền tần số và b−ớc lấy mẫu ∆x trong miền không gian có quan hệ theo biểu thức : (1.7) (1.8) (1.9) (1.10) - 16 - Mối quan hệ này dễ thay đổi chỉ rõ sự chính xác của biểu diễn đối t−ợng trong miền không gian và trong miền tần số là ng−ợc với nhau. Chú ý, khi bố trí một tập dữ liệu khác thì chúng không thể biến đổi độc lập với nhau. Điều này cần l−u ý khi trích chọn đặc tr−ng trong miền không gian lấy mẫu đối t−ợng. 1.2.1.5. Biến đổi Fourier hai chiều Đối với hàm hai biến f(x,y) xác định 0 ≤ x, y ≤ N. Cặp biến đổi Fourie là: Mặc dù, số l−ợng F(u,v) từ biến đổi Fourie của biểu thức là rất lớn nh−ng số l−ợng F(u,v) có ích là rất bé. Đây là lý do biểu diễn đối t−ợng trong miền tần số tốt hơn (Hệ số có nghĩa ít). Điều này thực sự hữu ích trong nhiều ứng dụng đặc biệt trong việc phân tích hình dạng vì nó có thể xấp xỉ ý nghĩa của đối t−ợng gốc f(x,y) hoặc f(x) có thể xây dung từ F(u,v) nhỏ. Đây là vấn đề cơ bản của xử lý tín hiệu Fourie và phân tích đối t−ợng Fourie. 1.2.1.6. Phạm vi của biến đổi Fourier Biến đổi Fourie tuân theo phạm vi hữu ích của việc phân tích đối t−ợng • Sự riêng rẽ: Biến đổi Fourie rời rạc (1.11) có thể mô tả riêng rẽ nh− sau: • Lợi ích của việc riêng rẽ này đó là F(u,v) có thể thu đ−ợc trong 2 b−ớc bằng cách sử dụng liên tiếp biến đổi Fourie 1 chiều. FT 1 chiều có thể đ−ợc tính toán sử dụng biến đổi Fourie nhanh FFT. • Biến đổi: Biến đổi phạm vi của FT (1.11) (1.12) (1.13) (1.14) - 17 - • Điều này chỉ ra: 1 sự thay đổi trong miền không gian sẽ dẫn đến sự thay đổi trong miền tần số. • Phép quay: Nếu gắn vào hệ toạ độ cực Sau đó thay thế vào biểu thức có : Điều này có nghĩa việc quay f(x,y) trong miền không gian góc θ0 cũng t−ơng ứng việc quay F(u,v) một góc t−ơng tự trong miền tần số. • Độ chia: đối với hai hệ số a, b, phạm vi độ chia của FT đ−ợc viết nh− sau: Điều này chỉ ra rằng: độ chia của f(x,y) với a và b theo x,y trong miền không gian tỷ lệ nghịch với biên độ F(U,V) trong miền tần số. Điều này cũng giảm bớt hệ số F(u,v) bởi 1/a và 1/b theo u, v trong miền tần số. Tổng quát, phóng to một đối t−ợng ảnh trong miền tần số sẽ làm nổi mức tần số thấp trong miền không gian trong khi việc thu nhỏ đối t−ợng trong ảnh sẽ làm tăng vùng tần số cao trong miền không gian. 1.2.2. Không gian độ chia (Scale space) Đối với FT thì không gian độ chia là công cụ khá mới trong phân tích đối t−ợng. Nó đã đ−ợc phát triển trong các hệ thống tính toán. Phần này sẽ giới thiệu không gian độ chia tuyến tính và phạm vi quan trọng của nó. 1.2.2.1. Cơ sở Lý thuyết không gian độ chia giúp ta quan sát các đối t−ợng trong các độ chia khác nhau và các đối t−ợng chỉ có ý nghĩa duy nhất theo độ chia chính. Một ví dụ đơn giản nếu là ảnh một sự vật thì dù có là độ chia 1m hay 1cm thì ý nghĩa của sự vật không thay đổi. Trong vật lý các đối t−ợng tồn tại trong sự sắp xếp độ (1.15) (1.16) - 18 - chia. Các dụng cụ quan sát nh− camera các dụng cụ này có thể quan sát cũng là một sự sắp xếp độ chia. Để mở rộng các độ chia t−ơng ứng với sự phóng to hay thu nhỏ nhờ các dụng cụ quan sát. Độ chia của một dụng cụ luôn có hai giới hạn: độ chia giúp phân biệt chi tiết ảnh tốt nhất và kém nhất và khi quan sát sự vật thì độ chia nằm trong khoảng giới hạn hai phía này. Để tính toán bất kỳ dạng biểu diễn nào từ dữ liệu ảnh, thông tin cần đ−ợc trích chọn bằng cách sử dụng toán tử nào đó với dữ liệu. Các toán tử t−ơng tự nh− ống kính máy quay sử dụng để mô tả thế giới thực. Một vài vấn đề đặt ra khi đề cập tới các toán tử đó đ−ợc sử dụng nh− thế nào, thực hiện ở đâu và thực hiện công việc ra sao, độ lớn nh− thế nào. Nh− vậy thông tin thu đ−ợc xác định rất phong phú thông qua mối quan hệ của các cấu trúc thực tế trong dữ liệu và kích cỡ của toán tử. Độ chia gần đúng khi phân tích đối t−ợng có thể biết tr−ớc. Tuy nhiên trong phần lớn các vấn đề thì điều này không quan trọng. Lý do chính để xây dựng không gian độ chia đó là nếu có kiến thức biết tr−ớc về không gian độ chia thích hợp lấy từ tập CSDL có nhiều độ chia thì không gian độ chia sẽ đ−ợc áp dụng để thu gọn công thức tính toán thích hợp. Việc sử dụng các hàm làm trơn nhiễu Gauss tại các độ chia khác nhau đã đ−ợc áp dụng trong phân tích ảnh cho thấy mối liên hệ giữa các độ chia khác nhau với cấu trúc ảnh và không gian độ chia là có giới hạn. Tuy nhiên độ chia kích th−ớc hoàn toàn có thể thêm vào trong không gian miêu tả đối t−ợng vì các cấu trúc có thể đ−ợc nghiên cứu thông qua độ chia. Đặc biệt khi gắn vào tín hiệu f(x): RRN → và 1 tập liên tục ( ){ }0/, 〉ttxL làm mịn dần dần (có nghĩa là việc nhân chập tín hiệu f(x) với một hàm liên tục g(x,t)) ( ) ( ) ( ) )17.1(,, xftxgtxL ∗= ở đây g(x,t) là hàm làm mịn hoặc hàm mặt nạ, l(x,t) là tín hiệu đ−ợc làm mịn, * là phép nhân chập. Với tín hiệu liên tục thì f(x)đ−ợc khai triển nh− sau: (1.18) - 19 - 1.2.2.2. Không gian độ chia Gaussian Hàm Gausss là hàm mặt nạ hữu ích nhất cho không gian độ chia tổng quát nhất. Mang tới một tín biệu f(x): RRN → là mô tả độ chia L: RRR tN →ì đ−ợc định nghĩa nh− một mô tả tại độ chia 0 đối với tín hiệu gốc ( ) ( ) 19.10, xfxL = Và sự miêu tả độ chia kém hơn mang lại bằng phép nhân chập với mặt nạ Gauss khi đó kích th−ớc ảnh tăng lên: 1.2.2.3. Phạm vi của sự không tạo các đặc tr−ng mới Phạm vi quan trọng nhất trong không gian độ chia đó là sự không tạo các đặc tr−ng mới. Có nghĩa là sự biến đổi từ một độ chia tốt sang một độ chia xấu hơn sẽ thiết lập một tín hiệu đơn giản hơn, vì thế đặc tr−ng trong không gian độ chia mất tính đơn điệu khi độ chia gia tăng. Nó là nguyên nhân làm ảnh h−ởng tới tín hiệu và làm mờ ảnh h−ởng đối với tín hiệu hai chiều. (1.20) (1.21) (1.22) - 20 - Hình 1.3: Điểm qua 0 tại vị trí x và độ chia t của tín hiệu Các đặc tr−ng hữu ích đặc biệt tại điểm qua 0 của đạo hàm bậc thứ n. Thực tế đạo hàm bậc hai của tín hiệu đ−ợc sử dụng trong phân tích đối t−ợng, bởi đạo hàm bậc hai phản ánh điểm uốn cong của tín hiệu. Điểm cong (một đặc tr−ng hữu ích đối với phân tích đối t−ợng). Điểm qua 0 của đạo hàm bậc hai là điểm uốn cong đó là đặc tr−ng cho góc lồi ra của đối t−ợng. Với tín hiệu một chiều, điều đó đ−ợc áp dụng với không gian độ chia Gauss. Điểm qua 0 của tín hiệu tại tất cả các độ chia gọi là lấy dấu hoặc cây khoảng cách. (hình 1.3 b). Bởi phạm vi không sáng tạo của đặc tr−ng mới, việc làm mịn cuối cùng của tín hiệu đ−ợc bảo đảm. Vì vậy chiều cao của cây khoảng cách là có giới hạn. Witkin(Wit 83) giải thích cây khoảng cách này với kinh nghiệm quan sát, cành cây trong cây khoảng cách t−ơng ứng với vị trí lồi ra của đối t−ợng. ASA 84: đầu tiên trích chọn đỉnh từ cây khoảng cách thu đ−ợc và giải thích chúng nh− các đặc tr−ng vật lý( nh− góc, điểm nối, điểm kết thúc, điểm đặc biệt…) Mok96 cũng trích chọn đỉnh từ cây khoảng cách thu đ−ợc và đề nghị việc sử dụng các đặc tr−ng đỉnh thông th−ờng cho tìm kiếm hình dạng. Hoàn toàn có thể áp dụng không gian độ chia để biểu diễn hình dạng. 1.2.2.4. Không gian độ chia mâu thuẫn với việc đa quyết định Trong phân tích đối t−ợng hai ph−ơng pháp phân tích có thứ bậc th−ờng đ−ợc sử dụng: một là ph−ơng pháp không gian độ chia, ph−ơng pháp khác cây quyết định, ví dụ nh− ph−ơng pháp hình chóp và ph−ơng pháp sóng. Hai ph−ơng pháp này khác nhau: điểm khác biệt chính của hai công cụ thể hiện ở 3 khía cạnh: +Lấy mẫu không nhất quán, chống lại việc lấy mẫu các không gian khác. Biểu diễn không gian độ chia đ−ợc định nghĩa bằng việc làm mịn và l−u giữ các mẫu không gian giống nhau tại tất cả các độ chia. Trong khi lấy mẫu không gian đa quyết định tại các độ chia khác nhau là khác nhau. Đối t−ợng - 21 - chính của đa quyết định là giảm bớt lấy mẫu từ một độ chia tới các độ chia cao hơn, vì thế quá trình xử lý tín hiệu có thể hiệu quả hơn. +T−ơng quan độ chia đối nghịch với sự phân ly độ chia, ph−ơng pháp đa quyết định không khai thác điểm khác biệt của cấu trúc thông qua độ chia. Các kết quả tính toán tại mỗi một độ chia đ−ợc sử dụng duy nhất để h−ớng dẫn tính toán tại độ chia tiếp theo nhỏ hơn và đ−ợc loại bỏ một khi điều này đ−ợc hoàn thành. Chỉ thực hiện thuật toán tại một độ chia và tại một thời điểm. Ph−ơng pháp không gian độ chia chính là việc phân tích độ chia nh− một phần cần thiết của quá trình phân tích sự quan sát và nhận dạng. Phạm vi các phép đo tại các độ chia khác nhau có thể có cơ sở vững chắc phụ thuộc nhiệm vụ chứa trong nó. Bằng định nghĩa, giới thiệu không gian độ chia mang đến một giải pháp cho việc phổ biến l−ợng bù sai, điều đó có nghĩa các đặc tr−ng ở các độ chia khác nhau có thể liên quan tới những đặc tr−ng khác một cách rõ ràng. +Lấy mẫu độ chia liên tục chống lại việc lấy mẫu độ chia cố định. Giữa các ph−ơng pháp không gian độ chia và ph−ơng pháp đa quyết định đó là sự miêu tả đa quyết định chấp nhận một b−ớc lấy mẫu cố định trong độ chia hoặc quyết định đó không bị suy giảm, trong khi ph−ơng pháp độ chia phân tích tín hiệu tại độ chia liên tục. Vì vậy nhiệm vụ của việc tìm đặc tr−ng qua độ chia dễ dàng hơn trong không gian độ chia so với việc miêu tả đa quyết định. Sự tinh xảo của lấy mẫu độ chia có thể thực hiện khi có yêu cầu. Sự khác biệt các đặc tr−ng của hai loại ph−ơng pháp xác định ở cách ứng dụng của chúng. Ph−ơng pháp không gian độ chia th−ờng đ−ợc sử dụng cho phân tích và tìm hiểu tín hiệu, trong khi ph−ơng pháp đa quyết định th−ờng đ−ợc sử dụng cho mã hoá. Nó cũng cần thiết để kết hợp ph−ơng pháp không gian độ chia với ph−ơng pháp đa độ chia. Ph−ơng pháp đa độ chia đ−ợc chú ý hơn đa quyết định trong điều kiện phân tích hoặc miêu tả tín hiệu tại một độ chia tại một thời điểm. Nó không khai thác khái niệm phân tích, miêu tả tín hiệu ở độ chia liên - 22 - tục. Mối t−ơng quan tác động cấu trúc tín hiệu thông qua độ chia làm mất ý nghĩa của ph−ơng pháp đa độ chia. 1.2.3.Thảo luận ở phần trên, hai công cụ phân tích: Biến đổi Fourier và không gian độ chia đã đ−ợc mô tả và thảo luận. Phạm vi quan trọng của hai công cụ này đã đ−ợc phân tích và chọn lọc. Biến đổi Fourier miêu tả một đối t−ợng sử dụng các thành phần cơ bản của các tính chất khác nhau. Không gian độ chia quan sát một đối t−ợng với vector cơ bản có chiều khác nhau (các số chiều của vector khác nhau). Thông tin phổ thu đ−ợc từ biến đổi Fourier có thể đ−ợc sử dụng trực tiếp cho việc mô tả hoặc miêu tả đối t−ợng. Trong khi thông tin trong không gian đo đạc thu đ−ợc từ không gian độ chia cần thiết sự giải thích sâu xa hơn tr−ớc khi sử dụng mô tả đối t−ợng. Sự giải thích thông tin không gian độ chia vẫn còn là thách thức. Điều đó rất quan trọng để làm lẫn lộn giữa giải thích đối t−ợng và mô tả đối t−ợng tại đa độ chia với giải thích đối t−ợng và mô tả đối t−ợng trong không gian độ chia, đây là một vấn đề rất khó. Trong các dạng của thông tin thu đ−ợc, biến đổi Fourier thu đ−ợc thông tin đối t−ợng với hệ số tần số thấp, trong khi miêu tả thông tin đối t−ợng thu đ−ợc với hệ số rất cao. Đối với không gian độ chia, thông tin đối t−ợng chung có thể đ−ợc giải thích từ độ chia cao hơn, trong khi thông tin mô tả đối t−ợng có thể đ−ợc giải thích từ độ chia thấp hơn. Sức mạnh của hai công cụ cho phân tích đối t−ợng là rất rõ ràng. Nó đ−ợc biết đến đó là phân tích đối t−ợng hoặc trích chọn đặc tr−ng trong miền không gian là rất khó vì vấn đề nhiễu và các đối t−ợng thay đổi. Những vấn đề này có thể dễ dàng v−ợt qua bởi việc phân tích đối t−ợng trong miền phổ hoặc trong miền không gian độ chia. Cả hai ph−ơng pháp chấp nhận việc phân tích đối t−ợng tăng dần tính chi tiết. Bằng việc loại trừ hoặc bỏ qua những chi tiết tinh tế nhất trong một đối t−ợng. Đối t−ợng có thể đ−ợc biểu diễn và thể hiện hiệu quả hơn. - 23 - Từ cách nhìn nhận này, không gian độ chia xử lý t−ơng tự với biến đổi Fourier. Tuy nhiên trong không gian độ chia, những chi tiết của đối t−ợng đ−ợc dịch chuyển trong miền tần số. 1.3. Phép đo t−ơng đồng và thực hiện các phép đo Đối với việc tìm kiếm ảnh dựa trên hình dạng và các đặc tr−ng ảnh đ−ợc trích chọn th−ờng là vector đặc tr−ng N chiều, nó có thể đ−ợc đề cập tới nh− một điểm trong không gian N chiều. Một bức ảnh đ−ợc đánh chỉ mục trong cơ sở dữ liệu sử dụng các vector đặc tr−ng đ−ợc trích chọn. Việc tìm kiếm ảnh thực chất là việc xác định sự giống nhau giữa ảnh truy vấn và các ảnh mục tiêu trong cơ sở dữ liệu mà thực chất là sự xác định khoảng cách giữa các vector đặc tr−ng miêu tả hình ảnh. Sự đo đạc khoảng cách mong muốn cần phải tham chiếu với nhận thức của ng−ời. Vì vậy, đối với một đặc tr−ng hình dạng dẫn tới sự chính xác của việc tìm kiếm ảnh cao hơn, phép đo khoảng cách tốt hơn. Đối với việc tìm kiếm ảnh trực tuyến thì hiệu quả cần phải đ−ợc xem xét khi lựa chọn một phép đo khoảng cách. Nhiều phép đo khoảng cách khác đã đ−ợc khai thác trong việc tìm kiếm ảnh, chúng bao gồm khoảng cách các khối trung tâm (SWA91);(STR95); khoảng cách Ơcơlit (VOO88); khoảng cách Cosin(VOO 88), khoảng cách giao nhau của biểu đồ histoogram, hai khoảng cách thống kê(RUB99), khoảng cách bậc hai (NiB93, DEN99, WOL96, SEI97) và khoảng cách Mahalanobis…(TRE71, SMI97). Trong mục này, một vài phép đo khoảng cách sẽ đ−ợc mô tả và −ớc l−ợng. Mục đích của việc −ớc l−ợng này để tìm ra một phép đo t−ơng đồng sự mong đợi cho các bộ mô tả −ớc l−ợng hình dạng khác nhau. Để biết tìm kiếm ảnh tốt nh− thế nào, cần phải có một phép đo khả thi. Nói chung, thực hiện các phép đo đo đ−ợc sự chính xác của việc tìm kiếm ảnh. Tuy nhiên, phụ thuộc vào sự xác định độ chính xác khác nhau, có các phép đo sự thực hiện khác nhau. 1.3.1. Phép đo sự giống nhau - 24 - Một phép đo t−ơng đồng th−ờng đ−ợc định nghĩa nh− một phép đo khoảng cách. Trong phần này mô tả chi tiết các phép đo sự giống nhau khác nhau. 1.3.1.1. Không gian phép đo khoảng cách Một không gian RN là một không gian phép đo nếu cho bất kỳ hai phần tử X và Y của nó, ở đó tồn tại một số thực d(x,y) gọi là khoảng cách thoả mãn các thuộc tính sau: (1) d(x,y) ≥ 0 {Không phủ định} (2) d(x,y) = 0 nếu x = y {Tính đồng nhất} (3) d(x,y) = d(y,x) {Tính đối xứng} (4) d(x,z) < d(x,y) + d(y,z) {Bất đẳng thức trong tam giác} (1.23) 1.3.1.2. Khoảng cách dạng Minkowski Khoảng cách dạng Minkowski đ−ợc định nghĩa dựa trên tiêu chuẩn Lp: ( ) ( ) )24.1(, 1 1 0 pN i p iip TQTQd ⎟⎠ ⎞⎜⎝ ⎛ −= ∑− = ở đây Q = {Q0, Q1,…….QN-1} là vector đặc tr−ng truy vấn T = {T0, T1, …….TN-n} là vector đặc tính t−ơng ứng Khi p = 1; d1(Q,T) là khoảng cách khối trung tâm hoặc khoảng cách Manhattan (L1). ( ) ( ) )25.1(, 1 0 1 ∑− − −= N i ii TQTQd Khi p = 2; d2(Q,T) gọi là khoảng cách Ơcơlit (L2) ( ) ( ) )26.1(, 2 1 1 0 2 2 ⎟⎠ ⎞⎜⎝ ⎛ −= ∑− − N i ii TQTQd Khi p →∞ ta có L∞ L∞ (Q,T) = max {(Qi - Ti)} ; 0 ≤ i ≤ N (1.27) 1.3.1.3. Khoảng cách Cosin - 25 - Khoảng cách Cosin tính toán sự khác nhau về ph−ơng h−ớng mà không để ý tới chiều dài vector. Khoảng cách này thu đ−ợc từ việc đo góc giữa hai vector. Bằng qui tắc tích vô h−ớng: θcos.... TQTQTQ t == ( ) )28.1( . .1cos1,cos TQ TQTQd t −=−= θ Hình 1.4: (a) khoảng cách Ocolit, (b) khoảng cách Cosin, (c) khoảng cách L1 Nh− có thể thấy: khoảng cách Ơcơlit có đ−ợc tính đến cả góc lẫn chiều dài vector để tính toán. Trong khi khoảng cách Cosin chỉ tính đến góc đó khi tính toán. Nh− kết quả: Q1 và Q sẽ có khoảng cách giống nh− đối với T. dcos(Q, T) = dcos(Q1, T) . Khoảng cách tính toán d1 giữa mỗi kích th−ớc của vector đặc tr−ng (hình 1.4) 1.3.1.4. Thông tin thống kê 2χ 2χ (thông tin thống kê) đ−ợc định nghĩa nh− sau: ( ) ( ) )29.1(, 1 0 2 2 ∑− = −= N i i ii m mQTQd χ ; 2 ii i TQm += Chất l−ợng các phép đo này là việc phân bố không chắc chắn nh− từ các biểu diễn thông dụng bởi các kết quả khác (RMB 99). 1.3.1.5. Đ−ờng giao biểu đồ - 26 - Đ−ờng giao biểu đồ đ−ợc đề xuất bởi Swain và Ballard {Swa 91}. Tìm thấy những đối t−ợng bên trong các bức ảnh một cách khách quan bằng việc sử dụng biểu đồ màu sắc. Nó cũng có thể vận dụng đối sánh cục bộ. Khi kích th−ớc đối t−ợng( với đặc tr−ng Q) nhỏ hơn kích th−ớc ảnh( với đặc tr−ng trong T). Định nghĩa gốc của khoảng cách biểu đồ cho bởi công thức: ( ) ( ) )30.1( ,min 1, 1 0 Q TQ TQd N i ii hi ∑− =−= Mở rộng trong khoảng cách đo đ−ợc có công thức nh− {SMI 97}: ( ) ( ) ( ) )31.1(,min ,min 1, 1 0 TQ TQ TQd N i ii hi ∑− =−= 1.3.1.6. Khoảng cách bậc hai Những khoảng cách đ−ợc tính toán từ phép đo khoảng cách đ−ợc mô tả ở trên chỉ tính toán sự t−ơng ứng giữa mỗi kích th−ớc và không làm cho thông tin sử dụng thông qua các kích th−ớc. Vấn đề này nhận ra trong sự thích ứng của biểu đồ. Khoảng cách bậc hai đ−ợc đề xuất để tính toán đến sự giống nhau thông qua kích th−ớc (NIB93, SMI97). Nó cung cấp nhỉều kết quả hơn là sự đối sánh duy nhất giữa các biểu đồ mẫu. Khoảng cách mẫu bậc hai giữa hai vector đặc tr−ng Q và T đ−ợc tính: ( ) ( ) ( )[ ] )32.1(, 21TQATQTQd tqad −−= ở đây [ ]ijaA = ma trận N*N và aij là hệ số giống nhau giữa những chỉ số kích th−ớc i và j. aij đ−ợc tính: max 1 d d a ijij −= ; trong đó [ ]iiij TQd −= Để tính toán, khoảng cách mẫu bậc hai đ−ợc viết lại (DEN 99) - 27 - ( ) )33.1(, 2 1 1 0 1 0 1 0 1 0 1 0 1 0 ⎥⎦ ⎤⎢⎣ ⎡ ++= ∑∑ ∑∑ ∑∑− = − = − = − = − = − = N i N j N i N j N i N j jijiijjiijqad TQTTaQQaTQd 1.3.1.7. Khoảng cách Mahalanobis Khoảng cách Mahalanobis là một tr−ờng hợp đặc biệt của phép đo khoảng cách dạng bậc hai. ở đó ma trận chuyển đổi có đ−ợc nhờ ma trận hiệp ph−ợng sai thu đ−ợc từ một tập học của các vector đặc tr−ng đó là A = Σ - 1. Để áp dụng khoảng cách Mahalanobis, vector đặc tr−ng đ−ợc coi nh− không gian biến [ ]110 ,..., −= NxxxX . Sau đó ma trận hiệp ph−ơng sai lấy từ R, ở đây [ ]ijrR = với { } { }yEyxEr jiij .,= đ−ợc lấy từ không gian biến y. Sau đó ma trận hiệp ph−ơng sai là Σ ; [ ]2ijσ=Σ và { } { }jiijij xExEr −=2σ . Khoảng cách Mahalanobis giữa hai vector đặc tr−ng Q và T thu đ−ợc bằng XQ = Q và XT = T. ( ) ( )[ ] )34.1(. 211 TQTQmah XXXXd −Σ−= − Trong tr−ờng hợp đặc biệt khi xi độc lập thống kê nh−ng xác suất không bằng nhau, Σ là ma trân đ−ờng chéo: ⎥⎥ ⎥ ⎦ ⎤ ⎢⎢ ⎢ ⎣ ⎡ =Σ − 2 1 2 1 2 0 0 Nσσ σ σ Trong tr−ờng hợp này, khoảng cách Mahalanobis đ−ợc tính lại có dạng t−ơng đ−ơng sau : ( ) ( ) )35.1(, 1 0 2 2∑− = −= N i i ii mah TQTQd σ Nó là một khoảng cách có trọng số L2 . Nó đem lại trọng số nhiều đối với kích th−ớc thay đổi ít hơn với sự thay đổi nhỏ hơn và trọng số ít hơn với kích th−ớc biến đổi nhiều hơn. 1.3.2.Thực hiện phép đo - 28 - Để định l−ợng các giải thuật khác nhau cho tìm kiếm ảnh, một phép đo hiệu quả thực hiện là cần thiết. Các phép đo hiệu quả thực hiện đã đ−ợc đề x−ớng [ ]99,98 BMILU , phép đo sự thực hiện th−ờng dựa trên việc thống kê các b−ớc thử chủ quan. Các phép đo sự thực hiện khác th−ờng sử dụng các phép thử chủ quan khác, dẫn đến các định nghĩa khác nhau về sự chính xác trong tìm kiếm ảnh. Các phép đo sự thực hiện khác nhau đ−ợc thảo luận trong phần này. 1.3.2.1. Độ nhạy và độ chính xác(RPP). RPP là phép đo sự thực hiện tìm kiếm ảnh đ−ợc sử dụng rộng rãi nhất trong các bài giảng. Về cơ bản nó dựa trên sự đối sánh tuyệt đối. Trong ph−ơng pháp này, CSDL đ−ợc chuyển thành tập nhị phân theo sự phù hợp hoặc không hợp với truy vấn dựa trên phép thử chủ quan. Trong các phép thử chủ quan, mỗi một đối t−ợng lựa chọn một tin tức t−ơng ứng với dạng truy vấn từ CSDL. Các mục đích đ−ợc lựa chọn cho mỗi truy vấn sát với các đối t−ợng có sẵn đ−ợc xem xét thích hợp tới truy vấn. Ng−ợc lại, chúng đ−ợc coi là không thích hợp. Độ chính xác và độ nhạy đ−ợc định nghĩa nh− sau: 1n rP = r : Số l−ợng các ảnh tìm kiếm phù hợp n1 : Số l−ợng ảnh đ−ợc tìm kiếm )36.1( 2n rR = n2 : Tổng số l−ợng các ảnh thích hợp trong CSDL Độ chính xác đo bằng tìm kiếm ảnh chính xác trong khi độ nhạy đo bằng khả năng tìm kiếm mục đích thích hợp từ CSDL. Độ chính xác và độ nhạy có mối hệ ng−ợc nhau. Sự chính xác thông th−ờng giảm t−ơng ứng sự gia tăng độ nhạy (cái này tăng thì cái kia giảm). 1.3.2.2. Tỷ lệ trọng số thành công (PWH- Percentage of Weighted Hits) - 29 - PWH t−ơng đ−ơng nh− phép đo độ nhạy ở RPP. Phép thử chủ quan giống nh− độ chính xác, đó là mỗi đối t−ợng lựa chọn một vài mục phù hợp với truy vấn từ CSDL. Tuy nhiên thay vì việc đo độ nhạy dựa trên giá trị nhị phân phù hợp nh− trong RPP, PWH gán một trọng số thích hợp wi cho mỗi Iterm wi t−ơng ứng. Vì vậy PWH đ−ợc định nghĩa nh− sau: ở đây, n là số iterm trả lại và N là tổng các iterm trong CSDL. Độ nhạy là tr−ờng hợp đặc biệt của PWH khi wi nhận các giá trị 0 và 1. 1.3.2.3. Phần trăm của thứ bậc giống nhau (PSR-Percentage of Similarity Ranking ) PSR đ−ợc đề xuất bởi Bimbo và Pala[bim 97], trong phép đo này mỗi đối t−ợng gán một dãy giống nhau cho mỗi iterm trong CSDL dựa trên sự t−ơng đồng của iterm với truy vấn. Điều này hơn hẳn việc gán sự thích hợp / không thích hợp nh− trong RPP và PWH. Kết quả cuối cùng của phép thử là ma trận Qj(i,k)- chỉ số thứ tự của iterm chủ đề I tại vị trí k cho câu hỏi j. Có nghĩa Pj(i) và σj(i) của mỗi hàng đã đ−ợc tính. Pj(i) và σj(i) giới thiệu thứ tự trung bình của bức ảnh thứ i cho truy vấn j và phép đo đ−ợc thoả thuận trong một thứ bậc khép kín t−ơng ứng với Pj(i). Nếu mỗi truy vấn j, một thuật toán tìm kiếm trở thành một iterm I tại thứ tự Pj(i) thì khi đó thoả thuận giữa thuật toán xếp hạng và sự xếp thứ bậc do con ng−ời thực hiện đ−ợc đo bởi PSR Sj(i): (1.37) - 30 - Đồ thị của Sj(i) nh− hàm của Pj(i) chỉ ra hiệu quả tìm kiếm của thuật toán t−ơng đối cao. Sj(i) cao chứng tỏ độ chính xác tìm kiếm cao. 1.3.2.4. Thảo luận Ba phép đo sự thực hiện đ−ợc giới thiệu, PWH chỉ ra trong tính toán số l−ợng các chủ đề khác nhau lựa chọn cho iterm t−ơng ứng. Nó đáp ứng sự sắp xếp của con ng−ời nhiều hơn trong recall ở RPP. Tuy nhiên PWH không đo khả năng loại bỏ các iterm không phù hợp trong danh sách hoàn lại. Sự bất lợi của PWH là nó lại giả thiết một số iterm cố định đ−ợc hoàn trả, điều này là không thực tế vì số iterm hoàn trả có thể khác nhau. Đối với PSR mang lại trong tính toán số l−ợng và thoả thuận của việc con ng−ời sắp xếp thứ bậc. Tuy nhiên với một truy vấn PSR mang lại một iterm chi tiết tại một thứ tự chi tiết là cao khi đó mâu thuẫn đối với truy vấn là nhỏ. Điều này dẫn đến kết quả PSR thấp nếu sự sắp xếp của thuật toán tìm kiếm khác với sự sắp xếp của con ng−ời. Mặt khác nếu mâu thuẫn lớn thì PSR có thể là cao thậm chí khi sự sắp xếp bằng thuật toán khác hẳn sắp xếp của chủ đề. Phép đo RPP có khả năng khôi phục iterm phù hợp và cả khả năng loại bỏ iterm không phù hợp. Sự bất lợi duy nhất của RPP là bỏ qua sự phù hợp của với truy vấn. Sự bất lợi này là không quan trọng nếu tập dữ liệu là một phân lớp. RPP là phép đo sự thực hiện −u việt hơn PWH và PSR. Đặc biệt thích hợp để đo sự thực hiện khôi phục dữ liệu trên tập dữ liệu lớn và đ−ợc phân lớp. 1.3.3. Trích chọn đặc tr−ng hình dạng. Trích chọn thông tin hình dạng từ dữ liệu ảnh tập trung ở đ−ờng viền và nhận thức về hình dạng là không thay đổi đối với thay đổi độ t−ơng phản( thay đổi trong độ chia màu sắc và độ chói) . Hình dạng hình học có đ−ợc mô hình nh− (1.38) - 31 - đ−ờng cong khép kín. Tuy nhiên trong một vài quan sát gần đây một phần đối t−ợng khi quan sát bị ẩn bởi các đối t−ợng khác, mặc dù vẫn còn giới hạn trong nhận thức của con ng−ời khi nhận dạng hình dạng trong ảnh.Vì vậy nhân tố hình dạng thực sự không trọn vẹn các cung t−ơng ứng của đ−ờng viền đối t−ợng, chỉ là một đoạn đối t−ợng. Trong luận văn này chấp nhận biểu diễn nhân tố hình dạng với bất kỳ đoạn cung nào. Thông tin về việc trích chọn nhân tố hình dạng từ ảnh nh− thế nào là không cần thiết cho moment, ta sẽ tính toán tập các nhân tố hình dạng đ−ợc trích chọn từ một ảnh đ−ợc giới thiệu phù hợp với biểu diễn ngữ nghĩa hình dạng của chúng. Khi hình dạng là đối t−ợng bị ảnh h−ởng của méo dạng xa gần, bằng nhận thức của mình con ng−ời vẫn có thể nhận dạng dạng đúng đối t−ợng. Để so sánh, biểu diễn hình dạng là không đổi với các phép biến đổi này và không đề cập tới các phép biến đổi trong đối sánh hình dạng, vì chúng cho phép vạch ra một lớp lớn các cung thành một đ−ờng tròn và vì thế vạch ra các cung tuỳ ý tạo thành cung tròn. Phép biến đổi trục đo có thể xấp xỉ cục bộ bằng phép biến đổi quan hệ. Hình 1:a ảnh ký tự,b) mức đ−ờng t−ơng ứng, c) Đoạn mức đ−ờng Từ nhân tố hình dạng khá cục bộ yêu cầu biểu diễn nhân tố hình dạng dạng hình học không thay đổi. Phần lớn các ứng dụng chỉ cần t−ơng đ−ơng không đổi là đủ. Vì vậy, Có thể biểu diễn mỗi nhân tố hình dạng S bằng danh sách của K bộ mô tả quan hệ hoặc sự t−ơng đồng không đổi, gọi là Code(mã) Hình 1 1.4. Thảo luận - 32 - Trong ch−ơng này một vài công cụ cơ bản sẽ đ−ợc sử dụng trong việc tìm kiếm, nhận dạng ảnh dựa vào hình dạng và trích chọn các đặc tr−ng đã đ−ợc nhắc lại. Những lý thuyết và thuộc tính quan trọng của hai công cụ trích chọn đặc tr−ng tức là biến đổi Fourier và không gian độ chia đã đ−ợc mô tả và bàn luận. Hai công cụ mà những đặc tr−ng hình dạng có đ−ợc từ những miền khác nhau. Với biến đổi Fourier có đ−ợc các đặc tính từ miền phổ và không gian độ chia có đ−ợc các đặc tr−ng từ miền không gian. Cả hai công cụ đều hữu ích cho phân tích hình dạng bởi chúng có khả năng thu đ−ợc đặc tr−ng tín hiệu của một hình dạng khi loại trừ bớt nh−ng chi tiết hình dạng tinh tế nhất. Các phép đo sự giống nhau khác và phép đo sự thực hiện cũng d−ợc thảo luận. Phép đo sự giống nhau khác đ−ợc −ớc l−ợng sử dụng các đặc tr−ng ảnh tổng quát và tập CSDL hình dạng tiêu chuẩn. Các kết quả thí nghiệm chỉ ra phép đo khoảng cách khối trung tâm là phù hợp cho khôi phục ảnh dựa trên hình dạng. Tuy nhiên nó sẽ đ−ợc sử dụng nh− phép đo t−ơng đ−ơng trong thí nghiệm khôi phục ảnh trong suốt luận văn. Một khi những tập CSDL sử dụng cho thí nghiệm trong luận văn đ−ợc phân lớp thành tất cả các nhóm giống nhau và không giống nhau, RPP sẽ đ−ợc sử dụng cho phép đo sự thực hiện. - 33 - Ch−ơng 2 Ph−ơng pháp tách contrario Ph−ơng pháp tách contrario nhằm giải quyết 3 vấn đề cơ bản trong phân tích nhóm: đầu tiên là −ớc l−ợng giá trị của nhóm, thứ hai là vấn đề nhóm có ý nghĩa này lại th−ờng chứa trong các nhóm có ý nghĩa khác, cần thiết phải định rõ nhóm có ý nghĩa nhất trong số các nhóm đó, thứ 3 là định rõ qui tắc kết hợp giữa các nhóm có ý nghĩa cho phép quyết định có sự riêng biệt giữa các nhóm hay chúng chỉ là một, nhằm mục đích nhận dạng hình dạng. Thuật toán đối sánh đ−ợc tính toán t−ơng ứng của các nhân tố hình dạng giữa hai ảnh đem so sánh và thiết lập mối quan hệ không gian giữa các đối sánh nhân tố hình dạng đ−a vào ảnh. Mỗi cặp đối sánh hình dạng dẫn tới 1 biến đổi xác định. Ch−ơng này giới thiệu lý thuyết lựa chọn nhóm đúng để nhóm các nhân tố hình dạng thành một hình dạng dựa vào việc tách nhóm trong không gian biến đổi. Thực hiện nhóm nhằm mục đích phát hiện ra các cấu trúc bằng cách phân chia điểm trong tập dữ liệu điểm thành các nhóm tự nhiên. Ph−ơng pháp này sử dụng cho vấn đề nhận dạng, đ−a vào hai ảnh, trả lời câu hỏi: hai ảnh có hình dạng nào chung. Thay vì phải phân tích nhiều nhân tố hình dạng và định rõ chúng trong mỗi cặp ảnh đ−ợc đề cập mỗi nhân tố hình dạng đ−ợc định nghĩa theo nhiều cách: nhân tố hình dạng t−ơng ứng nh− các đoạn mức đ−ờng đã đ−ợc mã hóa trong mối quan hệ xác định. B−ớc nhận dạng tiếp theo là đối sánh sự t−ơng đồng của các nhân tố hình dạng. Khi các nhân tố hình dạng là một đoạn của mức đ−ờng, mỗi thủ tục đối sánh với 1 phân tích tách biên đ−ợc mô tả chi tiết. Kết quả của thủ tục là một tập các cặp đối sánh nhân tố hình dạng. Do đối sánh cục bộ không tách hai nhân tố hình dạng của cùng 1 hình dạng đơn vì vậy các nhân tố hình dạng phải nhóm cùng nhau. Các nhóm tập các nhân tố hình - 34 - dạng đ−ợc biến đổi từ ảnh đầu tiên đến ảnh thứ hai bằng cùng phép biến đổi. Chính điều này dẫn tới việc tìm nhóm các nhân tố hình dạng có thể tính toán nh− tách nhóm thông th−ờng. Vấn đề của việc tìm ra nhóm trong tập cơ sở dữ liệu là một nghiên cứu thực sự. Nó bao gồm việc nhận dạng, phân lớp đối t−ợng trong CSDL. Tất cả các ph−ơng pháp phải đối mặt với ba vấn đề tổng quan đã nêu trên. Dubes và Miligan và Cooper đã giới thiệu giải pháp để lựa chọn số nhóm, mỗi nhóm chú ý đến qui tắc dừng trong ph−ơng thức thứ bậc. Ph−ơng pháp Contrario định nghĩa một ph−ơng pháp cơ sở cho các phép đo sự tập trung của các điểm. Trong ph−ơng pháp này, phân lớp sắp xếp tập các đoạn đ−ợc đề cập và nhóm có ý nghĩa đ−ợc tách. Sự thuận lợi của các thủ tục chính là tính hệ thống, và có thể tổng quát chung cho bất cứ chiều nào (mặc dù gánh nặng tính toán trở nên quá nặng). Tuy nhiên không giải quyết đ−ợc vấn đề ra quyết định, Grimson và Hutterloche giới thiệu một nghiên cứu trên Likelihood của điểm sai trong không gian tham số Hough. Công việc này làm cơ sở cho ph−ơng pháp tách đ−ợc giới thiệu. Các ph−ơng pháp nhận dạng tr−ớc đó kết hợp một ng−ỡng đơn với mỗi ảnh mục tiêu, độc lập với các cảnh phức tạp. Ng−ợc lại với các ph−ơng pháp trên, theo ph−ơng pháp này ng−ỡng nhóm để nhóm bị chia phải đáp ứng xác suất quan trọng. 2.1. Cluster có thứ bậc và đánh giá giá trị 2.1.1.Giá trị nhóm Contrario Định nghĩa một phép đo định l−ợng giá trị nhóm các điểm. Một nhóm sẽ đ−ợc đề cập nh− một vùng có ý nghĩa khi nó hàm chứa trong vùng có một vài điểm mong đợi nếu nh− dữ liệu đ−ợc xác định tại một không gian. Từ đó, một ph−ơng thức xác suất phải đ−ợc định nghĩa chính xác, thậm chí nó sẽ đ−ợc yêu cầu. 2.1.1.1. Cơ sở: - 35 - Trong tất cả các công thức sau, E lấy từ tập phụ RD, để lại với một phép đo xác suất π (nó sẽ đ−ợc gọi là luật cơ sở). Định nghĩa π(R) là xác suất tại một không gian điểm phụ thuộc R. Định nghĩa của π là một vấn đề cụ thể tổng quan đ−a ra một xác suất biết tr−ớc hoặc có thể −ớc l−ợng theo kinh nghiệm trên tập dữ liệu. Định nghĩa 2.1: Một xử lý nền là một xử lý các điểm có hạn (Xi) i= 1...M trong E từ các biến độc lập với nhau, định dạng phân bố theo luật π. Trình bày tập dữ liệu của M điểm (x1, x 2,... xM) trong E M , một tập phụ của tập dữ liệu sẽ là nhóm có nghĩa nếu các điểm quan trọng thuộc vào một vùng rất nhỏ, ở đó xác suất của những điểm này rất nhỏ. Vì vậy, cơ sở của ph−ơng thức Contrario là trái với giả thiết d−ới đây: (A): mô tả M ∈ Xi (i = 1,…. M) là một xử lý nền thực sự. Giả thiết cho khoảng cách E = (0,1)2 và π đồng dạng luật E. Đem M điểm trong E = (0,1)2; nó luôn có thể tìm một kết nối tập R với xác suất nhỏ tuỳ ý π(R) bao hàm trong mọi tập dữ liệu điểm. Trong thực tế, định nghĩa một nhóm có nghĩa sẽ bao hàm tổng có hạn các vùng phụ. 2.1.1.2. Nhóm có ý nghĩa. Đề cập một vùng R∈E bao gồm vùng gốc, giả thiết k điểm trong số x1...xM phụ thuộc vùng có dạng xj + R, cho 1≤ j ≤ M, nếu k đủ lớn, và π(xj + R) đủ nhỏ, chúng sẽ mô tả một tập hợp điểm trong vùng xj + R. Nhóm các điểm này sẽ đ−ợc tách trong xj + R, bằng ph−ơng pháp trái ng−ợc với ph−ơng pháp nền. Giả thiết các điểm thay đổi, nhóm có thể đ−ợc gộp lại quanh điểm xj bất kỳ và có hình dạng bất kỳ. Fix cứng xác suất cho tr−ớc, vùng R sẽ phải thuộc vào tập vùng gốc R có giới hạn, nó sẽ đ−ợc mô tả kỹ hơn. Giả thiết đơn giản hơn R giới hạn các dự tuyển #R và với mọi R∈R, O∈ R. k ≤ M ∈ N và 0 ≤ p ≤ 1 - 36 - Dạng luật nhị phân xử lý nền X1...X M và vùng R ∈ E với xác suất π (R), 1 có thể giải thích nh− xác suất tại điểm cuối k ngoài các điểm M của việc xử lý vào trong tập R. Mặc dù nghiên cứu dạng nhị thức và chúng sử dụng trong tách cấu trúc hình học có thể tìm thấy. Cho 1 ≤ j ≤ M và R' ∈ R Chú ý: X = (X1...XM): xử lý nền. Xj = (X1... XM): Xj thành phần bị thiếu. K (Xj, Xj, R '): số các điểm trong danh sách Xj phụ thuộc Xj + R '. Định nghĩa 2.2: Đặt R là một vùng dạng R = Xj + R ' j ∈ (1,...,M) và R' ∈ R. Gọi số cách báo sai của R = Xj + R' Gọi R = Xj + R ' là một vùng ε có nghĩa nếu NFAg(X, j, R') ≤ ε. Chú ý NFAg(X, j, R') cũng đ−ợc biểu thị bởi NFAg(R). Mục đích của chúng ta là giới thiệu mở rộng số l−ợng vùng có ý nghĩa ε là nhỏ hơn ε. Proposition 2.1 Nếu X1...XM là một xử lý nền, sự mở rộng số vùng có nghĩa ε nhỏ hơn ε. Để tính toán số các cảnh báo lỗi là phép đo sự giống nhau giữa các nhóm chứa trong vùng R nh− thế nào trong một tập dữ liệu điểm này ẩn chứa trong k điểm dữ liệu khác. Mức NFAg(R) thấp hơn, (Prop 2.1) thông số điều khiển tách là ε. Mệnh đề d−ới đây chỉ ra ảnh h−ởng của tham số #R và của thông số quyết định ε trong kết quả tách biên là rất ít. Mệnh đề 2.2: Đặt R là một vùng của R (2.1) (2.2) - 37 - Chú ý: k*(ε) là giá trị nhỏ nhất của điểm trong nhóm có nghĩa ε. Bằng kết quả dự đoán, quyết định ng−ỡng này chỉ có loga phụ thuộc #R và ε. Hình 2.2: Nhóm dữ liệu 950 điểm đồng dạng Hình 2.2 chỉ ra một ví dụ của nhóm dữ liệu bao gồm 950 điểm đồng dạng phân bố trong một đơn vị vuông và 50 điểm thêm vào xung quanh (0,4;0,4) và (0,7;0,7) xung quanh 950 điểm; phân bố đồng đều trong một đơn vị vuông. Trong ví dụ này #R= 2500 (50 kích cỡ khác cho mỗi chiều). Chính xác hai nhóm lớn nhất đ−ợc tách (hình 2.2) NFA của miền trái thấp hơn 10-8 trong khi NFA bên phải 107 2.1.2. Tiêu chuẩn kết hợp tốt nhất. Trong mục 2.2.1.2 đã giới thiệu hạn chế không gian của việc kiểm tra vùng từ Xi+R, Xi là mô tả dữ liệu và R∈ R , một tập hỗn hợp có giới hạn các vùng chứa vùng gốc trong RD. Độ d− thừa cao khi mỗi vùng có nghĩa lại liên quan tới tập mô tả biểu diễn các vùng có nghĩa khác. - 38 - Hai vùng R ⊂ R', câu hỏi này dễ dàng trả lời bằng việc so sánh NFAg(R) và NFAg(R'). Vùng có số l−ợng các cách báo sai nhỏ nhất là phù hợp hơn. Một cách hỏi khác khi 3 hoặc nhiều vùng liên kết với nhau, vì vậy phải yêu cầu một tiêu chuẩn hỗn hợp. Đầu tiên sẽ định nghĩa số cảnh báo sai cho một cặp vùng. Giá trị mới này đ−ợc so sánh với NFA của vùng hỗn hợp. Giới thiệu 3 hệ số danh nghĩa. Chú ý: Số này đ−ợc diễn dịch nh− sau: đặt R1 và R2 là hai vùng tách rời của E và π1= π (R1), π2 =π (R2) xác suất của chúng à(M, k1 , k2, π1 , π2) là xác suất tại giá trị nhỏ nhất k1 trong số M điểm và tại điểm thấp nhất k2 trong số M-k1 điểm, theo thứ tự là vùng R1 và R2. Mục tiêu là định nghĩa 1 NFA mới cho mỗi thành phần. Đặt 1<i ≠ j <M và R’, R”∈ R. Bây giờ 2 vùng thử Xi + R' và Xj + R'' có thể giao nhau và phải thực sự với xác suất này. Chú ý: đ−ợc mô tả bằng sự thay đổi hoàn toàn vai trò i và j: Định nghĩa 2.3: Gọi số cách báo sai của 2 cặp vùng bất kỳ (Ri, Rj) = (X i+ R', Xj + R '') (2.3) (2.4) - 39 - Cặp vùng bất kỳ(Ri,Rj) là có ý nghĩa ε nếu NFAgg(X,i,j,R',R'') < ε, NFAgg (X,i,j,R',R'') cũ sẽ đ−ợc chứa trong NFAgg (Ri,Rj). Mệnh đề 2.3: Số cặp vùng lý t−ởng nhỏ hơn ε Mệnh đề này dẫn tới 2 phép đo kém ý nghĩa: NFA của vùng và NFA của cặp vùng. Từ số l−ợng vùng có ý nghĩa ε trong ph−ơng thức nền ở trên đề cập tới biên độ t−ơng tự nhau đ−ợc so sánh để định nghĩa một tiêu chuẩn hỗn hợp Định nghĩa 2.4 (Vùng riêng biệt): Đặt R1 và R2 là hai vùng riêng biệt và R là một vùng chứa tất cả các dữ liệu điểm của R1 và R2. Nói rằng R là riêng biệt mối quan hệ với R1 và R2 nếu: Tập R là vùng thử và R là một nhân tố của R. R là riêng biệt trong R nếu nó độc lập quan hệ với mọi cặp vùng (R1, R2) chứa trong R; mỗi R chứa các điểm của vùng R1, R2 công thức (2.5) giới thiệu một phép thử chủ yếu cho kết cấu một tập hợp vùng Cluster. Nếu công thức 2.5 không xảy ra vùng thử đ−ợc coi nh− vùng không có giá trị, có nghĩa vùng thử có thể chia thành nhiều cặp vùng có nghĩa khác trong Cluster. Lenma tiếp theo sẽ cung cấp sự hữu ích trong việc gia tăng quyết định hỗn hợp. Lenma 2.1: Mỗi giá trị k1 và k2 trong (0,…., M). Mỗi k1, k2 ≤ M và mỗi π1 và π2 [0,1] sao cho π1 + π2 ≤ 1. Mệnh đề 2.4: Nếu R là riêng biệt với chú ý tới R1 và R2 Từ mệnh đề (2.4) và định nghĩa (2.4) (2.5) (2.6) - 40 - Bằng Lenma 2.1, với ( ) ( )pkMpkM ,,,,1 ββ ≤− cho mọi M, k, p công thức biểu diễn nh− sau: Mệnh đề 2.4 là hữu ích cho tính toán tổng quan, có thể tránh việc phải tính toán chi tiết 3 phân bố bằng bộ lọc các cluster đó . 2.1.3. Vấn đề tính toán 2.1.3.1. Lựa chọn vùng thử. Tập đúng của các vùng thử R nh− thế nào? Một vài lý do a > 0, r > 0 và n ∈N đề cập tới tất cả mọi vùng mà chiều dài đ−ờng biên thuộc vào tập {a, ar, ar2, arn}. Liên hệ với một số vùng thử có nhiều hình dạng kích cỡ khác nhau. Để đơn giản lựa chọn vùng thử có hình chữ nhật thích hợp với xác suất phân bố p đ−ợc định nghĩa trên miền chữ nhật E của RD là kết quả kéo căng một chiều t−ơng ứng. Định nghĩa 2.2: thừa nhận tính toán NFA của bất cứ vùng thử nào tại dữ liệu điểm. Từ số l−ợng các độ chia là n cho mỗi chiều có MnD vùng tại dữ liệu điểm. Từ số l−ợng các điểm quan sát khả thi. MnD sẽ rất lớn khi n tăng. Điều này giải thích tại sao phép thử không thể thực hiện theo cách này. Tốt hơn nên giải quyết cây cấu trúc của tập dữ liệu điểm mô tả bằng thuật toán tập trung thứ bậc. Tổ chức thứ bậc dữ liệu đ−ợc sử dụng để giới hạn các vùng thử, bằng thủ tục nh− sau: B−ớc 1: Bằng việc áp dụng ph−ơng pháp tập trung thứ bậc, ph−ơng pháp này cung cấp 1 tập hợp các tập con ẩn trong tập hợp điểm. Cấu trúc cây mà trong đó mỗi nút là một phần của tập dữ liệu và là một ứng viên Cluster. Cây này gọi là dendgrogram. Phần lớn các thủ tục đ−ợc thực hiện bởi việc lặp lại thủ tục nhị phân hỗn hợp. Vì vậy trực tiếp thiết lập cây nhị phân trong mỗi ph−ơng pháp, b−ớc khởi đầu: thiết lập nút là tập dữ liệu đơn {x1}...{xN}.Tại mỗi giai đoạn xây dựng 2 nút cha của - 41 - chúng. Khoảng cách nhóm, Cluster phải đ−ợc lựa chọn địa chỉ học. Trong tr−ờng hợp mật độ phân bố dữ liệu ít, b−ớc 1có thể khoảng cách nhỏ nhất d(xi, xj) tại xi phụ thuộc cluster đầu tiên và xj ở b−ớc 2. Các nút của cây đ−ợc tích hợp tất cả các phần tại tất cả các mức và lớp "cháu" của nút là 2 phần mà đã đ−ợc tích hợp từ đó. Tại sao mỗi một cấu trúc lại cần thiết, tr−ờng hợp tập các đoạn trong tập dữ liệu điểm lớn, thừa nhận một cấu trúc cây để giảm bớt việc khảo sát tỉ mỉ nhằm nghiên cứu một cây phụ tốt nhất đối với cấu trúc cây khởi tạo. Việc giảm bớt này dễ bị ảnh h−ởng nếu tập các nút của cây khởi tạo bao gồm tất cả các nhóm trong tập dữ liệu. Sự lựa chọn phép đo chính xác trên tập dữ liệu điểm và của khoảng cách cluster nguyên phải đ−ợc định rõ cẩn thận. Đem đến một dendrogram của tập cơ sở dữ liệu điểm, thuật toán d−ới đây chấp nhận khảo sát tỉ mỉ tất cả các vùng tại dữ liệu điểm và hàm chứa một nút của dendrogram. Thuật toán nhóm Mỗi nút G trong cây cluster hoặc dendrogram. 1- Mỗi điểm x thuộc nút: a) Tìm vùng nhỏ nhất x + R trung tâm tại điểm này, và chứa các dữ liệu điểm khác của nút. Gọi k+1 là số điểm dữ liệu mà nó chứa trong. b) Tính toán NFA của vùng nh− M.# R.B (M-1, k, p (x+R)) 2- Kết hợp với nút G của vùng R(G) với mức NFA đ−ợc tính toán thấp nhất, nó chứa điểm của nút G nh−ng cũng có thể chứa dữ liệu điểm khác. Từ thuật toán này đ−ợc tính toán, một vùng ứng cử đ−ợc kết hợp với mỗi nút bằng một chủ ý lạm dụng sự vô hại, chú ý NFAg(G) = NFAg(R(G)). Cách t−ơng tự, nếu G1 và G2 là một cặp nút và R(G1) và R(G2) là vùng của chúng. Chú ý NFAgg(G1,G2) = NFAgg(R(G1), R(G2)). Bằng cách này, cây cluster đ−ợc để lại cho NFAg và cho các cặp nút. Đặt R của vùng dạng R(G) thừa h−ởng từ cấu trúc ấy. - 42 - 2.1.3.2. Riêng rẽ và cực đại. Đối mặt vấn đề có thể có nhiều nhóm có nghĩa bởi ph−ơng pháp tr−ớc, NFA của chúng đã biết. Có thể cùng tính toán NFA của cặp cluster và so sánh thô với NFA hợp nhất của chúng. Định nghĩa tiếp theo giới thiệu một cách để lựa chọn cluster đúng, bằng việc sử dụng dendrogram cluster Định nghĩa 2.5 ( Cực đại nhóm có nghĩa ε) Một nút vùng R = R(G) trong R là ý nghĩa ε cực đại nếu và chỉ nếu: 1/ NFAg(R) ≤ ε 2/ R là riêng rẽ quan hệ với mọi cặp của sự xuống dốc. 3/ Mọi sự giảm độc lập R', NFAg(R') ≥ NFAg(R) 4/ Mọi sự tăng độc lập R', NFAg(R') >NFAg(R) hoặc tồn tại một sự giảm độc lập R'' của R khi NFAg(R'') < NFAg (R'). Ta nói rằng G là vùng ý nghĩa ε lớn nhất nếu là R(G). Điều kiện 4 bao hàm R có thể bị từ bỏ cho một vùng rộng hơn nếu vùng đó không bị áp đặt bởi một sự giảm. áp đặt điều kiện 3 và 4 chắc chắn 2 nhóm vùng ý nghĩa cực đại khác nhau là riêng rẽ. L−u ý rằng sự riêng biệt đ−ợc yêu cầu chỉ với mối liên hệ của cặp giảm. Định nghĩa 2.4 đáp ứng lý thuyết nh−ng không đáp ứng trong thực hành. 2.2. Kinh nghiệm có giá trị: Nhóm đối t−ợng dựa trên đặc tr−ng thành phần Hiện t−ợng nhóm là cần thiết trong nhận thức của con ng−ời từ đó chúng đáp ứng cho tổ chức thông tin. Mục tiêu của những kinh nghiệm này để trích chọn nhóm đối t−ợng trong ảnh, đó là hình dạng hình học mà một vài thành phần sở hữu. Đ−ờng viền đối t−ợng đ−ợc trích chọn nh− một vài đ−ờng mức t−ơng giảm trong ảnh, gọi là mức đ−ờng có ý nghĩa ([5] cho mô tả đầy đủ của thủ tục trích chọn này). Từ những đối t−ợng đ−ợc tách gọi là O1...OM, có thể tính toán cho chúng một mục D đặc tr−ng (độ chói, h−ớng, độ t−ơng phản...) Nếu k trong - 43 - số M đối t−ợng có một vài đặc tr−ng chung, liệu điều gì sẽ xảy ra khi thay đổi hoạc C nó có đủ để nhóm chúng. Mỗi dữ liệu điểm là một điểm trong tập đ−ờng viền của RD và ph−ơng pháp đã mô tả ở trên đ−ợc ứng dụng (thực tế, một vài các ngang cấp nh− góc phụ thuộc vào đơn vị tròn, từ tính chung kỳ phải đ−ợc đặt vào hàng đội, điều này có thể thực hiện với các cách t−ơng tự). 2.2.1. Nhiễu điểm Mỗi cái chứa 2 nhóm 25 điểm thêm vào 950 không đồng dạng trong một đơn vị vuông. Hai nhóm và 2 nhóm đ−ợc chọn với NFAg tốt (<10-7) kinh nghiệm trong hình 5 chỉ ra sự quan trọng của phân bố tr−ớc dữ liệu điểm. Hai phân bố khác nhau dẫn tới 2 vùng có ý nghĩa cực đại khác nhau. Nh−ng cả hai mối quan hệ đều đúng nh−ng lại phụ thuộc vào ngữ nghĩa. Hình 2.5: Vấn đề quan trọng của phân bố ph−ơng thức nền. Dữ liệu gốc là hình bên trái. Nó vị trí của 500 điểm trong 0,12 500iid điểm trong (0; 0,5) x (0; 1) và 25 điểm quanh (0,2; 0,3). Trong phần giữa; 1 phân bố tr−ớc trong ph−ơng thức nền mang lại đồng dạng. Sau đó, một vùng có ý nghĩa cực đại và độ rộng đơn đ−ợc tách, bao gồm 793 điểm và lg (NFAg)=44,9. Hình bên phải, phân bố đ−ợc định nghĩa nh− sản phẩm của phân bố lề theo kinh nghiệm trong tách dọc và tách ngang. Vùng có ý nghĩa cực đại đơn (- log10(NFAg) = 1,6) nh−ng bây giờ nó không phù hợp với nhóm nhỏ nhất. 2.2.2. Phân đoạn - 44 - Các nhóm đ−ợc nhận thức nh− 1 kết quả cộng tác giữa hai đại l−ợng trong khác nhau. Hình 2.6 chỉ ra 71 phân đoạn thẳng với h−ớng khác nhau; d−ờng nh− vị trí phân bố đồng dạng. Không cluster có ý nghĩa nào đ−ợc tách trong không gian sắp xếp vị trí của chúng. Trong tất cả các kinh nghiệm, số của kích ảnh hình chữ nhật trong mỗi lần tách là 50. Vì vậy #R= 50D. Hình 2.6: phân đoạn ảnh đã scan và 71 đ−ờng mức có mức ý nghĩa cực đại. Nếu h−ớng đ−ợc lựa chọn nh− một đặc tr−ng (D=1); 8 nhóm có ý nghĩa cực đại đ−ợc tách; t−ơng ứng với h−ớng đ−ợc biểu diễn rõ nhất. Không một cluster nào đ−ợc biểu diễn mức (trung tâm) NFAg thấp. Chỉ duy nhất một trong số các nhóm đó là riêng rẽ nh−ng h−ớng rõ ràng không phải là một nhân tố. Chú ý, nhóm này không bao gồm tất cả các phân đoạn trung tâm. H−ớng của chúng là khác nhau, và nhóm của 11phân đoạn không phải là cực đại. Tất cả các nhóm khác nhau thực sự không đ−ợc cảm nhận bởi vì chúng bị che phủ bởi sự lộn xộn tạo ra từ tất cả các đối t−ợng khác nhau. Tuy nhiên, một nhóm không thể có đối t−ợng chúng có một kết cấu phức tạp. Trong hình 2.7, có 8 nhóm có ý nghĩa cực đại. Thứ tự từ NFAg từ 10-1 đến 10-5 nhóm central không bao gồm tất cả các phân đoạn dọc, bởi vì h−ớng không chính xác. Từ đó nhóm cực đại bao gồm phân đoạn dọc không bao gồm tất cả các đối t−ợng centra. Điều có nghĩa một mình h−ớng không ảnh h−ởng tới tách nhóm - 45 - này. Nó cho phép tách nhóm tốt, nh−ng vị trí của chúng không đủ kết cấu để tạo thành kết cấu rõ ràng. Hình 2.7: Nhóm với mối quan hệ tới h−ớng. Xem xét khi đề cập tới hai đặc tr−ng (D =2; #R = 2500) trong không gian (sắp xếp, h−ớng). Hai cluster có ý nghĩa cực đại đ−ợc tìm thấy nh− mong đợi nhóm có ý nghĩa nhất là nhóm G, 11 phân đoạn dọc. NFAg của nó là 10-1,5 nó không thấp. Nhóm thứ 2 là chính xác nh−ng ý nghĩa NFAg =0,3 là rất khó khăn. Chúng khó t−ơng xứng NFAg = 0,3 trong không gian [ y...] sắp xếp va vị trí nhóm trung tâm G đ−ợc chia thành 2 cluster có ý nghĩa cực đại. Chúng t−ơng ứng với 2 hàng của phân đoạn sắp xếp G vai trò của tiêu chuẩn hỗn hợp là quyết định ở đây. Trong không gian (y - coordinate, h−ớng) sự kết hợp tiêu chuẩn cực đại và tiêu chuẩn hỗn hợp, điều đó có ý nghĩa hơn để mô tả tại cùng một thời điểm 2 hàng của 1 phân đoạn hơn ở trong một nhóm. Đây là trực quan, từ đó chúng ta thực sự thấy 2 hàng của các phân đoạn tại đây. Trái lại không gian (trong sự sắp xếp x, h−ớng) k tiêu chuẩn hỗn hợp chỉ ra mô tả G có ý nghĩa hơn mô tả hỗn hợp các lớp con của nó trong dendrogram. Quyết định này vẫn còn thích nghi với mô tả. Không một nhóm thực tế nào với G có thể là đặc biệt với chú ý tới sắp xếp x. Nhóm t−ơng tự - 46 - đ−ợc mô tả trong không gian (x coordinate, y, h−ớng) với mức thấp hơn NFAg =10-34. Hình 2.8: nhóm trong không gian(toạ độ x, h−ớng) Trong hình 2.8, có 2 nhóm có ý nghĩa lớn nhất thời gian này nhóm trung tâm đ−ợc tách (NFAg = 10-1,5) nh−ng có một nhóm khác (nhóm một phần nhóm thứ 7 trong hình 2.7). Tuy nhiên NFAg của nó = 0,3 có nghĩa nó là khó có ý nghĩa. Nếu nhóm đ−ợc thực hiện với mối quan hệ lắp đầy vị trí 2 chiều và h−ớng, chỉ nhóm trung tâm đ−ợc tách NFAg = 10-3,4. 2.3. Kết cấu nhóm không gian t−ơng ứng 2.3.1. Tại sao phải tách kết cấu không gian. Hình 2.9, có thể nhận dạng rõ ràng ở vùng trái phía d−ới của ảnh một bức tranh chi tiết của Picasso. Tuy nhiên, bức tranh đã không hoàn thành và phía d−ới ảnh bị che lại. Nó cũng bị biến dạng bởi điểm nhìn xa. Tuy nhiên, tốc độ nén là khác nhau. Nhận dạng hình dạng đ−ợc mô tả từ các điểm nhìn khác nhau và yêu cầu ngăn chặn cảm nhận trực quan. Bộ mô tả hình dạng đủ rõ ràng, cục bộ hoặc bán cục bộ. Mô tả hình dạng gọi là nhân tố hình dạng trong phần tiếp theo. Tính toán thí dụ của một truy vấn hình dạng đ−ợc biểu diễn trong một cảnh, ph−ơng pháp để nhận dạng nhân tố hình dạng t−ơng tự là có thể. Nó sẽ sẵn sàng cung cấp một vài cặp chính xác, những cung cấp sai, từ nhân tố hình dạng chỉ cung cấp thông tin cục bộ, hai đối t−ợng khác có những phần t−ơng tự có thể biểu diễn một - 47 - vài nhân tố hình dạng t−ơng ứng. Vì vậy nhận dạng yêu cầu tìm ra tập phù hợp các cặp, một tập các cặp trong hình dạng tự nhiên. 2.3.2. Đối sánh nhân tố hình dạng Lợi ích của việc hoàn thành, khái quát từng b−ớc chính của trích chọn đặc tr−ng hình dạng và thuật toán thích hợp đ−ợc mô tả và mô tả thủ tục nhóm. Mô tả đầu tiên là đ−ờng viền của đối t−ợng ở mức xám của ảnh rất hợp nhau, cuối cùng với đoạn các mức đ−ờng (hoặc) đoạn cover không phải luôn đúng: thực vậy, mức đ−ờng cung cấp một biểu diễn hoàn chỉnh của mức xám ảnh và chúng có nhiều mức trong kết cấu. Vì vậy b−ớc đầu tiên là lựa chọn một tập nhỏ trong tất cả các mức đ−ờng của ảnh. Ph−ơng pháp contrario đ−ợc giới thiệu và lựa chọn mức đ−ờng gọi là đ−ờng viền có ý nghĩa. Nó chấp nhập lựa chọn khoảng 1% mức đ−ờng của một bức ảnh không mất nội dung hình dạng. Mức đ−ờng này uốn cong và gặp đ−ờng viền ảnh ở điểm cuối cùng. Nhận dạng hình dạng là công cụ mạnh, vì thế đ−ờng viền có ý nghĩa phải chia cắt trong đoạn nhỏ hơn gọi là nhân tố hình dạng. Các hình dạng không đổi phải yêu cầu mã hóa nhân tố hình dạng không đổi; ph−ơng pháp mã hóa mối quan hệ không đổi đ−ợc giới thiệu. Chú ý trong một vài tr−ờng hợp, ph−ơng pháp không đổi t−ơng đ−ơng có thể đủ chính xác, phụ thuộc mức đ−ờng có ý nghĩa, các khung không đổi trong mối quan hệ cục bộ đ−ợc tính toán trực tiếp dựa trên mối quan hệ không đổi. Mỗi khung cục bộ định nghĩa một hệ thống tọa độ. Tọa độ của các điểm của một cung trong hệ thống, tọa độ này có thể không đổi. Hai đ−ờng cong có độ cong khác nhau trong một biến đổi quan hệ đ−ợc định nghĩa là hai khung cục bộ khác nhau. Tuy nhiên khi mô tả trong mối quan hệ của hệ thống tọa độ, chúng phải thiết lập cùng một vị trí. Từ đó chúng định nghĩa một đoạn cong thông th−ờng gọi là một nhân tố hình dạng có quan hệ không đổi. Một đ−ờng viền có ý nghĩa th−ờng chứa trong một vài nhân tố hình dạng lấy từ hai ảnh và hai tập nhân tố hình dạng, làm thế nào tìm thấy nhân tố hình dạng chung. - 48 - Từ nhân tố hình dạng đ−ợc chuẩn hoá thực hiện nhận dạng mối quan hệ tự nhiên bất biến. Một mô tả contrario đ−ợc giới thiệu để t−ơng ứng với nhân tố hình dạng. Một số l−ợng các cảnh báo sai của sự t−ơng đồng đ−ợc định nghĩa và t−ơng ứng với số các cảnh báo đ−ợc giữ lại. Đặt I và I’ là hai ảnh, tham khảo từ ảnh mục tiêu và cảnh. Mỗi cái t−ơng ứng giữa một nhân tố hình dạng S trong I và một nhân tố hình dạng S’ trong I’, biến đổi hình dạng( biến đổi mối quan hệ hoặc sự t−ơng đồng ) đ−ợc tính toán chấp nhận các tham số chứa trong nó nh− thế nào đ−ợc mô tả theo cách −ớc l−ợng đúng và cung cấp hình dạng t−ơng ứng với một hình dạng có thể thích hợp mối quan hệ tốt nhất. Phần này: cung cấp nhân tố hình dạng t−ơng ứng hình dạng đơn đ−ợc nhóm cùng nhau. Nhóm NFA của chúng nhỏ nên việc tách đáng tin cậy. Hình 2.9: Thử nghiệm Guernica Trong hình 2.9, thử nghiệm “ Guernica “. ảnh gốc và mức đ−ờng có ý nghĩa cực đại [5]. Tất cả các mức nhân tố hình dạng không đổi đ−ợc mã hóa và chuẩn hoá dựa trên sự phần đậm. Phía trên : ảnh mục tiêu; phía d−ới : ảnh và cảnh . - 49 - Hình 2.10: thử nghiệm “ Guernica “ quan hệ t−ơng ứng ý nghĩa không đổi Trong hình 2.10, thử nghiệm “ Guernica “ quan hệ t−ơng ứng ý nghĩa không đổi. Hình này cho thấy biểu diễn nhân tố hình dạng chung cho hai bức ảnh từ sự hạn chế tạo ra mối quan hệ bị bóp méo nhiều nhân tố hình dạng đ−ợc chuẩn hóa đ−ờng cong khá giống nhau. Một biến đổi quan hệ xác định t−ơng ứng với sự thích ứng giữa các nhân tố hình dạng. 2.3.3. Biến đổi mô tả 2.3.3.1. Tr−ờng hợp t−ơng đồng Đặt S và S’ là hai nhân tố hình dạng t−ơng đồng. Độ chính xác đó là một nhân tố hình dạng của một đoạn mức đ−ờng đ−ợc chuẩn hoá hóa đã đ−ợc mô tả trong frame cục bộ ( hình 2.11). Một khung không đổi t−ơng đ−ơng hoàn toàn đ−ợc xác định bởi hai điểm hoặc một điểm và một vectơ. Biểu diễn này đ−ợc chọn lựa. Một khung cục bộ mang lại bằng một cặp ( p, v ) p là khung gốc v là h−ớng và độ chia. Để tính S liên quan tới ( p, v ) và S’ liên quan ( p’, v’) từ S và S’ t−ơng ứng, chú ý các b−ớc biến đổi sự t−ơng đồng, bây giờ biểu đồ t−ơng đồng - 50 - khung cục bộ (p,v) trên (p’,v’) bằng việc hoàn thành các chú ý. Sự t−ơng đồng đ−ợc tính toán : Trong hình 2.11, hai đoạn của một mức đ−ờng và khung t−ơng tự của chúng. Biểu đồ T t−ơng đ−ơng từ R1 → R1’; R2→R2’. Tính toán khung cục bộ (R1 R2) có thể biểu diễn theo: Hình 2.11: Hai đoạn mức đ−ờng và khung t−ơng ứng 2.3.3.2. Tr−ờng hợp biến đổi mối quan hệ Đề cập tới tr−ờng hợp bình th−ờng mối quan hệ không đổi. Các đỉêm không thẳng hàng cần thiết để định nghĩa khung cục bộ. Mối quan hệ thông th−ờng của một đoạn cung đ−ợc thực hiện bằng bản đồ ba điểm ở đây (R1, R2, R3) trên bộ ba ((0,0), (0,1), (1,0)). Một bộ ba khác (R1’, R2’, R3’); đ−ợc chú ý lại bởi T. Tồn tại một ma trận M (2 x 2) và duy nhất (tx, ty) ∈R2: - 51 - Tính toán Sự phân tích này là duy nhất và hoàn toàn xác định (θ, ϕ, Sx, Sy) trong [(0,2π) ì Rì R+ ì R+]. Chú ý quan hệ ( xR1, xR2 ) và cặp ( xR1’ ,xR2’ ) của tọa độ R1 và R1’. Biến đổi tham số T = (θ, ϕ, Sx, Sy, tx, ty) đ−ợc xác định bằng tính toán đại số. Đặc tính vectơ T biến đổi thành T không mập mờ, có thể chọn một chủ tâm t−ơng tự hoặc biến đổi mối quan hệ thêm vào đó từ T đặc tr−ng T, cả hai có thể đ−ợc nhận dạng. Vì vậy viết lại X ∈ R2, T(x) thay thế T(x). Trong hình 2.12 : chỉ ra biến đổi 2-D điểm, Tk t−ơng ứng với quan hệ “ Guernica “ ý nghĩa không đổi ở hình 2.13. Hình 2.12 : thử nghiệm “ Guernica “. Mỗi biểu diễn một mối quan hệ biến đổi với một đối sánh mối quan hệ ý nghĩa không đổi mô tả bằng sáu tham số. Mỗi hình biểu diễn hai chiều cho các điểm, mối quan hệ tx và ty ( tọa độ), Biến đổi : θ (góc quay), ϕ (shear), ln(Sx) và ln(Sy) ( zoom vào x và y) trực tiếp (tọa độ). Nhiễu là do nhân tố hình dạng tổng quan đó rất giống với biến đổi mối quan hệ và nó không phụ thuộc một hình dạng thực tế. Cluster phần chính cũng đ−ợc mở rộng bởi ảnh h−ởng của việc nhìn xa. Hình 2.12: thử nghiệm “ Guernica “ - 52 - 2.3.4. Cluster có ý nghĩa của biến đổi Vấn đề của tách hình dạng đ−ợc giảm bớt vấn đề clustering trong không gian biến đổi. Nó là cần thiết để định nghĩa. 1. Một phép đo sự không t−ơng đ−ơng giữa các điểm trong không gian biến đổi. 2. Một xác suất trên không gian biến đổi. 3. Chiến l−ợc nhóm. 2.3.4.1. Phép đo sự không t−ơng đ−ơng giữa các biến đổi. Định nghĩa khoảng cách giữa các biến đổi là không đáng kể. Bởi hai lý do, đầu tiên : biên độ lớn của các tham số trong biến đổi không so sánh trực tiếp.. Thứ hai : biểu diễn về mối quan hệ t−ơng đồng hoặc biến đổi mối liên hệ không đổi không tốt nh− trong không gian vector. Nh− vậy khoảng cách là không cần thiết. Định nghĩa 2.4.1 ( tr−ờng hợp t−ơng đồng) đặt (P1, Q1) biểu diễn (P1’, Q1’) là điểm xác định khung cục bộ của S1 trong ảnh I (S1’ trong I’). Đặt T1 là t−ơng đồng duy nhất xác đinh bởi (P1, Q1) và (P1’, Q1’). Trong cách t−ơng tự T2 là t−ơng đồng xác định từ một sự t−ơng ứng giữa các hình dạng thành phần với khung (P2, Q2) và (P2’, Q2’) trong I và I’. Gọi phép đo không t−ơng đ−ơng giữa T1 và T2.Với sự hoàn thành định nghĩa một sự t−ơng đ−ơng giữa các biến đổi quan hệ. Định nghĩa 2.4.2 ( tr−ờng hợp quan hệ) : đặt T1 ( biểu diễn T2) là một biến đổi quan hệ xác định bởi hai thành phần hình dạng (S1, S1’) biểu diễn (S2, S2’). Dạng t−ơng đ−ơng từ I tới I’. Đặt (P1, Q1, R1) và (P1’, Q1’, R1’) biểu diễn (P2, Q2, R2) và (P2, Q2, R2’) xác định khung cục bộ của S1 và S1’ ( t−ơng tự S2 và S2’) đặt 2.3.4.2 Ph−ơng thức nền - 53 - Để ứng dụng tách khung, đầu tiên cần một luật cơ sở. Một dữ liệu điểm ở đây là một biến đổi t−ơng đ−ơng đ−ợc biểu diễn bởi một cặp các số (a, b) ∈ C2. Mục đích của phần này là ph−ơng pháp trên luật cơ sở, luật Π trên tập biến đổi t−ơng ứng. Với mục đích này, (a, b) đ−ợc xác định bởi hai khung cục bộ trong ảnh đ−ợc t−ơng ứng, mối quan hệ (p, v) và (p’, v’). Tính toán các mô tả này thực tế của không gian biến (p, v, p’, v’) ∈ C4. Nó tự nhiên tính toán vị trí, kích th−ớc và h−ớng của một đối t−ợng là độc lập. Đây là phần chính; ảnh h−ởng tới một vài đ−ờng viền. Thêm vào đó : hai ảnh không bao gồm các hình dạng chung cũng đ−ợc tính toán độc lập cho ph−ơng pháp nền. (A’) Đề cập một ph−ơng thức không gian ảnh I và cảnh I’. Từ không gian biến p, |v| arg v, p’, |v’| arg v’, liên hệ t−ơng ứng với nhau; giữa hai ảnh hoàn toàn độc lập. Luật giới hạn của 6 không gian biến tr−ớc đó có thể dễ dàng đ−ợc học từ hai ảnh. Từ đó luật của (P,V,P’,V’) đ−ợc tính toán. Định nghĩa không gian đối t−ợng t−ơng đồng đ−ợc chứng minh bởi (A, B), ở đây A biểu diễn góc quay và độ phóng đại, B là phép biến đổi. Luật cơ sở π không là gì nh−ng phân bố của (A, B). Biểu thức của (A, B) nh− một hàm (p, v, p’, v’) đ−ợc biểu diễn Luật cơ sở π là ảnh của luật (p, v, p’, v’) bởi ứng dụng này. Nó cũng chỉ rõ A và B không độc lập. Định nghĩa luật có điều kiện: π A là độ lớn của A và π B(b / A = a) là luật của B biết A = a. Từ |A| = |v’|/|v| và arg A = (arg v’ – arg v) mod 2π, hai biến này độc lập d−ới biểu thức A’. Vì vậy phân bố π A có thể dễ dàng đ−ợc tính toán. Tuy nhiên nó tạo ra A độc lập từ p và p’. - 54 - Từ đó luật của B = p’- Ap, điều kiện để A = a là luật của p’-ap, có thể dễ dàng tính toán. Thực tế tính toán của π giữa hai ảnh nh− sau : 1. Tính toán tất cả các hình dạng thành phần của ph−ơng thức và ảnh mục tiêu. 2. Tính toán kinh nghiệm luật của p, v, p’, v’ từ vị trí; độ chia và h−ớng của frame cục bộ liên quan tới thành phần hình dạng trong hai ảnh của biểu thức cơ sở (p, v, p’, v’) 3. D−ới biểu thức t−ơng tự, tính toán luật theo lối kinh nghiệm |A| = || |'| v v và arg A = (arg v’ – arg v) mod 2π 4. Với mỗi giá trị A của A với không tham số NULL, tính toán phân bố theo lối kinh nghiệm p’- Ap. Xác xuất của vùng R xấp xỉ : Một vài từ về −ớc l−ợng gần đúng của ph−ơng pháp nền: một sẽ là mong arg A phân bố đều trong [-π,π], mặc dù phân bố theo chiều dọc hoặc ngang đôi khi tập trung hơn. Phân bố của phần chính |A| đ−ợc thay thế từ một các đồng dạng, lý luận một xác suất phân bố thực tế tr−ớc cho |A| hoặc B lấy từ A. Phân bố ph−ơng pháp nền phải đ−ợc học từ cảnh và ảnh mục tiêu. Chú ý : ý t−ởng giới thiệu ở đây cũng giữ cho cluster biến đổi mối quan hệ. Cho tr−ờng hợp này θ, ϕ, Sx, Sy đ−ợc đề cập tới là độc lập với nhau. Phân bố của chúng có thể đ−ợc học từ kinh nghiệm nh− xác suất phân bố của (tx, ty) từ (θ, ϕ, Sx, Sy). Cấu trúc này, đáp ứng kinh nghiệm mặc dù không có lý thuyết nào chứng minh trực tiếp. 2.3.4.3. Kỹ thuật nhóm - 55 - Có một vài ph−ơng thức xây dựng một cây nhị phân từ tập dữ liệu và phép đo không t−ơng đồng. Trong phần này : Cây chiều dài cực tiểu đ−ợc sử dụng. Cấu trúc của nó đ−ợc sử dụng một thuật toán kết nối đơn làm việc nh− sau. Độ không t−ơng đồng nào giữa hai điểm dữ liệu đ−ợc mở rộng tới bất kỳ cặp nào cảu tập tách rời tập dữ liệu điểm A và B bằng : Một cây nhị phân đ−ợc cấu trúc bởi thủ tục lặp : mỗi dữ liệu điểm đ−ợc coi nh− là nút lá. Sau đó kết hợp cặp gần nhất của nút thành nút đơn. Lặp lại cho đến khi mọi nút đ−ợc tích hợp trong tập dữ liệu. Bằng việc thay thế min bởi max về phép tính trên, một cây chiều dài cực đại đ−ợc mô tả thay thế. Lựa chọn một cây hoặc cây còn lại có thể đ−ợc áp dụng nh−ng không có cách nào tổng quan hơn. 2.4. Thảo luận Phần này giới thiệu tổng quan việc tách và lựa chọn nhóm trong tập dữ liệu điểm. Nhóm có ý nghĩa không thể sinh ra bởi sự ngẫu nhiên. Chúng có thể đ−ợc địng nghĩa nh− độ lệch lớn từ một giả thiết độc lập của các điểm hàm chứa chúng. Điều này cho phép định nghĩa một phép đo của sự có ý nghĩa, số các cảnh báo sai( NFA). Trong tất cả các nhóm có ý nghĩa chỉ những nhóm không thể chia thành nhóm nhỏ hơn là thích hợp. Ph−ơng pháp t−ơng tự có thể dẫn tới việc lựa chọn các nhóm có ý nghĩa cực đại này. Ph−ơng pháp này phụ thuộc vào các b−ớc cluster mà cluster lại phụ thuộc rất nhiều vào ng−ời sử dụng và tính toán NFAg phải thích nghi với các nhóm phát sinh. Ph−ơng thức sử dụng để tìm ra đặc tính thực sự liên quan tới dạng nhóm trực quan trong tập đối t−ợng. Làm thế nào để lựa chọn đặc tính để mô tả nhóm có ý nghĩa và ở đây thủ tục cluster đ−ợc đề cập là phép phân tích vận động trực quanvà giới thiệu tách trong không gian thời gian t−ơng ứng. - 56 - Ch−ơng 3 Ph−ơng pháp ra quyết định Contrario Nhận dạng hình dạng là nhận biết ra hình dạng dựa trên các kiến thức biết tr−ớc, cụ thể ở đây là tìm ra có hay không hình dạng truy vấn trong CSDL hình dạng. Phần lớn các ph−ơng pháp nhận dạng dựa trên phép đo t−ơng đồng hoặc không t−ơng đồng. Quyết định cuối cùng trả lời rõ ràng có hay không hai hình dạng giống nhau. Phần này đ−a ra giải pháp nhận dạng chủ yếu dựa vào giới hạn số cảnh báo sai(NFA) của truy vấn hình dạng trong số hình dạng trong CSDL. Ph−ơng pháp ra quyết định với ít tham số hơn để quyết định có hay không hai ảnh bất kỳ chia sẻ một số hình dạng. Biểu diễn hình dạng đ−ợc đề cập với nguyên tắc là sự nhận biết. Xác định t−ơng ứng giữa các nhân tố hình dạng không chỉ là định nghĩa một khái niệm sự t−ơng đồng giữa chúng, nh−ng cũng có thể quyết định có hay không 2 thành phần hình dạng là một cặp. Phần này giới thiệu luật ra quyết định tự động, áp dụng ph−ơng pháp này để đối sánh hình dạng và mở rộng phạm vi của ph−ơng pháp so với lý thuyết. Đặc biệt, ý nghĩa luật tự động ra quyết định với đối sánh hình dạng trong một CSDL mà có thể dựa vào khoảng cách giữa các hình dạng. Từ hai hình dạng và một khoảng cách δ rất nhỏ giữa chúng có hai khả năng: 1- Cả hai hình dạng ở cùng một khoảng cách khi đối sánh 2- CSDL hình dạng đ−ợc trích chọn quá lớn, phải thay đổi một trong số những hình dạng này kết thúc S (Giữa chúng không có đối t−ợng giống nhau) - 57 - Giả thiết, mỗi δ có thể −ớc l−ợng, xác suất xảy ra khả năng thứ hai. Nếu số l−ợng này xảy ra rất nhỏ đối với hai hình dạng thì khả năng thứ nhất đ−ợc giải thích tốt hơn. Ph−ơng pháp này gọi là quyết định Contrario. Trong hệ thống quan sát tính toán, sự thử đầu tiên để có khả năng tách trong một ảnh Contrario tới một không gian tuần tự từ phân tích trực quan của David Lowe. Các đối t−ợng tìm kiếm đ−ợc mã hóa bằng h−ớng biên và so sánh bằng cách sử dụng một quan hệ khoảng cách Hausdory. Đ−a ra −ớc l−ợng xác xuất xuất hiện cảnh báo sai của bản thân ảnh; sử dụng xác suất này để ra một quyết định. Một ph−ơng pháp sử dụng −ớc l−ợng để thiết lập ng−ỡng đối sánh mỗi một xác suất của một cảnh báo sai d−ới mức của một vài xác suất xác định tr−ớc. Tuy nhiên, vấn đề trong khi Cluster ảnh đúng hay sai có thể có nguyên nhân từ ng−ỡng đã thiết lập. Grimson và Hutten giới thiệu ng−ỡng cố định trên tỷ lệ của các ph−ơng thức đặc tr−ng : “ Biên trong số đặc tr−ng của ảnh ( đề cập tới biến đổi không gian ) dựa trên việc tách chính xác. Chấp nhận phần lớn các đặc tr−ng phân bố đồng đều( ph−ơng pháp nền ), để hạn chế tính ngẫu nhiên thuật ngữ nàyphải định nghĩa. Ph−ơng pháp tính toán dựa vào một số giả thiết hạn chế( ph−ơng pháp hình dạng có sẵn; các đặc tr−ng phân bố đồng đều). Những giới hạn này là khó khăn cho từng tr−ờng hợp thực tế. Ví dụ trong ảnh y tế của não bộ, các điểm không phân bố đều trên ảnh nh−ng không quá ngẫu nhiên trên bề mặt vỏ não và sọ não. Mở rộng sẽ tính toán xác suất sai xác thực trực tuyến trong khi nhận dạng. Việc này cho phép chúng ta thống kê lại xác xuất phân bố đặc biệt của ph−ơng thức và đặc tr−ng cảnh. Đây là mục tiêu hoàn toàn chính xác. Ph−ơng pháp xác suất đáng tin cậy cho vấn đề hình dạng t−ơng ứng và đ−a ra một ph−ơng pháp để tính toán tự động mức ng−ỡng đối sánh đúng. Thay vì định nghĩa khoảng cách ng−ỡng cho mỗi truy vấn hình dạng, định nghĩa số cảnh báo sai NFA, có thể là ng−ỡng độc lập với truy vấn hình dạng. NFA có thể đ−ợc - 58 - giải thích nh− một số mong muốn các hình dạng ngẫu nhiên tại một vài khoảng cách từ một truy vấn hình dạng, thậm chí ng−ỡng NFA dẫn tới ng−ỡng đối sánh khoảng cách, chỉ ra khi thêm một thông tin vào đối sánh sự t−ơng đồng ta sẽ có đối sánh đúng đến mức nào. Đối sánh sẽ khắc phục vấn đề tổng quát của quyết định có hay không hai nhân tố hình dạng đ−ợc biểu diễn bởi một mã quan hệ không có sự giống nhau bất biến. Phần này giới thiệu khái niệm đối sánh có ý nghĩa, nó có thể sắp xếp các đối sánh với một nhân tố hình dạng chuẩn hoá với một ý nghĩa chính xác và thuận tiện: số các cảnh báo sai( NFA). Tuy nhiên, ng−ợc lại với phần lớn ph−ơng pháp đang có, không chỉ NFA mà ta có thể sắp xếp thứ tự các đối sánh từ thấp đến cao, nh−ng ng−ỡng tách thích hợp với truy vấn hình dạng và cơ sở dữ liệu cùng thu đ−ợc từ đ−ờng viền đồng dạng dựa trên NFA. Ph−ơng pháp quyết định trích chọn đ−ờng viền đ−ợc giới thiệu dựa trên việc chuẩn hoá cung tròn, nhân tố hình dạng đ−ợc trích chọn từ ảnh, rồi tính toán đối sánh và sau đó ra quyết định. 3.1. Một quyết định Contrario ở đây fix cứng mức ng−ỡng để chấp nhận hay loại bỏ ng−ỡng nhận dạng nhân tố hình dạng, tiến tới một phân lớp cố định. Mỗi nhân tố hình dạng đ−ợc mô tả bởi một mã( một danh sách các đặc tr−ng bất biến của một vài không gian đặc tr−ng). Nhận dạng là vấn đề khó: từ cách lựa chọn nhân tố hình dạng theo một phép đo t−ơng đ−ơng, một truy vấn nhân tố hình dạng phải trả lời câu hỏi “ có hay không có nhân tố hình dạng giống nh− nhân tố hình dạng truy vấn, trong tr−ờng hợp đó, cốt yếu ở tự động thiết lập ng−ỡng δ trên phép đo t−ơng đ−ơng và đem lại một mức thích hợp để ra quyết định. Đây là mục tiêu của ph−ơng pháp này. Xây dụng một ph−ơng pháp thống kê của CSDL nhân tố hình dạng và các đối sánh quan hệ đ−ợc tách Contrario. 3.1.1. Ph−ơng pháp hình dạng trái ng−ợc ph−ơng pháp nền - 59 - Đầu tiên phải định nghĩa chính xác biểu diễn nhân tố hình dạng và một vài khái niệm khác. Mục tiêu của ph−ơng pháp là so sánh truy vấn nhân tố hình dạng S với nhân tố hình dạng N của CSDL B. Giả thiết mỗi nhân tố hình dạng S đ−ợc biểu diễn bởi tập K đặc tr−ng X1(S), X2(S), …. , Xk(S) ; mỗi nhân tố hình dạng đều thuộc một không gian đo ( Ei , di ) i ∈ {1, … , k }. Định nghĩa khoảng cách giữa các nhân tố hình dạng nh− khoảng cách : E1 x E2 x … x Ek d( S , S’ ) = max di( xi(S), xi(S’) ) i = {1 … k} Một CSDL hình dạng S đ−ợc quan sát hoặc khoảng cách d(S,S’) chính xác hơn giữa hai truy vấn đ−ợc quan sát. Vấn đề là khoảng cách d(S,S’) có đủ nhỏ để ra quyết định cặp S,S’ tạo thành cảnh hay khoảng cách d(S,S’) quá lớn nên chúng không thể tạo thành bất cứ cảnh nào. Định nghĩa 3.1 : gọi ph−ơng pháp nền, bất kỳ ph−ơng pháp ngẫu nhiên (Ω, A, Pr ), mỗi tham số phụ thuộc công thức sau : đ−ợc tính toán độc lập, chú ý bởi Pi( S, δ ), Tỉ số theo kinh nghiệm: ở đây, # tập hữu hạn và N là các nhân tố hình dạngthuộc CSDL B, nh− một sự −ớc l−ợng của Pi( S, δ ) cho mỗi giá trịδ .Sử dụng trong thực tế Pi( S, δ ) = N 1 , # { S’∈B, di( xi(S), xi(S’) ) ≤ 0} 3.1.2. Ph−ơng thức quyết định Contrario Hàm khoảng cách giữa các nhân tố hình dạng, quyết định có hay không một đối sánh nhân tố hình dạng này với nhân tố hình dạng khác dựa vào tập mức - 60 - ng−ỡng khoảng cách δ . δ đ−ợc thiết lập tự động. Tìm cách thay thế giới hạn khoảng cách bằng giới hạn xác suất của cách báo sai. Một hình dạng S’ đ−ợc quan sát, lý thuyết: H0: “ S’ đ−ợc sinh ra từ ph−ơng thức của S “. Tuy nhiên, vận dụng lý thuyết này với sự thừa nhận( không một ph−ơng thức hình dạng nào có sẵn cho S ) là dễ dàng. Vì vậy dẫn tới tập trung thay đổi lý thuyết xen kẽ H1 :“ S’ đ−ợc phát sinh từ ph−ơng thức nền ”. Cho mỗi δ ; “tập nhân tố hình dạng đ−ợc chia thành hai tập con Ω0(δ), Ω1(δ)”, quan hệ từ nhân tố hình dạng với khoảng cách của chúng tới S thấp hơn δ thì lý thuyết H0 đ−ợc chấp nhận và khoảng cách S >δ (H0 bị từ chối). Định nghĩa 3.2: truy vấn nhân tố hình dạng S đ−a tới tập thử Tδ(S) đ−ợc định nghĩa nh− sau: - Nếu 1 tập CSDL nhân tố hình dạng S’ có d(S,S’)< δ thì lý thuyết H0 đ−ợc chấp nhận (S’ gần với S bởi 1 vài quan hệ) tr−ờng hợp này S’ đ−ợc phân lớp vào Ω0(δ) - Còn lại H0 bị loại trừ và thay đổi lý thuyết H1 đ−ợc chấp nhận(S’ gần S). Tr−ờng hợp này S’ đ−ợc phân lớp vào lớp Ω1(δ) Đặc tính của các phép thử thống kê là phép đo bởi xác suất quyết định sai, có thể có 2 loại lỗi, lỗi thứ nhất: loại bỏ H0 cho một quan sát S, H0 lại là có thực (dạng lỗi tách sai) và loại lỗi thứ hai: chấp nhận H0 cho S mặc dù H0 là sai (lỗi sai vị trí),vậy phép đo xác suất lỗi xác địng nh− sau: - Xác suất không tách hoặc 1 lỗi(liên quan loại lỗi 1) là: - Xác suất cảnh báo sai( liên quan loại lỗi 2) , là gần đúng lớn nhất của H0 t−ơng ứng H1 trên Ω. Rõ ràng là thấp hơn α và α’, phép thử tốt hơn α và α’ không thể đánh giá độc lập. Vấn đề để tìm ra sự thoả hiệp giữa 2 xác suất này. Mở rộng sử dụng kỹ thuật cho việc tìm tỷ lệ phép thử gần đúng nhất và phép thử Bayes. Tuy nhiên, lý thuyết là có giới - 61 - hạn. Việc gần đúng của lý thuyết H0 và H1 là khó thực hiện nếu mục tiêu nhận dạng là 1 truy vấn hình dạng xác định rõ( ph−ơng pháp chung thực sự cần thiết truy vấn hình dạng S để tính toán gần đúng 1 hình dạng S’ d−ới lý thuyết H0). Tuy nhiên, lý thuyết này cần các thông tin biết tr−ớc, còn các thông tin khác có thể bổ xung sau. 3.1.3. Ước l−ợng xác suất cảnh báo sai Tóm lại không thể tính toán xác suất của việc không tách Pr(Ω1(δ)/H0). Tính toán cung cấp giá trị xác suất cảnh báo sai của phép thử thống kê Tδ(S) chú ý PFA(S, δ)= Pr(Ω1(δ)/H1) từ S’∈ Ω0(δ) nếu d(S,S’) ≤δ nó phụ thuộc công thức sau: Định nghĩa: vì vậy: Tính toán lại ta có: Proposition 3.1: Xác suất cảnh báo sai cho phép thử thống kê Tδ(S) là : Đặt lại, theo kinh nghiệm sẽ sử dụng −ớc l−ợng cho Pi(S, δ) với i∈{1, k} 3.1.4. Luật ra quyết định Contrario B−ớc tiếp theo, để giới hạn PFA, xác suất cảnh báo sai PFA(S, δ) không suy giảm với δ, muốn giảm giới hạn của xác suất cảnh báo sai PFA phải bằng cách gia tăng khoảng cách δ* : - 62 - Do vậy nếu phép thử chấp nhận lý thuyết H0, nếu khoảng cách quan sát nhỏ hơn δ*(p) và để loại trừ lý thuyết bằng nhau, kết hợp xác suất cảnh báo sai đ−ợc giới hạn bởi p, luật này gọi là quyết định Contrario. PFA kết hợp với phép thử thống kê rất thấp vì vậy thay đổi nó là không hợp lý. ứng dụng cho nhận dạng hình dạng, chấp nhận lý thuyết 1 tập nhân tố hình dạng S’ t−ơng ứng với truy vấn hình dạng đối sánh S coi nh− S’ gần S. Chú ý, đối sánh nhân tố hình dạng giống nhau nh−ng không hẳn t−ơng ứng với các đối t−ợng nh− nhau. 3.2. Tự động thiết lập ng−ỡng khoảng cách 3.2.1. Số các cảnh báo sai NFA Quyết định contrario đ−ợc giới thiệu cốt yếu là cố định mức ng−ỡng của xác suất cảnh báo sai hơn là khoảng cách giữa các nhân tố hình dạng. Từ một xác suất ít ý nghĩa, giới thiệu số cảnh báo sai cùng độ chính xác đó, trong đó truy vấn nhân tố hình dạng đ−ợc so sánh với nhân tố hình dạng từ một tập CSDL kích th−ớc N. Định nghĩa 3.3 : số các cảnh báo sai của nhân tố hình dạng S tại khoảng cách d là : Từ kết quả cuối cùng của xác suất là xác suất cảnh báo sai khi thực hiện phép thử, nếu CSDL nhân tố hình dạng tại một khoảng cách( thấp hơn d) số các cảnh báo sai có thể thấy nh− trị trung bình số cảnh báo sai đ−ợc mong đợi khi thử, quyết định có hay không khoảng cách từ mỗi nhân tố hình dạng trong CSDL S là nhỏ hơn d. Chú ý: từ mỗi Pi là −ớc l−ợng theo kinh nghiệm trên tập CSDL B ; (NFA phụ thuộc B ). - 63 - Định nghĩa 3.4: số cảnh báo sai của truy vấn nhân tố hình dạng S là số cảnh báo sai của S tại một khoảng cách d(S, S’ ). Số các cảnh báo sai giữa S và S’, t−ơng ứng sự mong đợi của CSDL hình dạng nó là các cảnh báo sai và khoảng cách của nó tới S thấp hơn d(S,S’ ). Chú ý: chú thích t−ơng tự đ−ợc sử dụng cho cả dự đoán định nghĩa số các cách báo sai, cùng chú ý argument của NFA cuối cùng. 3.2.2. Đối sánh có ý nghĩa Thay vì giới hạn trực tiếp xác suất cảnh báo sai để giảm ng−ỡng khoảng cách nh− đã giải thích, giới hạn số các cảnh báo sai NFA giải thích cho tần suất xuất hiện nh− mong đợi. Định nghĩa 3.5: Nhân tố hình dạng S’ là một đối sánh có ý nghĩa ε của truy vấn nhân tố hình dạng S nếu số các cảnh báo sai của chúng đ−ợc giới hạn bởi ε: NFA(S,S’)≤ ε Chú ý từ hàm, không suy giảm, hàm có thể đảo ng−ợc chú ý tới khoảng cách d. Tồn tại một số thực xác định duy nhất δ*(ε/N) cũng phụ thuộc vào truy vấn hình dạng S: Tiên đề 3.2: 1 nhân tố hình dạng S’ là đối sánh có ý nghĩa ε của truy vấn nhân tố hình dạng t−ơng đ−ơng: d(S,S’)≤ δ*(ε/N) Đối sánh có ý nghĩa ε của S là các nhân tố hình dạng cho khoảng cách δ* < (ε/N). Xác suất cảnh báo sai của các phép thử lần l−ợt nhỏ hơn ε/N. Mặc dù, trị trung bình cảnh báo sai nhỏ hơn ε trong số tất cả các đối sánh có ý nghĩa ε trên N nhân tố hình dạng đ−ợc thử. Ph−ơng thức này không thể −ớc l−ợng số đối sánh có - 64 - ý nghĩa ε. Tuy nhiên, nếu mọi nhân tố hình dạng trong tập CSDL đ−ợc xuất phát bởi ph−ơng pháp nền, lý thuyết H0 không bao giờ đ−ợc chấp nhận và tách có ý nghĩa ε vì vậy sẽ đ−ợc đề cập nh− cảnh báo sai. Proposition 3.3: giả thiết CSDL nhân tố hình dạng chỉ rõ phân bố theo ph−ơng pháp nền; dự báo của số các đối sánh có ý nghĩa ε < ε. Đặt S’j=(1≤j≤N) chú ý nhân tố hình dạng trong tập CSDLvà χj là hàm của thành phần ej ( S’j là đối sánh của truy vấn S (giá trị của nó là 1 nếu S’j thực sự là đối sánh có ý nghĩa ε của S và là 0 với các giá trị khác). Đặt ∑ = = N j jR 1 χ là không gian biểu diễn hình dạng có ý nghĩa ε t−ơng ứng với S. Dự đoán của R là ( ) ( )∑ = = N j jERE 1 χ sử dụng tiên đề 3.2: Từ các nhân tố hình dạng trong CSDL đ−ợc giả thiết thỏa mãn giả thiết ph−ơng pháp nền: Tính tuyến tính của dự đoán t−ơng đ−ơng biểu thức: Bằng định nghĩa δ* có ( ) ∑ = −≤ N j NRE 1 1.ε vì vậy ( ) ε≤RE Điểm mấu chốt này là tính tuyến tính của dự đoán cho phép tính toán E(R). Từ sự phụ thuộc giữa các thành phần ej không đ−ợc biết, ta có thể −ớc l−ợng luật phân bố xác suất của R. 3.2.3. Ng−ỡng nhận dạng t−ơng ứng với ngữ cảnh Chú ý rằng xác suất thử nghiệm đem vào tính toán sự ngẫu nhiên hoặc tính phổ thông của đối sánh có thể: ng−ỡng δ* là hạn chế hơn trong tr−ờng hợp đầu tiên và khắt khe hơn trong các tr−ờng hợp khác. Nếu truy vấn hình dạng S1 hơn - 65 - một truy vấn S2 khác; CSDL hàm chứa nhiều hình dạng kết thúc S2 hơn S1, nhỏ hơn khoảng cách cố định d’ nào đó. Nếu truy vấn hình dạng S1 hiếm hơn S2 ta có : i∈{1, k} vad d < d’: Hiệu suất này *1 * 2 ss δδ ≤ ( cung cấp cả hai số l−ợng nhỏ hơn d’). Càng hiếm các hình dạng tìm kiếm thì ng−ỡng nhận dạng càng cao. Phép tính toán khác của giới hạn t−ơng tự nh−: nếu đem lại một truy vấn hình dạng trong số các hình dạng của CSDL B1 hiếm hơn là CSDL dạng cao hơn B2. Có i∈{1, k} và d đủ nhỏ: ở đây 1iP , 2 iP là −ớc l−ợng riêng trên B1 và B2, ( ) ( )SS *1*2 δδ ≤ . Kết quả là ng−ỡng đ−ợc giới thiệu bởi thuật toán tự động thích nghi liên quan đến sự biến thiên của truy vấn hình dạng trong CSDL hình dạng. Càng hiếm truy vấn hình dạng thì ng−ỡng khoảng cách t−ơng ứng càng tùy ý hơn và ng−ợc lại. 3.2.4. Tại sao quyết định Contrario Tiến bộ của quyết định Contrario dựa trên NFA đ−ợc so sánh với tập các ng−ỡng khoảng cách trực tiếp giữa các nhân tố hình dạng một cách rõ ràng. Ng−ỡng NFA là khá thuận lợi so với ng−ỡng khoảng cách. Thực vậy, đơn giản đặt ε = 1 và cho phép tại phần lớn cảnh báo sai trong các đối sánh có ý nghĩa hoặc ε = 10-1 nếu ta muốn lạm dụng sự tin cậy cao hơn trong đối sánh thu đ−ợc. Ng−ỡng tách ε đ−ợc đặt t−ơng đ−ơng dù truy vấn hình dạng là nh− thế nào và CSDL có thể là kết quả khoảng cách thích nghi tự động phụ thuộc vào chúng theo giải thích ở trên. Nói cách khác, ε thấp hơn, chắc chắn tách có ý nghĩa hơn. Tuy nhiên tính toán NFA không cần thiết cho bất cứ ph−ơng pháp hình dạng nào. Nó là tiến bộ chính của ph−ơng pháp giới thiệu, có một ph−ơng pháp - 66 - hình dạng có nghĩa là truy vấn hình dạng để nhận ra tr−ớc khi dùng cách này hay cách khác. Kết thúc với định nghĩa số cảnh báo sai khi so sánh mọi hình dạng trong CSDL với mọi hình dạng khác trong CSDL và không chỉ nhân tố hình dạng trong một CSDL. Điều này t−ơng ứng với thử nghiệm ở mục sau. Hai nội dung hình dạng của hai ảnh đ−ợc đối sánh. Khi tìm kiếm hình dạng phụ thuộc CSDL B1 tạo ra hình dạng N1; trong số các nhân tố hình dạng N2 phụ thuộc CSDL B2. Định nghĩa 3.6: Số các cảnh báo sai của một hình dạng tại khoảng cách d: ( ) ( )( ) ( ) ( )( )dkiSxSxdSNNdSNFA iii ≤∈ìì= ,1,',max,Pr, '21 Xác suất (phụ thuộc vào hình dạng S đ−ợc tìm kiếm) đ−ợc −ớc l−ợng nh− tr−ớc, nh− kết quả của K −ớc l−ợng thử nghiệm trên tập B2 trong số các truy vấn hình dạng đ−ợc tìm cho mỗi hình dạng trong B1, định nghĩa đối sánh có ý nghĩa ε. Mục tiêu, trị trung bình các cảnh báo sai ε trong số đối sánh có ý nghĩa trên N1, N2 cặp đ−ợc thử không thay đổi. 3.3. Xây dựng đặc tr−ng độc lập thống kê Khá quan trọng khi đề cập đặc tr−ng độc lập (cf(A)). Khi sử dụng đặc tr−ng độc lập là một cách để giảm kích th−ớc của CSDL. Bằng sự kết hợp một vài đặc tr−ng độc lập, có thể dễ dàng tìm số cảch báo sai rất thấp mà không cần CSDL lớn để −ớc l−ợng xác suất cảnh báo sai PFA. D Lowe giới thiệu tổng quan cho nhận dạng trực quan” bởi giới hạn sự chính xác của phép đo ảnh( và xác suất cũng thiếu các đoạn quan hệ trong thế giới tự nhiên)” Mối quan hệ đơn giản đ−ợc mô tả th−ờng bị lỗi so với mức xác suất xuất hiện ngẫu nhiên rất thấp, mối quan hệ này phải đủ mạnh để nhận dạng. Tuy nhiên, những kết quả hữu ích có thể gia tăng nh− kết quả tìm kiếm hỗn hợp tạo thành các quan hệ hỗn hợp mới, nó phải có xác suất xuất hiện mới thấp hơn. Xem xét một ví dụ bằng số. Nếu đề cập tới CSDL đ−ợc tạo ra từ N nhân tố hình dạng giá trị thấp nhất có thể tìm thấy bằng xác suất theo kinh nghiệm:# - 67 - ( ) ( ) ( )( ){ }dSxSx N dSP iii ≤∈ì= ,'1, id,S'# β Tại giá trị thấp nhất 1/N. Nếu ph−ơng pháp nền xây dựng trên k =1 đặc tr−ng và CSDL N =1000 hình dạng. Giá trị thấp nhất có thể tìm thấy số cảnh báo sai là 1000.1/1000=1. Điều này có nghĩa nếu hai nhân tố hình dạng S và S’ d−ờng nh− đ−ợc định dạng dựa trên NFA ta có thể chắc chắn đối sánh này không ngẫu nhiên. Thực vậy NFA =1 có nghĩa trị trung bình 1 hình dạng trong CSDL có thể đối sánh với S bằng sự thay đổi. Giả thiết ph−ơng pháp nền đ−ợc xây dựng trên 6 đặc tr−ng (N=1000) Số cảnh báo sai thấp nhất đ−ợc tìm thấy 1000.1/10006=10-15 Trong thực tế, quan sát số các cảnh báo sai giữa hai hình dạng t−ơng đ−ơng có thể thấp hơn 10-10. Điều này có nghĩa cần quan sát 1 trong CSDL 1010 không lớn hơn để đối sánh có ý nghĩa tại khoảng cách t−ơng tự là cảnh báo sai. Để tổng hợp, các khung của chúng ta để nhận dạng hình dạng, đặc tr−ng hình dạng đặt ra 3 yêu cầu sau: 1- Các đặc tr−ng hình dạng cung cấp mô tả hoàn thiện: 2 hình dạng với các đặc tr−ng t−ơng tự đ−ợc nhận dạng. 2- Các hình dạng độc lập thống kê (khá chính xác, khoảng cách giữa hai hình dạng là độc lập). 3- Số l−ợng các hình dạng lớn. Yêu cầu thứ nhất có nghĩa là mô tả đặc tr−ng hình dạng tốt. Yêu cầu thứ hai cơ sở cho thiết kế ph−ơng pháp nền và yêu cầu thứ ba cần thiết để tìm kiếm hình dạng với số cảnh báo sai thấp. Tìm các đặc tr−ng rất khó hội tụ cả ba yêu

Các file đính kèm theo tài liệu này:

  • pdfLuận văn- Nghiên cứu phương pháp nhận dạng hình dạng.pdf
Tài liệu liên quan