Daha çox

Sadələşdirmə üçün Douglas-Peucker alqoritmini necə tapa bilərəm?

Sadələşdirmə üçün Douglas-Peucker alqoritmini necə tapa bilərəm?


CİS-də sadələşdirmə metodlarını başa düşmək istəyirəm. İnterneti axtarıb tapdım ki, ən yaxşı sadələşdirmə üsulu Douglas-Peucker alqoritmidir. Alqoritm və alqoritmin necə işləməsi barədə heç bir məlumat tapa bilmədim. Alqoritmin arxasında metodologiyanı izah edən bir qaynaq varmı?


Ramer-Peucker-Algorithm adlı bir Vikipediya məqaləsi tapdım, çünki yaxşı bir başlanğıc nöqtəsinə bənzəyir, çünki bəzi psevdokodları təsvir edir, eyni zamanda sizi bütün mürəkkəbliyinə aparacaq bağlantılar təsvir edir.


Alqoritmin məqsədi, xətt seqmentlərindən ibarət olan bir əyri verilmişdir (buna a da deyilir Polyline daha az nöqtə ilə oxşar bir əyri tapmaq üçün). Alqoritm, orijinal əyri ilə sadələşdirilmiş əyri arasındakı maksimum məsafəyə (yəni əyrilər arasındakı Hausdorff məsafəsinə) əsasən 'bənzərsizləri' müəyyənləşdirir. Sadələşdirilmiş əyri orijinal əyrini təyin edən nöqtələrin alt hissəsindən ibarətdir.

Başlanğıc əyri, nizamlanmış nöqtələr və ya xətlər dəsti və məsafə ölçüsüdür ε & gt 0.

Alqoritm xətti rekursiv olaraq bölür. Əvvəlcə ilk və son nöqtə arasındakı bütün nöqtələr verilir. Avtomatik olaraq saxlanacaq ilk və son nöqtəni işarələyir. Daha sonra ilk və son nöqtələri olan xətt seqmentindən ən uzaq nöqtəni son nöqtələr olaraq tapır, çünki bu nöqtə son nöqtələr arasındakı yaxınlaşan xətt seqmentindən əyridə ən açıqdır. Əgər nöqtə daha yaxındırsa ε xətt seqmentinə, onda saxlanması üçün qeyd olunmayan hər hansı bir nöqtə sadələşdirilmiş əyri göstəricidən daha pis olmadan atıla bilər ε.

Xətt seqmentindən ən uzaq nöqtə -dən böyükdürsə ε təqribən o nöqtə saxlanılmalıdır. Alqoritm öz-özünə rekursiv olaraq ilk nöqtə və ən uzaq nöqtə ilə ardınca ən uzaq nöqtə və son nöqtə ilə qeyd olunur ki, bu da ən uzaq nöqtə saxlanıldığı kimi qeyd olunur.

Rekursiya başa çatdıqda, yalnız saxlanıldığı kimi işarələnmiş nöqtələrdən ibarət yeni bir çıxış əyrisi yarana bilər.

Parametrik olmayan Ramer – Douglas – Peucker Edit

Seçimi ε adətən istifadəçi tərəfindən müəyyən edilir. Bir çox xətt uyğunluğu / çoxbucaqlı yaxınlaşma / dominant nöqtə aşkarlama metodları kimi, rəqəmləşdirmə / kvantlaşdırma səbəbindən bağlanmış səhvdən sonlandırma şərti olaraq istifadə edilərək parametrik olmayan edilə bilər. [1]

Pseudocode Redaktə edin

(Girişin bir əsaslı bir sıra olduğunu düşünür)

Alqoritm vektor qrafika və kartoqrafik ümumiləşdirmə işlənməsi üçün istifadə olunur. Variant alqoritmlərinin inkişafına səbəb olan əyrilər üçün öz-özünə kəsişmə xüsusiyyətini həmişə qoruya bilmir. [2]

Alqoritm, bölünmə və birləşmə alqoritmi olaraq bilinən və Duda və Harta aid edilən bu sahədə fırlanan bir sıra skaneri tərəfindən əldə edilən aralıq məlumatlarının sadələşdirilməsi və denoising işlərini yerinə yetirmək üçün robot texnikasında geniş istifadə olunur. [4]

(Tamamilə və ya yarı) Dinamik qabarıq gövdəli məlumat strukturlarından istifadə edərək alqoritmin yerinə yetirdiyi sadələşdirmə O (n log ⁡ n) < displaystyle O (n log n)> vaxtında həyata keçirilə bilər. [5]


Bu alqoritmi heç vaxt tətbiq etməmişəm və istifadə etməmişəm, amma iki mümkün həll yolu düşünə bilərəm:

Alqoritmi xəttin ayrı hissələrinə tətbiq edin. Yəni istifadəçi 10 bal çəkənə qədər gözləyin, sonra alqoritmi 0..9 nöqtələrində işlədin. Sonra istifadəçi növbəti 10 xalı çəkənə qədər gözləyin və alqoritmi 10..19 nöqtələrində işə salın və s. Biri mümkündür xəbərdarlıq 10, 20 və s.-də yan təsirlər yarada bilər, amma istifadəçi üçün nəzərəçarpacaq olub olmadığını həqiqətən bilmirəm.

İstifadəçi rəsm çəkilənə qədər gözləyin, sonra alqoritmi bütün sətirdə bir dəfə işlədin. Bu yanaşmanı tətbiqlərdə əvvəllər də görmüşəm.

Hər ikisinin də üstünlüyü odur ki, hər nöqtədə alqoritmi iki dəfədən çox işləmirsiniz (və sonuncu vəziyyətdə tam olaraq bir dəfə), halbuki hər nöqtə əlavə edildikdə alqoritmi işləsəniz, əvvəlki hər birində işləyəsiniz Hər dəfə bir nöqtə əlavə etdiyiniz zaman bir performans cəzasına sahib ola bilərsiniz.

Dediyim kimi, bu mənim üçün bir təcrübə sahəsi deyil, amma inşallah sizə bəzi fikirlər verir.


Yolun içərisinə girmədən qapalı yol nöqtələrini sadələşdirin

Şəffaf bir fonda qapalı qeyri-şəffaf görüntünü əks etdirən bir sıra məqamları sadələşdirin.

Sadələşdirilmiş nöqtələr dəsti qapalı qeyri-şəffaf şəklə müdaxilə etməməlidir.

Bir görüntünün qeyri-şəffaf piksellərini əks etdirən bir sıra nöqtələr (x, y) almaq üçün Yürüş Kvadratları Alqoritmindən istifadə edirəm. Bu, qeyri-şəffaf görüntünü əks etdirən etibarlı bir sıra nöqtələr verir.

Orijinal şəkil (şəffaf bir fonda qeyri-şəffaf bir günəş şəkli):

Yürüş Meydanları Alqoritminin nəticəsi (bir sıra nöqtələr - qırmızı, şəffaf olmayan günəş ətrafında):

Bu nöqtələr dəsti yaxşıdır - tamamilə günəş xaricindədir (müdaxilə edilmir). Ancaq mövcud xal dəsti artıq olduğu üçün ortadan qaldırıla bilən bir çox məqamı ehtiva edir. Artıq nöqtələr çoxluqdakı əvvəlki və sonrakı nöqtəni birləşdirən xətt seqmentindədir.

Məsələn, aşağıdakı təsvirdə orta qırmızı nöqtə lazımsızdır və aradan qaldırıla bilər, çünki ilk və son nöqtələrin birləşdirilməsi eyni sətir seqmenti ilə nəticələnir:

Douglas-Peucker Algorithm kimi bir neçə yol nöqtəsi sadələşdirmə alqoritmlərini sınadım. Bu alqoritm nöqtələri azaldır, eyni zamanda sadələşdirilmiş yolun orijinal görüntüyə daxil olmasına imkan verir.

Məsələn, aşağıdakı təsvirdə orta nöqtə ortadan qaldırıldı, lakin nəticə yolun şəkilə girməsinə səbəb oldu:

Şəkildə bütün piksel rənglərini özündə cəmləşdirən bir sıra var, buna görə də hər hansı bir pikselin şəffaf (şəkil xaricində) və ya qeyri-şəffaf olduğunu (şəkil içərisində) müəyyən etmək üçün istifadə edilə bilər.

Nəticədə yolun orijinal görüntüyə girməsinə imkan verməyən yol nöqtələrini sadələşdirmək üçün bir alqoritm axtarıram.


1 Cavab 1

4D halında işləyən alqoritm məqalədə təsvir edilmişdir Əyri Sadələşdirmə üçün Xətti Yaxınlaşdırma Alqoritmləri dörd müəllif tərəfindən: Pankaj K. Agarwal, Sariel Har-Peled, Nabil H. Mustafa və Yusu Wang.

$ P mathcal R ^ d $ çoxbucaqlı əyrisi və $ epsilon ge 0 $ parametri nəzərə alınmaqla $ P $ -ın sadələşdirilməsi $ P $ ən böyük $ mathcal kappa_F ( epsilon /) 2, P) $, $ mathcal O (n log n) $ time və $ mathcal O (n) $ space-də qurula bilər.

Alqoritm monotoniklik xüsusiyyətlərindən asılı deyil. Orijinal xətti disklərlə əhatə edir və sifariş edilmiş dəstdə xətt keçişini axtarır.

Sidenote:
Douglas-Peucker alqoritmində məqalədə təsvir olunan ən pis vəziyyət olan $ mathcal O (n log n) $ ilə bir dəyişiklik var. Xətti Sadələşdirmə üçün Duglas-Peucker Alqoritminin O (n log n) tətbiqi. tərəfindən John Hershberger və Jack Snoeyink: DP xəttinin təkmilləşdirilməsi. Həqiqətən də yol gövdəsindən istifadə edir.


II. Douglas Peucker Alqoritmi

Alqoritm, bir il əvvəl 1972-ci ildən bəri Ramer-Douglas-Peucker alqoritmi olaraq da bilinir, Urs Ramer “Təyyarələrin əyrilərinin çoxbucaqlı yaxınlaşdırılması üçün təkrarlanan bir prosedur” (Ramer, 1972) adlı məqaləsində oxşar fikirləri səsləndirdi.

1973-cü ildə David H. Douglas və Thomas K. Peucker “Rəqəmsal bir xətti və ya karikaturasını təmsil etmək üçün lazım olan nöqtələrin sayının azaldılması üçün alqoritmlər” adlı bir məqalə dərc etdilər (Douglas & amp Peucker, 1973). İçində iki alqoritm təqdim etdilər. Bunlardan biri geniş şəkildə tətbiq edilmişdir və tez-tez Douglas Peucker alqoritmi olaraq adlandırılır. Alqoritmin məqsədi orijinaldan daha az nöqtəyə sahib, lakin orijinalın xüsusiyyətlərini / formasını qoruyub saxlayan sadələşdirilmiş bir polyline istehsal etməkdir. Alqoritmin necə işlədiyini anlamaq üçün addım-addım Şəkil 1-də göstərilən dörd nöqtəli çox xətt üzərində necə işlədiyini araşdırmaq olar.


Çox kateqoriyalı EEG siqnallarından epileptik tutmanın aşkarlanmasında Douglas-Peucker alqoritminin araşdırılması

Elektroensefalogram (EEG) siqnallarının gizli nümunələrini tapmaq epileptik nöbetlərin effektiv aşkarlanmasında həlledici bir hissədir. Bu tədqiqat Douglas-Peucker alqoritmi (DP) və epileptik EEG məlumatlarından nümayəndə və ayrı-seçkilik məlumatlarının çıxarılması üçün əsas komponent analizinə (PCA) əsaslanan yeni bir sxem hazırlayır. Çoxkanallı EEG siqnalları çox korrelyasiya olunduğundan və böyük həcmdə olduğundan, DP alqoritmi EEG məlumatlarından ən çox təmsil olunan nümunələrin çıxarılması üçün tətbiq olunur. PCA, əlaqəsiz dəyişənlər istehsal etmək və daha yaxşı tanınmaq üçün DP nümunələrinin ölçüsünü azaltmaq üçün istifadə olunur. Təklif olunan metodun möhkəmliyini yoxlamaq üçün dörd maşın öyrənmə texnikası, təsadüfi meşə təsnifatçısı (RF), k-yaxın qonşu alqoritmi (k-NN), dəstək vektor maşını (SVM) və qərar ağacı təsnifatçısı (DT), əldə edilmiş xüsusiyyətlər üzərində işlənir. Bundan əlavə, təklif olunan metodların performansını bəzi yaxınlarda bildirilmiş alqoritmlərlə müqayisə edərək qiymətləndiririk. Təcrübə nəticələri göstərir ki, DP texnikası EEG siqnallarının% 47-dən çox nümunə nöqtəsini sıxaraq EEG siqnallarından təmsil olunan nümunələri effektiv şəkildə çıxarır. Nəticələr eyni zamanda, RF təsnifatçısı ilə təklif olunan xüsusiyyət metodunun ən yaxşı performansı əldə etdiyini və ümumi təsnifat dəqiqliyinin 99,85% -ni verdiyini göstərir (OCA). Təklif olunan metod, ən son bildirilən metodları baxımından üstələyir OCA eyni epileptik EEG verilənlər bazasında.

1. Giriş

Epilepsiya, dünyanın 65 milyon insana təsir göstərən insan beynində ən çox görülən nevroloji xəstəliklərdən biridir [1]. Beyində bir qrup neyronun anormal və sinxron boşalmalarına səbəb olan səbəbsiz təkrarlanan nöbetlərlə xarakterizə olunur [2]. Müxtəlif epilepsiya formalarının altında yatan çoxsaylı molekulyar mexanizmlər müəyyənləşdirilsə də, əksəriyyətinin etiologiyası ionik homeostazı dəyişdirən sadə bir qüsurla izah edilə bilməz [3]. Beynin keçici və gözlənilməz elektrik pozğunluqları epileptik tutmalar üçün mümkün səbəblər kimi tanınır. Əksər hallarda, tutmalar gözlənilmədən baş verir, insanı xəbərdarlıq və tutma başlanğıcına hazırlamaq üçün xəbərdarlıq işarəsi olmadan. Xəstəliyin belə kəskin və idarəolunmaz təbiəti, motor nəzarətinin itirilməsi, şüur ​​itkisi və ya qıcolmalar zamanı gecikmiş reaktivlik səbəbindən fiziki zədələnməyə səbəb ola bilər. Şüurun zəifləməsi həyat üçün təhlükəli ola bilər, xüsusən də şəxs sürücülük edərkən, üzgüçülük edərkən, yüksəkliklərə qalxarkən və ya təkbaşına baş verərsə. Elektroensefalogram (EEG) tibbi cəmiyyətdə epileptik nöbet diaqnozu üçün ən çox istifadə edilən bir texnikadır [4]. EEG, baş dərisi boyunca elektrik aktivliyini qeyd edir, bir çox elektrodun baş dərisinə yerləşdirilməsi ilə beyindəki ion cərəyanının axınları nəticəsində yaranan gərginlik dalğalanmalarını ölçür [5, 6]. Epileptik fəaliyyət standart bir EEG-də açıq-aşkar anormallıqlar yarada bilər və üzərində imzasını qoyur [7]. Beyindəki epileptik tutma fəaliyyətləri, ümumiyyətlə mütəxəssis və ya nevroloqlar tərəfindən görmə ilə analiz edilən EEG siqnallarında sünbül və ya sünbül dalğa komplekslərini tez-tez göstərir [8, 9]. Bununla birlikdə, EEG siqnalının vizual taraması çox vaxt aparır və baha başa gəlir, səhv, çox mürəkkəb, mühakiməyə tabe ola bilər və EEG siqnalları çox miqdarda məlumat (ölçüsü və ölçüsü) ehtiva etdiyi üçün insan səhvi [10] ola bilər. Bu səbəbdən, nevroloqun uzunmüddətli EEG siqnallarını təhlil etmək yükünü azaltmaq üçün deyil, eyni zamanda nevroloji xəstəliklərin düzgün diaqnozu və qiymətləndirilməsini təmin etmək üçün avtomatlaşdırılmış epileptik nöbet aşkarlama alqoritmlərinin inkişafına ehtiyac artmaqdadır.

Son iyirmi ildə, müxtəlif xüsusiyyətlərin çıxarılması və təsnifat üsullarına əsaslanan avtomatlaşdırılmış epileptik nöbet aşkarlanması üçün bir neçə EEG siqnal işləmə üsulu hazırlanmışdır. Hər hansı bir aşkarlama metodunun əsas problemi, EEG siqnallarından fərqləndirici xüsusiyyətlərin çıxarılmasıdır, çünki təsnifçinin işini əhəmiyyətli dərəcədə təsir edir. EEG məlumatlarından çıxarılan nümayəndəlik xüsusiyyətləri və ya xüsusiyyətləri epileptik tutmanın mükəmməl aşkarlanması üçün siqnalların əsas xüsusiyyətlərini və ya morfologiyalarını təsvir edə bilər [11]. Xüsusiyyət ekstraktı bir təsnifatçının performansında əsas rol oynayan aşkarlama prosesinin ən vacib hissəsi olduğundan, bu iş EEG siqnallarından epileptik nöbet təsnifatı üçün yeni səmərəli xüsusiyyət çıxarma texnikasını inkişaf etdirməyi hədəfləyir.

Epileptik nöbet aşkarlanmasında korrelyasiya [12], xətti proqnoz səhv enerjisi [13], sürətli Furye çevrilməsi (FFT) [14], dalğacıq çevirmə [15-17], empirik rejimin parçalanması (EMD) kimi bir neçə xüsusiyyət çıxarılma üsulu tətbiq edilmişdir. ) [18, 19], Lyapunov göstəricisi [20], Korrelyasiya ölçüsü [21], təxmini entropiya (ApEn) [22, 23], klaster üsulu [24], Nümunə alma texnikası [10, 25], Kompleks şəbəkə [6, 26 , 27] və Optimum ayırma [7, 28]. Bu xüsusiyyət çıxarma üsulları dörd kateqoriyaya bölünə bilər [29], yəni zaman sahəsi [12, 13], tezlik sahəsi [14], zaman tezliyi domeni [15, 16, 18, 19] və qeyri-xətti metodlar [20 –22]. Xüsusiyyətlər EEG siqnallarından çıxarıldıqdan sonra normal və epileptik EEG-ni ayırmaq üçün bir təsnifləndirici istifadə olunur. Tutmanın aşkarlanması üçün müxtəlif növ süni sinir şəbəkələri (ANN) [30-32], dəstək vektor maşını (SVM) [5, 12, 33, 34], Qərar ağacı (DT) [35] kimi bir çox təsnif metodları təklif edilmişdir. , k-yaxın qonşu [36] və təsadüfi meşələr (RF) [37].

EEG siqnallarının kompleks xüsusiyyətlərinə görə (məs., Qeyri-stasionar, aperiodik və zəif siqnal-səs-küy nisbəti) bəzən epileptik tutmanın aşkarlanmasında ağlabatan bir performans əldə etmək çox çətindir. Mövcud xüsusiyyət çıxarma metodlarından bəziləri qeyri-stasionar epileptik EEG məlumatlarından xarakterik xüsusiyyətlər əldə etmək üçün yaxşı bir seçim deyildir (məs., Fourier transformasiyası) [14, 38] və bu səbəbdən performanslarının çoxu müvəffəqiyyət nisbəti və effektivliyi ilə məhduddur [39, 40 ]. Üstəlik, mövcud metodların əksəriyyəti böyük EEG məlumatlarını uyğun şəkildə idarə edə bilmir. EEG qeydlərinin əksəriyyəti həqiqi bir klinik tətbiqdə çox kateqoriyalı olmasına baxmayaraq, mövcud metodların əksəriyyəti ikili EEG təsnifatı problemləri üçün tətbiq olunur (Normal siqnal və ictal siqnalına qarşı) [32, 41-45] və yalnız bir neçə metod multiklass EEG-ə yönəldilmişdir. təsnifat [37, 39, 40, 46-48]. Bu məsələləri nəzərə alaraq, bu sənəddə çox sinifli EEG siqnallarının təsnifatı üçün Douglas-Peucker alqoritminə (DP) və əsas komponent analizinə (PCA) əsaslanan yeni bir xüsusiyyət çıxarma texnikası təklif olunur.

DP [49], əyrinin xarakterik olmayan nöqtələrini çıxarmaq və xarakterik nöqtələri çıxarmaqla əyrilərin mürəkkəbliyini və saxlama tələblərini azaltmaq üçün kartoqrafik və kompüter qrafik tətbiqetmələrində geniş istifadə olunan ən məşhur xətt sadələşdirmə alqoritmidir [50-53]. Elektroensefalogram (EKQ) siqnallarının sıxılması kimi biotibbi tətbiqlərdə də tətbiq olunur [54-56]. Bu alqoritmin əsas mövzusu daha az vacib məqamlara məhəl qoymadan bir xəttin ən əhəmiyyətli nöqtələrini aşkar edərək qorumaqla bir xətti qısaltmaqdır. DP texnikası, zaman seriyası məlumatlarının orijinal nümunələrini təmsil etmək və məlumatların ölçüsünü azaltmaq üçün yüksək bir qabiliyyətə malik olsa da, EEG siqnal analizində epileptik aşkarlanması üçün müəllifin bildiyi qədər düşünülməmişdir. Beləliklə, bu tədqiqat ilk dəfə çox sayda xam EEG məlumatından təmsilçi seçmə nöqtələri çıxarmaq üçün DP metodlarından istifadə etmək fikrini təqdim edir.

Bu tədqiqatın əsas məqsədi, böyük ölçülü EEG məlumatlarına düzgün baxılması üçün çox kateqoriyalı EEG siqnalından epileptik tutmanın aşkarlanması üçün yeni bir xüsusiyyət çıxarma texnikasını inkişaf etdirməkdir. Üstəlik, bu sənəd DP alqoritminin EEG məlumatlarından epileptik tutmanın aşkarlanmasında effektivliyini araşdırır və təklif olunan xüsusiyyətlər üçün effektiv bir təsnifat tapır. Təklif olunan metodologiyada əvvəlcə qeyri-stasionar epileptik EEG siqnalları üst-üstə düşməyən hissələrə bölünür (adlanır) Seqm) onları stasionar vəziyyətə gətirmək (Bölmə 3.1.1-də ətraflı şəkildə müzakirə olunur). Sonra DP alqoritmi hər birindən nümayəndə seçmə nöqtələrini çıxarmaq üçün effektiv şəkildə istifadə olunur Seqm və hər birinin ölçüsünü azaltmaq üçün Seqm lazımsız nöqtələri qaldıraraq. Növbəti mərhələdə, PCA, DP məlumatlarının ölçüsünü azaltmaq və DP_PCA xüsusiyyət dəsti olaraq təyin olunan əlaqələr olmayan dəyişənlər istehsal etmək üçün istifadə olunur. DP_PCA xüsusiyyət dəsti üçün səmərəli bir təsnifçi seçmək üçün bu işdə dörd məşhur maşın öyrənmə üsulu, yəni RF, k-yaxın qonşu alqoritmi (k-NN), SVM və DT çıxarılan xüsusiyyətlərdə. Təklif olunan metodların tutarlılığını və performansını qiymətləndirmək üçün təlim və test dəsti yaratmaq üçün on qat çarpı doğrulama tətbiq olunur. Hər bir metodun performansı həssaslıqla qiymətləndirilir (Se), spesifiklik (Sp), ümumi təsnifat dəqiqliyi (OCA), yalnış müsbət dərəcə (FPR), kappa statistikası və alıcının işləmə xüsusiyyətləri (ROC) əyri sahəsi. Tamaşaları daha da qiymətləndirmək üçün təklif olunan metod digər mövcud altı alqoritmlə müqayisə olunur. Təcrübə nəticələri göstərir ki, RF təsnifatçısı DP_PCA xüsusiyyət dəsti üçün digər üç təsnifatçı ilə müqayisədə ən yaxşı təsnifedicidir. Nəticələr təklif olunan metodun mövcud metodları [37, 39, 40, 46-48] üstələdiyini də göstərir Se, SpOCA.

Kağızın qalan hissəsi aşağıdakı kimi təşkil edilmişdir: Bölmə 2-də, çox sinifli EEG siqnalları təsnifatında əvvəlki işləri təsvir edirik. Bölmə 3 təklif olunan metodun metodologiyasını təqdim edir. Bölmə 3 də eksperimental məlumatları və tətbiqetməni təsvir edir. Bölmə 4 eksperimental nəticələrdən və müzakirələrdən bəhs edir. Nəhayət, Bölmə 5 bu sənəd üçün nəticə çıxarır.

2. Əvvəlki iş

Son on ildə EEG siqnallarının təsnifatı üçün müxtəlif metodlar təklif edilmişdir [1, 2, 8, 9, 12-16, 22, 29, 36, 57-60]. Bununla birlikdə, yalnız bir neçə yanaşma çox sinifli EEG təsnifatı problemləri ilə məşğul olmuşdur [37, 39, 40, 46-48]. Müqayisəli səbəblərə görə, bir etaleptik EEG verilənlər bazasında çoxsınıflı EEG təsnifatı problemləri ilə məşğul olan ən son və müvafiq tədqiqatlar nəzərdən keçirilmişdir [61, 62].

Ən son, Emigdio et al. [37] Holderian qanunauyğunluğuna və epileptik EEG siqnal təsnifatında xüsusiyyət çıxarılması üçün Uyğun Pursuit (MP) alqoritminə əsaslanan bir metod hazırladı. Xüsusiyyət dəstləri, qanunauyğunluq analizi, MP alqoritmi və sadə zaman domeni statistik analizi yolu ilə EEG siqnallarından çıxarılan xüsusiyyətləri birləşdirərək qurulmuşdur. Bu xüsusiyyət dəstləri daha sonra epileptik vəziyyətlərin təsnifatı üçün təsadüfi bir meşə təsnifatçısına verildi. Metodun performansı fərqli təsnifat problemləri (ikili təsnifat problemləri və çox sinif təsnifatı problemləri) nəzərə alınmaqla Bonn məlumat dəstində [61, 62] sınaqdan keçirilmişdir.Nəticələr beş sinif təsnifatı problemi üçün ümumi təsnifat dəqiqliyinin 97,6% olduğunu göstərdi.

Murugavel və Ramakrishnan [48] epileptik EEG siqnallarının təsnifatı üçün nüvə olaraq həddindən artıq öyrənmə maşını (ELM) olan hiyerarşik bir çoxsınıflı SVM (H-MSVM) əsasında bir yanaşma təqdim etdilər. Dalğa dalğası çevrilməsi, EEG məlumatlarını altı alt zolağa ayırmaq üçün istifadə edildi və daha sonra hər alt zolaqdan ən böyük Lyapunov göstəricisi, statistik dəyərlər və təxmini entropiya kimi altı xüsusiyyət çıxarıldı. Çıxarılan xüsusiyyətlər klassifikatora giriş kimi istifadə edilmişdir. Süni sinir şəbəkəsi (ANN) və çox sinifli SVM də beş kateqoriyalı EEG siqnallarını müəyyən etmək üçün istifadə edilmişdir. Təcrübə nəticələri ELM nüvəsi olan H-MSVM təsnifatçının ANN və SVM təsnifatçılarına nisbətən təsnifat dəqiqliyi və hesablama mürəkkəbliyi ilə müqayisədə daha yaxşı bir performans göstərdiyini göstərdi. H-MSVM ümumi təsnifat dəqiqliyini% 94 əldə etdi.

Ubeyli [47], Lyapunov eksponentlərinə və EEG siqnallarının təsnifatı üçün ehtimal olunan bir sinir şəbəkəsi (PNN) təsnifatına əsaslanan bir metod bildirdi. Lyapunov eksponentləri Jacobi əsaslı alqoritmlərdən istifadə edərək hər EEG siqnalından əldə edilmiş və xüsusiyyət vektorları kimi qəbul edilmişdir. Lyapunov eksponentləri üzərindəki statistik göstəricilər, çıxarılan xüsusiyyət vektorlarının ölçüsünü azaltmaq üçün istifadə edilmişdir. Seçilmiş xüsusiyyətlər PNN və çox qatlı qavrayışlı sinir şəbəkəsi (MLPNN) təsnifatçılarına verilmişdir. Təsnifat nəticələri göstərir ki, Lyapunov eksponatları ilə PNN ümumi təsnifat dəqiqliyini 98,05% -ə çatdırır, MLPNN isə% 92,20 dəqiqlik dərəcəsi istehsal edir.

Ubeyli [46], EEG siqnallarının təsnifatı üçün spektral analiz üsulları ilə birləşdirilmiş avtomatlaşdırılmış diaqnostika sistemlərini təqdim etdi. Xüsusiyyət kimi qəbul edilən dalğalanma əmsallarını və güc spektral sıxlığı (PSD) dəyərlərini hesablamaq üçün xüsusi vektor metodlarından istifadə edilmişdir. Daha sonra seçilmiş xüsusiyyətlər yeddi təsnifat alqoritminə verildi: SVM, PNN, mütəxəssislərin qarışığı (ME), dəyişdirilmiş mütəxəssislər qarışığı (MME), təkrarlanan sinir şəbəkələri (RNN), MLPNN və birləşmiş sinir şəbəkələri (CNN). Təcrübə nəticələri SVM və MME təsnifatçılarının digər beş təsnifatçı ilə müqayisədə daha yaxşı bir performans əldə etdiklərini göstərdi. Alınan xüsusiyyətlərə malik SVM, MME, PNN, ME, RNN, CNN və MLPNN təsnifatçıları üçün təsnifat dəqiqliyi müvafiq olaraq% 99,20, 98,68%, 95,30%, 95%, 94,85%, 93,48% və 90,48% idi.

Ubeyli [39] çoxsınıflı SVM-lərə əsaslanan və EEG siqnallarının təsnifatı üçün çıxış kodlarını (ECOC) düzəldən səhv və özvektor metodları ilə bir metod hazırladı. EEG siqnallarının PSD dəyərləri MUSIC [63], Pisarenko [64] və minimum norm [65] kimi üç fərqli özvektor üsulu ilə əldə edilmişdir. PSD-lərin güc səviyyələri üzərindəki statistikalar xüsusiyyət olaraq qəbul edildi və çox sinifli SVM-lərin istifadəsinə verildi. MLPNN təsnifatçısı eyni xüsusiyyət dəstinə də tətbiq edilmişdir. SVM-nin ECOC və MLPNN ilə əldə etdiyi ümumi təsnifat dəqiqliyi müvafiq olaraq 99.30% və 92.90% təşkil etmişdir.

Gülər ​​və Ubeyli [40], çox sinifli EEG siqnallarının təsnifatı üçün ECOC ilə çoxsınıflı SVM təklif etdilər. Eyni epileptik EEG məlumatlarında ehtimal sinir şəbəkəsi (PNN) və çox qatlı qavrayış sinir şəbəkəsi (MLPNN) təsnifatçılarını da test etdilər. EEG məlumatlarından xüsusiyyətlər çıxarmaq üçün dalğacan əmsalları və Lyapunov göstəriciləri istifadə edilmişdir. Çıxarılan xüsusiyyətlər üç təsnifçinin girişi olaraq istifadə edilmişdir. Nəticələr çoxsınıflı SVM təsnifləndiricisinin digər iki təsnifatçıdan daha yaxşı performans əldə etdiyini göstərdi. SVM, PNN və MLPNN üçün ümumi təsnifat dəqiqliyi müvafiq olaraq 99,28%, 98,05% və 93,63% idi.

3. Metodlar və materiallar

3.1. Təklif olunan yanaşma

Məqalədə çox sinifli EEG siqnal təsnifatında DP-yə əsaslanan yeni bir metod təqdim olunur. Bu işdə, bütün məlumat bazasını əks etdirən orijinal EEG siqnallarından təmsilçi nümunələri seçmək üçün DP yanaşması hazırlanmışdır. Sonra, PCA, bir xüsusiyyət dəsti olaraq qəbul edilən DP nümunə dəstinin ölçüsünü azaltmaq üçün istifadə olunur. Nəhayət, çıxarılan xüsusiyyətlər RF daxil olmaqla dörd maşın öyrənmə üsulu ilə sınaqdan keçirilir. k-NN, SVM və DT. Şəkil 1-də göstərildiyi kimi, təklif olunan metodun bütün prosesi beş əsas hissəyə bölünür: məlumatların bölünməsi, Douglas-Peucker alqoritmi, ölçünün PCA ilə azaldılması, DP_PCA xüsusiyyət dəsti və RF tərəfindən təsnifat hissəsi, k-NN, DT və SVM. Bu beş hissənin ətraflı təsviri sonrakı hissələrdə verilmişdir.

3.1.1. Məlumat Seqmentasiyası

EEG siqnal işləmə metodlarının əksəriyyəti siqnalların dayanıqsızlığını tələb edir. EEG siqnalı stasionar olmasa da, ümumiyyətlə daha kiçik pəncərələr və ya bu siqnalların hissələri dayanıqlıq nümayiş etdirəcəkdir [7]. EEG siqnalı az müddətə hərəkətsizdir. Hər sinifin qeydə alınmış EEG siqnallarının, mümkün dayanıqlıqları düzgün hesablamaq üçün müəyyən bir müddətə görə bir-birinin üstündəki üst-üstə düşməyən hissələrə bölünməsinin səbəbi budur. Buna görə hər bir sinifin EEG siqnalları bəzi sabit ölçülü üst-üstə düşməyən vaxt pəncərələrinə bölünür (adlanır "Seqm") müəyyən bir müddətin təmsil dəyərlərini əldə etmək. Hər biri Seqm bir zaman pəncərəsindəki EEG kanal məlumatlarından ibarətdir. Şəkil 2 seqmentlərin təyin edilməsinə dair bir nümunəni təsvir edir Seqms bir sinifin EEG siqnalında. Sayını qeyd etmək yerinə düşər Seqms (k) hər hansı bir sınaq dizaynı üçün zamanla empirik olaraq təyin olunur.

3.1.2. Douglas-Peucker Alqoritmi

DP [49] xətt (traektoriya) sadələşdirmə üçün ən populyar metodlardan biridir. Alqoritm daha az vacib məqamları laqeyd yanaşarkən bir xəttin ən əhəmiyyətli nöqtələrini aşkar edərək qoruyaraq bir xətti asanlaşdırır. Bu işdə, DP nümunəsi, fərqli nümunələrdən nümunələrin çıxarılması üçün istifadə olunur "Seqmlər". Məlumat seriyasına (trayektoriyaya) icazə verin S dəsti ilə təsvir edilə bilər N xal

. DP alqoritminin əsas ideyası, ən az sadələşdirilmiş dözümlülük göstərərək orijinal məlumat seriyasından kənara çıxmadan daha az və ən əhəmiyyətli nöqtələri olan yeni bir məlumat seriyasını təyin etməkdir.

. DP-nin ilkin addımı olaraq alqoritm məlumat seriyasına yaxınlaşır S birincisindən sonuncusuna qədər qurulmuş bir xətt seqmenti ilə. Sonra hər bir ara məlumat nöqtəsi ilə xətt seqmenti arasındakı dik Öklid məsafəsini hesablayır və nöqtəni saxlayır.

maksimum məsafəyə malik olan

. Alqoritm verilmiş sadələşdirmə tolerantlığı ilə müqayisə olunur. Maksimum məsafə sadələşdirmə tolerantlığından azdırsa, alqoritm məlumat seriyasındakı bütün ara nöqtələri silir. Əks təqdirdə, məlumat seriyasını iki alt seriyaya bölmək üçün məlumat nöqtəsini istifadə edir

və hər alt seriya üçün proseduru təkrarən təkrarlayır. DP alqoritmi, alt seriyalarda sadələşdirmə tolerantlığından aşağı olduqda və ya alt seriyalarda yalnız iki məlumat nöqtəsi olduqda sona çatır. Şəkil 3 DP nümunə nöqtəsinin çıxarılması nümunəsini göstərir. Orijinal məlumat seriyası səkkiz nöqtədən ibarətdir (

). Əvvəlcə nöqtələrdən xətt seqmentinə qədər olan məsafələr hesablanır. Nöqtədəki maksimum məsafədən bəri

verilmiş sadələşdirmə dözümlülüyünü aşarsa, məlumat seriyası bu nöqtədə iki alt seriyaya bölünür (Şəkil 3-də addım 2). Sol alt seriyalarda, sətir seqmentinə olan məsafə dəyərdən aşağı olduğundan nöqtə nəzərə alınmır. Sağ alt seriyalarda nöqtədən məsafə

xətt seqmentinə də sadələşdirmə dözümlülüyünü aşır, bu səbəbdən nöqtədə yeni bir bölmə yerinə yetirilir və hər bir hissə üçün əməliyyat sırasıyla təkrarlanır. Şəkil 3 göstərir ki, 8 xala sahib olan orijinal məlumat seriyası bu prosesdən sonra nəhayət 4 ballıq bir məlumat seriyasına çevrilir.

Sadələşdirmə tolerantlığının dəyəri sadələşdirmə dərəcəsini təyin edir. Bu səbəbdən DP alqoritmində ən əhəmiyyətli dəyəri təyin etmək vacib bir vəzifədir. Kiçik bir dəyərin seçilməsi minimal sadələşdirilmiş bir məlumat seriyası meydana gətirəcəkdir (yəni məlumat seriyalarından yalnız bir neçə lazımsız məlumat nöqtəsi silinəcəkdir), böyük bir seçim isə bəzi əhəmiyyətli nöqtələrin itirilməsinə səbəb ola biləcək son dərəcə sadələşdirilmiş bir məlumat seriyası təmin edəcəkdir. məlumat seriyasından. Hər bir məlumat seriyası üçün ən əhəmiyyətli dəyəri hesablamaq üçün aşağıdakı düstur (1) istifadə olunur.

harada N məlumat seriyasındakı nöqtələrin sayıdır

iki nöqtə arasındakı Öklid məsafəsidir

məlumat seriyasının ümumi məsafəsidir və T empirik olaraq təyin olunan həqiqi ədədi. -In dəyəri, üçün müxtəlif dəyərlər qoyaraq məlumat seriyasının ümumi məsafəsinin fərqli faizləri kimi dəyişdirilir T.

Şəkil 1-də göstərildiyi kimi, DP prosesi müxtəlif nümunələrdən nümunə götürmək üçün aşağıdakı addımlardan ibarətdir Seqms.

Addım 1. Bir sinifin EEG məlumatlarının bütün kanallarını nəzərdən keçirin.

Addım 2. Bu sinifin EEG məlumatları bölünür k seqmentləri müəyyən bir dövrü nəzərə alaraq. Fərz edək ki, Seqms var

Addım 3. Hər birinin ümumi məsafəsi Seqm hesablanır. Sonra quraraq T dəyər, hər biri üçün sadələşdirilmiş tolerantlığın dəyəri Seqm (1) istifadə edərək hesablanır.

Addım 4. Hər biri nümayəndəsi Seqm DP alqoritmi istifadə edərək çıxarılır. Qoyun

alınan nümunələrin ölçüləri ola bilər Seqms ölçüləri müvafiq olaraq. Hər biri arasından seçilmiş nümayəndə nümunələri Seqm bir sinifdə Şəkil 1-də göstərildiyi kimi DP_Sample olaraq göstərilən bir vektor dəsti düzəldin.

Addım 5. Bütün siniflərin vektor dəstləri növbəti hissədə müzakirə edildiyi kimi PCA-ya giriş olaraq istifadə olunan bir matris (DP_samples set kimi qeyd olunur) qururlar.

3.1.3. PCA tərəfindən ölçü azaldılması

PCA, xüsusiyyətlərin çıxarılması və ölçülərin azaldılması üçün tanınmış bir statistik metoddur [66-68]. Mümkün olan əlaqəli dəyişənlərin müşahidələrini bir sıra əsas komponentlər (PC) adlanan əlaqəsiz kiçik dəyişənlər toplusuna çevirmək üçün ortoqonal bir çevrilmədən istifadə edir. Bu komponentlər məlumatların ən vacib xətti xüsusiyyətlərini təmsil edir. Fərqli baş dərisi yerlərindən qeydə alınan çoxkanallı EEG siqnalları bir-biri ilə çox əlaqəlidir. Bunlar çox miqdarda lazımsız məlumat ehtiva edir. Bu səbəbdən, EEG siqnallarını yeni xətti olmayan əlaqəli dəyişənlər (yəni, PC sahəsi) halına gətirərək bu lazımsız məlumatları aradan qaldırmaq və bu yeni dəyişənləri EEG siqnallarının daha yaxşı təsnifatı üçün xüsusiyyətlər kimi istifadə etmək faydalı olardı. Bu yazıda, PCA, DP_S sample dəstinin ölçüsünü azaltmaq və epileptik EEG siqnallarının təsnifatı üçün EEG xüsusiyyətlərini əldə etmək üçün istifadə olunur.

burada hər sətr a-da bir məlumat nöqtəsini təmsil edir səh-ölçülü məkan (a səh-kanal EEG siqnalları səh-ölçülü boşluq) və n DP-nin seçdiyi balların sayıdır. PCA aşağıdakı optimallaşdırma problemi kimi formalaşdırıla bilər:

harada U ibarət olan bir matrisdir q dominant özvektorları. Bu problem kovaryans matrisinin özünəməxsus bir parçalanma problemi çıxarılaraq həll edilə bilər.

kovaryans matrisidir, qlobal orta olaraq təyin olunur

özünəməxsus dəyərlərdir və azalan qaydada sıralanır və

müvafiq öz vektorlarıdır. DP_Samples dəstinin ölçüsünü azaltmaq üçün yalnız birincisi q özvektor (

) ilə uyğundur q ən böyük öz dəyərlər DP_Samples dəstini təmsil etmək üçün aşağıdakı tənliklə seçilir.

Müəyyən bir dəqiqlik parametri üçün (bu işdə = 90% nəzərə alınmaqla), matris U ibarət q dominant öz vektorları qurulur və q-DP_PCA xüsusiyyət dəsti olaraq göstərilən ölçülü xüsusiyyət dəsti aşağıdakı kimi hesablanır:

3.1.4. DP_PCA Xüsusiyyət Dəsti

DP_PCA xüsusiyyət dəsti olaraq bağışlanan yeni xüsusiyyət dəsti, Bölmə 3.1.3-də bəhs edildiyi kimi PCA metodundan istifadə edərək DP_Samples dəstinin ölçüsünün azaldılması yolu ilə yaradılmışdır. Bu xüsusiyyət vektor dəsti Bölmə 3.3-də müzakirə olunan on qat çarpı doğrulama metodundan istifadə edərək təlim dəsti və test dəstinə bölünür. Şəkil 1-də göstərildiyi kimi, bu xüsusiyyət dəsti növbəti hissədə müzakirə olunan dörd təsnifçinin hər birinə verilir.

3.1.5. RF, KNN, SVM və DT ilə təsnifat

Bu iş dörd təsnifləndiricini nəzərdən keçirir: RF, k-NN, DT və SVM təklif olunan xüsusiyyət çıxarma metodunun performansını yoxlamaq üçün. Bu təsnifat metodlarının qısa izahı aşağıdakı hissələrdə verilmişdir.

Təsadüfi Meşə. RF Breiman tərəfindən hazırlanmış bir ansambl öyrənmə texnikasıdır [69]. Hər ağacın giriş xüsusiyyətlərinin təsadüfi bir alt hissəsini və təlim məlumatlarından fərqli bir başlanğıc örneği seçərək bir ağac təsnifatı istifadə edərək qurulduğu bir çox fərdi təsnifat ağacından ibarətdir. RF yeni nümunələri təsnif etmək üçün bütün təsnifat ağaclarının nəticələrini ümumiləşdirir. Hər ağac giriş məlumatlarına vahid səs verir və sonra meşə giriş məlumatlarına görə ən çox səs alan sinfi seçir. Şəkil 4 təsadüfi meşə təsnifatının quruluşunu göstərir.

RF alqoritmi aşağıdakı kimi davam edir: (1) Təlim məlumat dəstindən, m təlim alt dəstləri açılış üsulu ilə istifadə olunur (təsadüfi dəyişdirmə ilə nümunə götürmə). Hər bir təlim alt dəsti təlim məlumat dəsti ilə eyni ölçüyə malikdir və təlim məlumat dəsti nümunələrinin təxminən üçdə birini əhatə edir. (2) Hər bir təlim alt qrupu üçün bir qərar ağacı aşağıdakı meyarlarla qurulur: bir qərar ağacının qurulmasında hər bir qovşaqda təsadüfi bir sıra f xüsusiyyətləri seçilir. F giriş xüsusiyyətləri (

) və bunlar arasında ən yaxşı bölünmə (məsələn, ən böyük Gini ölçüsü) f xüsusiyyətləri düyünü bölmək üçün istifadə olunur. Ağac budama olmadan maksimum ölçüdə yetişdirilir. RF-də istifadə olunan ağac yetişdirmə alqoritmi təsadüfi ağaclardır. (3) m ağaclar bir RF ansamblına birləşdirilir və hər ağacdan alınan səsləri qiymətləndirərək yeni məlumatların sinifini proqnozlaşdırmaq üçün səs çoxluğu sxemindən istifadə edir.

K-Yaxın Qonşu Alqoritmi. The k-NN, xüsusiyyət məkanında ən yaxın təlim müşahidələrinə əsaslanaraq obyektlərin təsnif edilməsi üçün nəzarət olunan bir öyrənmə alqoritmidir [66, 70]. Baxmayaraq ki k-NN, bütün maşın öyrənmə alqoritmləri arasında ən sadə alqoritmdir, təlim nümunələrinin götürüldüyü bölgülər barədə əvvəlcədən fərziyyələr olmadan, hələ də yüksək performans verə bilər [66]. Sorğu vektoru verilir

və bir sıra N etiketli nümunələr

, klassifikatorun məqsədi əvvəlcədən təyin edilmiş sinif etiketini müəyyənləşdirməkdir P siniflər. The k-NN təsnifat alqoritmi, k-yə ən yaxın qonşuları tapmağa çalışır və səs etiketini təyin etmək üçün səs çoxluğundan istifadə edir. Əvvəlcədən məlumat olmadan k-NN təsnifatçısı ümumiyyətlə Öklid məsafələrini məsafə metriki kimi tətbiq edir [71]. Bu metodun təfərrüatlı müzakirəsinə [66, 70, 72] tapa bilərsiniz.

Dəstək Maşın. SVM, Vapnik tərəfindən təqdim olunan statistik öyrənmə nəzəriyyəsi və struktur risklərinin minimuma endirilməsi prinsipinə əsaslanan bir maşın öyrənmə alqoritmidir [73]. SVM-in əsas ideyası, giriş məlumatlarını daha yüksək ölçülü bir məkana uyğunlaşdırmaq və sonra çevrilmiş məkandakı iki məlumat sinfi arasında optimal ayırıcı hiperplan təyin etməkdir [74, 75]. Qeyri-xətti təsnifat modelləri üçün məlumatlar xətti olaraq ayrılmadığı zaman, SVM-lər giriş məkanını yeni məkanda xətti olaraq ayrılmaq üçün xətti bir nüvə funksiyası quraraq ayrılmaz giriş məlumatlarını yüksək ölçülü bir məkana daxil edir və hiperplanın girişə daha yaxşı uyğunlaşmasına imkan verir. verilənlər bazası. SVM başlanğıcda iki sinifli bir təsnifçi kimi hazırlansa da, SVM-nin tətbiqini çox sinifli təsnifatlara tətbiq etmək üçün bəzi metodlar təklif edilmişdir. Təcrübədə geniş yayılmış prosedurlardan biri, bir-bir ayrışmaya əsaslanan cüt cüt təsnifatçıların işə salınmasıdır [75]. İkili SVM təsnifləndiricisinin qərar funksiyası aşağıdakı kimi ifadə edilə bilər:

harada sqn işarə funksiyasıdır, nüvə funksiyasıdır və b təlim nümunələrinin qərəzidir. Doğrusal nüvə, polinom nüvəsi, RBF nüvəsi və sigmoid nüvəsi kimi bir neçə nüvə funksiyası var. Bu məqalədə polinom nüvəsi, çox kateqoriyalı EEG siqnallarını müəyyənləşdirmək üçün ən yaxşı nüvə funksiyası olaraq qəbul edilir, çünki ən yaxşı təsnifat performansı verdi.

Qanunauyğunluq parametri C təlim səhvi və modelin mürəkkəbliyi arasındakı qarşıdurmanı idarə etmək üçün istifadə olunur və aşağıdakı kimi hesablana bilər:

harada N təlim dəstinin ölçüsüdür.

Çox sinifli təsnifat problemində SVM-lər qərar funksiyaları toplusundan istifadə edərək işləyirlər

. Sinif qərarı aşağıdakı düsturla əldə edilə bilər [75]:

harada kl ayrılmış hədəf siniflərindən seçilmiş hər bir sinif cütünü və n ayrılmış hədəf siniflərinin sayıdır. Alqoritm aşağıdakı kimi davam edir: sinfə etiket verir: arg max, (k = 1, 2. n). Cüt cüt təsnifat sonra n-sınıf təsnif problemi n (n1) / 2 bütün sinif cütlərini əhatə edən iki sinif problemlər. SVM təsnifləndiricisinə ümumi baxış [73-75] -də tapılmışdır.

J48 Qərar Ağacı. J48 qərar ağacı, WEKA-da (Waikato Environment for Knowledge Analysis) C4.5 alqoritminin [76] tətbiqidir [77, 78]. C4.5, ID3 alqoritminin bir uzantısıdır. Verilənləri bir atributun dəyərinə əsasən kiçik alt hissələrə rekursiv olaraq bölmək üçün yuxarıdan aşağıya tikinti texnikasından istifadə edir [76, 79]. Bu təsnifçi məlumat entropiyası konsepsiyasından istifadə edərək verilmiş verilənlər bazası üçün qərar ağacını qurur. Bir qərar ağacında, hər bir atribut, məlumatları daha kiçik alt hissələrə bölərək qərar vermək üçün istifadə edilə bilər. Ağacın hər bir qovşağında alqoritm məlumatların daha kiçik alt hissələrə bölünməsi üçün məlumatların hər bir xüsusiyyətini qiymətləndirir və ən yüksək məlumat qazancı verən atributu seçir. Bir atribut seçildikdən sonra, məlumat dəsti alt qruplara bölünür və bölünmə prosesi daha çox bölünmə qazana qədər hər alt qrup üçün təkrarlanır. Nəticədə yaranan ağac quruluşunda ağacdakı hər daxili düyün giriş atributlarından birinə uyğundur, hər filial bu xüsusiyyətin bir dəyərini və ya dəyər aralığını əks etdirir və hər yarpaq bir təsnifatı hesab edir.

3.2. Epileptik EEG məlumatları

Bu işdə istifadə olunan epileptik EEG məlumatları, Almaniyanın Bonn Universiteti, Epileptologiya Bölməsinin ictimaiyyətə açıq EEG məlumat bazasından əldə edilir [61, 62]. Bütün verilənlər bazası A, B, C, D və E dəstləri kimi göstərilən beş alt dəsti ehtiva edir. Hər bir alt qrupda 23.6 saniyəlik 100 tək kanallı EEG siqnalı var. A və B alt qrupları ekstrakranial qaydada, C, D və E alt qrupları isə intrakranial qaydada qeydə alınır. Dəst A və B Bı sırasıyla gözləri açıq və gözləri bağlı olan beş sağlam könüllüdən toplandı. C və D dəstləri interiktal dövrlərdə beş epileptik xəstədən toplanmışdır. C dəsti epileptogen zonanın əks tərəfindəki hipokampal formasiyadan, D dəsti isə epileptogen zonadan qeydə alınmışdır. E dəsti, nöbet fəaliyyəti dövründə (iktal dövrlər) C və D dəstlərindəki bütün qeyd zonalarından toplanmışdır. Bütün EEG qeydləri, 173.61 Hz seçmə hızı və 12 bit A / D çözünürlüklü 128 kanallı bir gücləndirici sistem istifadə edilərək qeyd edildi.Siqnallar 0.53-40 Hz (12 dB / oktav) bant keçid filtrindən istifadə edilərək süzülmüş və əzələ və göz hərəkətləri kimi əsərlər vizual müayinə ilə çıxarılmışdır. Beş dəst EEG məlumatının xülasə təsviri Cədvəl 1-də verilmişdir. Beş sinifin hər birindən nümunəvi EEG vaxt seriyası (Set A-Set E) Şəkil 5-də göstərilmişdir

3.3. Tətbiq

Bu bölmə epileptik EEG məlumatları üzərində təklif olunan metodun tətbiqini təqdim edir [61, 62]. Bölmə 3.2-də müzakirə edildiyi kimi, tam verilənlər bazası, hər biri 23.6 s 100 kanal məlumatlarını ehtiva edən beş dəsti (A, B, C, D və E kimi qeyd olunur) ehtiva edir. Hər kanal 4096 məlumat nümunəsindən ibarətdir. Təklif olunan metodun tətbiqi aşağıdakı beş mərhələdən ibarətdir: (1) Hər bir sinif məlumatı dördə bölünür Seqms (K= 4), hər biri 5.9 s olan 100 kanal məlumatını ehtiva edir. Hər kanal dörd ölçüsü olan 4096 məlumat nümunəsindən ibarət olduğundan Seqms bunlar = 1024, = 1024, = 1024 və


3 Cavablar 3

Ən uzaq nöqtəni hesablamaq istəyirsinizsə, 'həqiqi' məsafə hesablanması üçün kvadrat kökündən istifadə etməyinizə ehtiyac yoxdur. Həqiqi məsafəni yox, yalnız müqayisə üçün məsafəyə ehtiyacınız olduğundan sqrt (x * x + y * y) əvəzinə x * x + y * y ilə müqayisə etmək kifayətdir.

Bu olduqca köhnə bir sualdır, cavab vermək istərdim, çünki internetdə "Python Ramer-Douglas-Peucker" axtarırsa ortaya çıxır.

Birincisi, tətbiq səhvdir!

OP dedikləri zaman eyni şəkildə şübhələndi:

Dözümlülüyü nə qədər yüksək göstərsəm də, yaxınlaşma hər zaman təxminən (2 N / 3) nöqtədə baş verir, burada N giriş poliqonundakı nöqtələrin sayıdır. Səhv bir şey edə bilərəmmi?

Alqoritmin necə işlədiyini bilməklə girişdəki nöqtələrin sayının çıxış nöqtələrinin sayını təyin edən hərəkətverici dəyişkən olmaması aydın olmalıdır. Bunun əvəzinə, tolerantlığın əhəmiyyəti olmalıdır.

Asan bir sınaq işi nədir? Düz bir xətt!

İstifadə edək Hipotez bəzi test halları yaratmaq. Xüsusiyyətlərimiz asandır: Yaranan poli xəttin uzunluğu 2 olmalıdır və birinci və son nöqtə giriş poli xətti ilə eynidir.

Bunun uğursuz olduğunu görməlisiniz: AssertionError: 77! = 2 Bir az fərqli bir uzunluq əldə edə bilərsiniz. Beləliklə, qaytarılmış poly_out-un uzunluğu ikiyə bərabər deyil.

Sonra, tətbiqinizə nəzər salaq.

Bu səhv yalnız (2 N / 3) nöqtə ilə sadələşdirə biləcəyiniz müşahidəni izah edir. Kod yalnız (rekursiv) girişin uzunluğu 3 (başlanğıcda xüsusi hal) olduqda və maksimum məsafənin tolerantlıqdan böyük olması halında orta nöqtəni düşür.

Sonra, iki rekursiya nəticəsini bir yerə topladığınız 'TODO' şərhinizə nəzər salaq:

TODO-da qeyd etdiyiniz zərif dilimləmə hiləsi budur: Əvvəlki və sonrakı nöqtələri birləşdirmək istəyirsiniz, lakin dönmə nöqtəsindəki nöqtə (ən uzaq) iki dəfə olacaqdır. Buna görə yalnız son nöqtə xaricində ilk siyahını qaytarın.

Bu eyni nöqtəyə dəfələrlə sahib olduğunuz bir səhvdən qaçınır. [A, b, c, A, d, e, f] kimi. İkinci A silinmiş olardı.

Rekursiyadan istifadə etdiyiniz (icra ilə maraqlanırsınızsa), tətbiqetmənin başlanğıcındakı xüsusi işin baxılması (lazım deyil) haqqında daha çox şey söyləmək olar - lakin bu sual heç kimin qayğısına qalmaq üçün çox köhnədir.


Mücərrəd

Klassik Douglas-Peucker sətir sadələşdirmə alqoritmi orijinal sətirlərin ən yaxşı qavrayış təsvirlərini təqdim edən biri kimi tanınır. Bununla birlikdə, bütün zirvə nümunələrindən ibarət olan orijinala topoloji cəhətdən bərabər olmayan sadələşdirilmiş polilin istehsal edə bilər. Polilin gövdələrinin xüsusiyyətləri əsasında Saalfeld topoloji uyğunsuzluqları aşkar etmək üçün sadə bir qayda hazırladı və bunları əlavə dəqiqləşdirmələr aparmaqla həll etməyi təklif etdi. Bu yazıda klassik Douglas-Peucker üçün orijinal ilə homomorf olan sadələşdirilmiş bir polilin istehsal etməsi üçün alternativ bir forma təqdim edirik. Dəyişdirilən Douglas-Peucker alqoritmimiz iki təklifə əsaslanır: (1) orijinal polyline ulduz şəklində olduqda, Douglas-Peucker prosedurundan sadələşdirilməsi öz-özünə kəsişə bilməz və (2) hər hansı bir polyline üçün ulduz formalı ikisi alt-polilinlər yalnız digərinin uyğun bölgəsinin içərisində sadələşdirilmiş alt-polilin birinin zirvəsi olduqda kəsişə bilər.

Topoloji Tutarlılıq Xəttinin Sadələşdirilməsi Douglas-Peucker Alqoritmi CİS

Douglas-peucker alqoritmi: öz-özünə kəsişməyənlər üçün yetərlilik şərtləri 1 1 Wu, Shin-Ting və Markes tərəfindən "Öz-özünə kəsişməyən Douglas-Peucker Alqoritmi" əsasında, Sibgrapi 2003 Proceedings-də çıxan Mercedes R. G.. © 2004 IEEE.

Shin-Ting Wu Adler C. G. da Silva Mercedes R. G. Marquez

Campinas Universidade Estadual (UNICAMP), Faculdade de Engenharia Elétrica e Computação (FEEC), Departamento de Engenharia de Computação e Automação Industrial (DCA), [email protected], [email protected] [email protected]

Klassik Douglas-Peucker xətt sadələşdirmə alqoritmi, orijinal xətlərin ən yaxşı qavrayış təsvirlərini təqdim edən biri kimi tanınır. Bununla birlikdə, bütün zirvə nümunələrindən ibarət olan orijinala topoloji cəhətdən bərabər olmayan sadələşdirilmiş polilin istehsal edə bilər. Polilin gövdələrinin xüsusiyyətləri əsasında Saalfeld topoloji uyğunsuzluqları aşkar etmək üçün sadə bir qayda hazırladı və bunları əlavə dəqiqləşdirmələr aparmaqla həll etməyi təklif etdi. Bu yazıda klassik Douglas-Peucker üçün orijinal ilə homomorf olan sadələşdirilmiş bir polilin istehsal etməsi üçün alternativ bir forma təqdim edirik. Dəyişdirilən Douglas-Peucker alqoritmimiz iki təklifə əsaslanır: (1) orijinal bir çox xətt ulduz şəklində olduqda, onun Douglas-Peucker prosedurundan sadələşdirilməsi öz-özünə kəsişə bilməz və (2) hər hansı bir çox xətt üçün ulduz şəklində ikisi. alt-polilinlər yalnız digərinin uyğun bölgəsinin içərisində sadələşdirilmiş alt-polilin birinin zirvəsi olduqda kəsişə bilər.

Açar sözlər: Topoloji Tutarlılıq Xəttinin Sadələşdirilməsi Douglas-Peucker Alqoritmi CİS.

Çox vaxt bir çox xəttin həndəsi həlli, coğrafi xəritə sərhədlərinin vizuallaşdırılması və ya rastr ekranında müntəzəm kiçik fasilələrlə parametrik bir əyrinin seçilməsi ilə yaxınlaşan əyrilərin vizuallaşdırılması kimi tətbiqetmənin dəstəklədiyi qətnamədən xeyli yüksəkdir. Effektivlik naminə, orijinal polilin təfərrüatlı məlumatlarından əsas xüsusiyyətləri çıxara bilən və göstərilən qətnamə üçün kifayət qədər az zirvəsi olan sadə birində təmsil edən alqoritmləri axtarırıq. Onların bir çoxu tədqiqatçılar tərəfindən müxtəlif məzmunda təqib edilmişdir [5, 6, 8, 11, 12, 14].

Sadə bir xətt sadələşdirmə alqoritmi, qəbul edilmiş tolerantlıqdan daha böyük xətt seqmentləri olan bir çox xəttli bir xətt qurmaqdan ibarətdir. Əvvəlki başlanğıc təpəsindən məsafəsi müəyyən edilmiş maksimum məsafədən az olan sonrakı təpələrin rekursiv şəkildə atılması ilə əldə edilə bilər. Bu maksimum məsafədən daha uzaq olan təpə yeni sadələşdirilmiş polilin bir hissəsi kimi qəbul edilir və daha da sadələşdirilməsi üçün yeni başlanğıc zirvəsi olur [10].

Riyazi oxşarlıq və uyğunsuzluq ölçülərinin ətraflı öyrənilməsindən Duqlas-Peuker alqoritmi ən əyani təsirli xətt sadələşdirmə alqoritmi kimi göstərilmişdir [1, 7]. Təpə azaldılması rədd meyarı kimi təpələrin yaxınlığını istifadə etdiyi halda, Duqlas-Peuker alqoritmi bir küncün sadələşdirilmiş çoxbucaqlıya yaxınlığını istifadə edir. Həddindən artıq təpələri v həddindən artıq təpələri ilə üst-üstə düşən bir xətt seqmenti ilə başlayan bir rekursiv prosedurdur1 və vn sıralanmış qaydada n təpələrin siyahısı kimi verilən polilin. Hər seqment vkvj ən uzaq təpədə vmən ona, burada k & lt i & lt j, zirvələrin ardıcıllığı v arasındakı məsafəyə qədərk. vmən. və vk, vmən və zirvələrin ardıcıllığı arasındakı məsafə vmən. vj. və vmənvj sabit bir tolerantlıqdan azdır.

Saalfeld, Douglas-Peucker alqoritminin hərtərəfli təhlilini aparmış və [9] əsas xüsusiyyətlərinin bir sıra siyahısında göstərilmişdir. Bundan əlavə, Douglas-Peucker alqoritmindən əldə edilmiş sadələşdirilmiş polilinanın gövdə xassəsi əsasında, sübutla qabarıq bir qabıq testi və mümkün topoloji ziddiyyətlərin aşkarlanması üçün tərəflilik konsepsiyasından istifadə etməyi təklif etdi. Hershberger və Snoeyink [3] tərəfindən təqdim olunan dinamik qabarıq gövdə alqoritmindən istifadə edərək, hər incələşmə mərhələsində mövcud qabarıq gövdəni səmərəli saxlayır və əldə edir.

Bu məqalədə Douglas-Peucker alqoritmindəki öz-özünə kəsişmə problemini həll etmək üçün hələ üç qatqı təqdim edilmişdir. Birincisi, Douglas-Peucker metodu ilə ulduz şəkilli bir polilinanın sadələşdirilməsinin heç vaxt öz-özünə kəsişən polilinlə nəticələnməyəcəyinin bir sübutu. İkincisi, sadələşdirilmiş bir polilin kəsişməyən seqmentlərini əhəmiyyətsiz şəkildə atmaq üçün bir prosedurdur. Və nəhayət, birinci və ikinci qatqılar əsasında hər hansı bir çox xətt üçün öz-özünə kəsişməyən Douglas-Peucker alqoritmini təklif edirik.

Bölmə 2-də Douglas-Peucker alqoritmi qısaca tamlığı üçün təsvir edilmişdir. Öz-özünə kəsişməyən yolların yetərlilik şərtlərinin sübutu Bölmə 3-də təqdim edilmişdir. Bölmə 4, sadələşdirilmiş alt-çox xətlər arasındakı mümkün ziddiyyətlərin aradan qaldırılması üçün bir strategiya verir. Bölmə 5-də, müəyyən edilmiş hər hansı bir tolerantlıq üçün orijinal və sadələşdirilmiş polilinlər arasında topoloji bərabərliyi təmin etmək üçün bu iki xassəni klassik Douglas-Peucker-ə birləşdirən çox xəttli sadələşdirmə alqoritmimizi təsvir edirik. Bölmə 6, alqoritmin bir mürəkkəblik analizini ətraflı şəkildə izah edir. Daha sonra, Bölmə 7-də bəzi nəticələr göstərilir. Nəhayət, Bölmə 8-də gələcək tədqiqat istiqamətlərimiz təqdim olunur.

2 Douglas-Peucker Alqoritmi

Douglas-Peucker alqoritminin yaxşı vizual nəticələrindən əlavə, proqramlaşdırılması çox sadədir və istənilən nöqtə və xətlər arasındakı məsafəyə əsaslandıqdan sonra istənilən ölçüdə işləyir. İnternet saytlarında bir neçə tətbiqetmə mövcuddur [2, 10]. Əsas qayda budur ki, təxmini orijinal məlumat nöqtələrini (alt hissəsini) ehtiva etməlidir və bütün orijinal məlumat nöqtələri təxmini qədər müəyyən edilmiş məsafədə olmalıdır.

Şəkil 1.a-da göstərildiyi kimi bir polyline P və bir tolerantlıq e verilmişdir. Douglas-Peucker alqoritmi, birinci v-yə qoşulan tək sətir seqmentindən başlayaraq iyerarxik bir quruluşa malikdir.1 və son vn orijinal polilin zirvələri (Şəkil 1.b). Sonra qalan təpələr onun yaxın hissəsinə yaxınlığı üçün yoxlanılır. Seqmentdən kənarda müəyyən edilmiş bir tolerantlıqdan daha uzundursa, vertex vmən ondan ən uzağı əvvəllər sadələşdirilmiş polilin əlavə olunur. Bu, orijinal polyline üçün yeni bir təxmini yaradır (Şəkil 1.c). Rekursiv şəkildə bu proses hər bir yaxınlaşan xətt seqmenti üçün (Şəkil 1.d, e) orijinal polilin bütün təpələri yaxınlıq şərtini təmin edənə qədər davam edir (Şəkil 1.f).


Əhalinin siyahıyaalınmasının UKBORDERS məlumatlarından çox miqyaslı məhsulların çıxarılması üçün ümumiləşdirmə alqoritmlərini öz-özünə qiymətləndirir.

Tədqiqatın məqsədi böyük həcmli coğrafi məlumatların internet üzərindən sürətli yayılması problemlərini həll etməkdir. Konkret olaraq, coğrafi məlumat tələbinə cavab olaraq ötürülən məlumat həcminin azaldılması yolları. Məlumatların həcminin azaldılması ötürülməni sürətləndirmək və sürətli təhlili və ekranı asanlaşdırmaq üçün tələb olunur. Tədqiqat, bu prosesi avtomatlaşdırmaq üçün məlumatların yer dəqiqliyini tənzimləyən ciddi keyfiyyət nəzarətlərinə və hər bir yerlə əlaqəli məlumatların tamlığına riayət edən özünü qiymətləndirmə alqoritmlərinin inkişafı ilə bağlıdır. Bu cür alqoritmlər insanın müdaxilə ehtiyacını aradan qaldırır ki, bu da çox vaxt aparır və keyfiyyətli bir nəticəyə zəmanət vermir. Tədqiqat, 2001 siyahıyaalma rəqəmsal sərhəd məlumatları (ESRC və JISC tərəfindən dəstəklənən) üçün UKBORDERS on-line giriş sisteminin dəstəklənməsi məqsədi ilə həyata keçirilmişdir və Edinburq Universitetinin Məlumat Kitabxanası ilə əməkdaşlıq edilmişdir. Bu müvəffəqiyyət, 2001-ci il siyahıyaalma sərhəd məlumatlarının geniş mənimsənilməsi və istifadəsi üçün və bir sıra miqyasda və mövzularda məlumatların təqdimatı və təhlili üçün vacibdir. Tədqiqat, məsələn, NLIS və ScotLIS kimi milli məlumat bazalarının yaradılmasında daha geniş məlumat inteqrasiyası məsələləri üçün əsasdır, burada fərqli miqyaslı, qətnamə və məlumat tərkibli məlumat mənbələrini birləşdirmək lazım olacaqdır.

1. Giriş

UKBORDERS, İngiltərədəki Ali Təhsil işçiləri və tələbələrinə təxminən yarım milyon fərqli sahəni izah edən rəqəmsal sərhəd məlumatlarına (DBD) parol nəzarətində olan bir onlayn məlumat xidmətidir. Bu milli xidmət ESRC və ali təhsilin maliyyələşdirmə şuralarının (JISC) Birgə Məlumat Sistemləri Komitəsi tərəfindən birgə dəstəklənir və Edinburq Universitetinin Məlumat Kitabxanasının (EDINA) ev sahibliyi etdiyi milli xidmətlərin bir hissəsi olaraq təqdim olunur. UKBORDERS-in 112 ali təhsil müəssisəsində 1200-dən çox qeydiyyatdan keçmiş istifadəçisi var. DBD İnternet üzərindən standart fayl ötürmə protokollarından istifadə edərək bir sıra formatlarda çatdırılır. Rəqəmsal sərhəd məlumatlarına 1991-ci il siyahıyaalmanın sayım bölgələri və çıxış sahələri və Şotlandiya üçün poçt kodu sərhədləri daxildir. Bunlardan 'bina daşları' olaraq istifadə edərək, siyahıyaalma, inzibati, seçki və poçt sahələrini əhatə edən daha yüksək sərhədlər yaradıla bilər. Sərhəd məlumatlarına bir sıra toplanışlarda çatmaq olar. İngiltərə və Galler üçün ən yaxşı miqyas sayım vahidi və ən qabaq bölgələr səviyyəsidir (Cədvəl1). Bu məlumat cədvəlləri Şotlandiya (GRO) və EDLINE konsorsiumu üçün siyahıyaalma idarəsi tərəfindən yaradılıb və UKBORDERS sistemi ilə təmin edilir.

İngiltərə Uels Şotlandiya
Ölkələr: 46Ölkələr: 8Bölgələr / ada sahələri: 12
Bölgələr: 366Bölgələr: 37Bölgələr: 56
Seçki otaqları: 8.985Seçki otaqları: 945 Saxta sektorlar: 1.003
Sayım bölgələri: 106.866Sayım bölgələri: 6,330 Çıxış sahələri: 38,255
Saxlayın Kodu vahidi: 132,080

Cədvəl 1. UKBORDERS vasitəsilə mövcud olan sərhəd növləri. Denhamdan uyarlandı (1993, s.58)

2. İstifadənin məzmunu

Məlumatlar menyuda idarə olunan interfeys vasitəsilə seçilir və tələb olunan fayllar ArcInfo istifadə edərək yaradılır. İstifadəçi əvvəlcə coğrafi dərəcəni bölgələr, bölgələr və ya seçki dairələri baxımından müəyyənləşdirərək sərhədləri ayırmalıdır. İstifadəçi daha sonra coğrafi bölgəni doldurmaq üçün istifadə olunan məlumatların detallarını seçməli, bölgələr, seçki dairələri və ya siyahı bölgələri baxımından təyin etməlidir. İstifadəçi seçimini etdikdən sonra, məlumatlarının bir nüsxəsi UKBBORDERS ftp saytında müvəqqəti saxlanc yerində bir həftə müddətində istifadəçi öz saytına yükləyə biləcəyi müddət ərzində saxlanılır.

Bir istifadəçinin UKBORDERS istifadə edərək seçməsi üçün mümkün olan minimum coğrafi ölçü tək bir bölgədir. Bununla birlikdə, birdən çox bölgə və ya bölgə seçilərsə, bunlar seçilmiş bütün fərdi məlumat dəstlərindən birləşdirilərək istifadəçinin ftp saytından yükləyə biləcəyi yeni bir sərhəd məlumat dəsti meydana gətirəcəkdir. Bu fayllar olduqca böyük ola bilər. Məsələn İngiltərə və Galleri əhatə edən bölgə sərhədləri üçün fayl ölçüsü 33 Megabaytdır və 1,3 milyon zirvədən ibarətdir.

3. Problem Bəyanatı

Rəqəmsal sərhədlərin tam 'kitabxanası' ölçüsü təxminən 1-2 gigabaytdır. Kitabxananın böyük ölçüsü qismən baza sərhəd məlumatlarının təyin olunduğu incə coğrafi dəqiqliyə görədir. İstifadəçi istəkləri (adətən tam kitabxananın alt qrupları) (1) böyük bir coğrafi dərəcəni əhatə edə bilər (2) kompleks sərhədlər bölgəsi (xüsusən də sahil xəttinin qarmaqarışıq hissəsini və ya çox sayda kiçik çoxbucaqlı olan şəhər ərazisini ehtiva edənlər) və ya (3) şəklini təyin edən nöqtələrlə sıx məskunlaşmış çox sayda daha qısa xəttdən ibarət olan sərhəd məlumat dəsti. Bu cür sənədlər (1) yaddaş məhdudluğu və ya proqram dizaynı səbəbindən müştəri proqramının sıradan çıxmasına səbəb ola bilər, (2) İnternet üzərindən ötürülməsi uzun müddətə, (3) ekran görüntüsü və interaktiv istifadə üçün uzun müddət yüklənə bilər. Buna görə, məlumatların miqdarını azaldan, lakin xarakterik formasını itirmədən və siyahıyaalma atributları ilə daha da təhlil və inteqrasiyada istifadəsini pozmayan interaktiv seçim prosesinin bir hissəsi kimi sadələşdirmə qurğusunun inkişafına ehtiyac var.

Bu səbəbdən bu tədqiqatın məqsədi, məlumatların mümkün qədər geniş istifadəsini təşviq etmək, yükləmə müddətini minimuma endirmək və çox böyük məlumat dəstləri ilə dinamik qarşılıqlı əlaqəni təmin etmək üçün məlumatların həcmini azaltma üsullarını inkişaf etdirmək idi. Bununla belə, bu, hər zaman sadə bir iş deyil, çünki siyahıyaalma məlumatlarının sahəyə xas təbiəti (və onların mütəxəssis istifadəsi), məlumat həcminin necə azaldılacağına dair ciddi məhdudiyyətlər qoyur. Məsələn, çoxbucaqlıların sökülməsi və ya birləşdirilməsi mümkün deyil və əlavə çoxbucaqlılar məlumatların azaldılması prosesinin yan məhsulu kimi yaradılmamalıdır, çünki çoxbucaqlıların itirilməsi sərhəd verilənlər bazası ilə siyahıyaalma atributu verilənlər bazası arasındakı əlaqənin itirilməsinə səbəb olacaqdır. əlavə çoxbucaqlılar xəritə boşluğunun artıq tükənməməsi və sərhədlərin saxta olması deməkdir.

4. Əvvəlki Tədqiqat

Əvvəlki tədqiqatlar, istifadəçinin məlumat azaltma həddini seçməsinə icazə verməyin təhlükələrini vurğuladı, çünki məlumatlar onsuz da daha da azaldılmayan bir formada ola bilər. Bu səbəbdən tədqiqatın əsas məqsədi məlumatların dəyişkən təbiəti və xüsusiyyətləri nəzərə alınmaqla, fayl ölçüsünün azaldılmasını optimallaşdıran güclü bir özünü qiymətləndirən alqoritmlərin hazırlanması idi. Bu şəkildə, fərqli hissələr kimi deyil, bütövlükdə əhatə dairəsini sadələşdirən kommersiya CİS sadələşdirmə rutinlərinin standart parametrlərini əhəmiyyətli dərəcədə inkişaf etdirə bilər. Hər hansı bir inkişaf etdirilmiş sadələşdirmə qaydası üçün problem, məlumat bazasının bütövlüyü və tamlığı baxımından keyfiyyətə kifayət qədər nəzarəti təmin etməkdir, faylların mürəkkəbliyini və ölçüsünü azaltmaqla, xəritələnən əraziyə məxsus statistika ilə əlaqə itkisi olmayacaqdır. Bu səbəbdən istifadə kontekstində alqoritmin möhkəm olması və hər vəziyyətdə 'işlək' bir həll təmin edilməsi tələb olunurdu.

Xəritənin ümumiləşdirilməsi məsələləri üzərində araşdırmalar 30 il ərzində aparılmışdır (Muller 1991) çox sayda yanaşma, o cümlədən ağıllı xəritə agentləri (Baeijs et al 1996) və obyekt yönümlü yanaşmalar (Ormsby and Mackaness 1998) istifadəsi nəzərə alınmışdır. Bütün bu yanaşmaların arxasında duran məqsəd, çox miqyaslı məhsulların vahid bir məlumat bazasından çıxarılmasıdır. Obyektləri yerindən çıxarmaq üçün (Mackaness 1994), şəbəkələri sadələşdirmək üçün (Mackaness and Mackechnie 1998), çoxbucaqlı məlumatları sadələşdirmək üçün (Bader and Weibel 1997) və bölgələri ümumiləşdirmək üçün (Muller and Wang 1992) müxtəlif spesifik alqoritmlər mövcuddur. Lakin bu alqoritmlərin avtomatik parametrləşdirilməsi və nəticədə alınan məhsulların keyfiyyətinin tutarlılıq, tamlıq, nisbi yer və atribut dəqiqliyi baxımından qiymətləndirilməsi üçün tələb olunan təhlili araşdıran çox az iş var (Muller 1991). Bu və digər tədbirlər (xəritə homojenliyi və gestalt kimi) davranışları proqnozlaşdırıla bilən və qiymətləndirilə bilən alqoritmlərin qurulması üçün vacibdir. Bu cür qiymətləndirmə mexanizmləri olmadıqda, alqoritmlərin özünü qiymətləndirmə qabiliyyətinə sahib olduğu avtomatlaşdırılmış mühitlər yaratmaq mümkün deyil.Nəticə, "kömək edən", lakin istifadəçini əvəz etməyən bir CBS ilə çox zəhmət tələb edən sessiyalardır (Medyckj-Scott və Hearnshaw 1993). Təhlil və avtomatlaşdırılmış qiymətləndirmə olmadığı təqdirdə, bu sadələşdirmə alqoritmlərinin qiymətləndirilməsi yorucu və özü də səhvlərə meylli olan vizual qiymətləndirmə formasını alır (Painho 1995). Bu tədqiqatın Painho (1995) tərəfindən təsvir edilən şəkildə istifadəçinin iştirakına olan ehtiyacını aradan qaldıran analiz və qiymətləndirmə alqoritmlərinin inkişafına mühüm töhfə verdiyi düşünülür. Bundan əlavə, tədqiqat çoxsaylı ümumiləşdirmə operatorlarını tətbiq etmək üçün prosedur və bilik əsaslı texnika tətbiq edən avtomatlaşdırılmış kartoqrafik həllərin optimallaşdırılması sahəsinə öz töhfəsini verir (bax: Wang and Muller, 1998).

5. Analiz, Sintez, Qiymətləndirmə

Özünü qiymətləndirmə alqoritminin inkişafında qəbul edilən əsas metodologiya üç mərhələli bir proses kimi qiymətləndirildi: analiz, sintez və qiymətləndirmə. Birinci mərhələ (analiz) müəyyən bir məlumat bazasının daxili və unikal xüsusiyyətlərini müəyyənləşdirməyi hədəfləyir. Verilənlər bazasının homojenliyini müəyyənləşdirmək üçün sərhəd xəttindəki nöqtələrin sayının orta və standart sapması və sərhədin qövs seqmentinin orta uzunluğu kimi statistik xüsusiyyətlər ölçülmüşdür. Bir sıra məlumat dəstlərinin empirik təhlili nəticəsində bir ərazi bağlamasının hüdudlarının bir sıra xüsusiyyətlərini araşdıraraq xəritənin şəhər bölgələrini kənd bölgələrindən ayırmaq mümkün olduğu aydın oldu. Məsələn, şəhər sərhədləri ümumiyyətlə antropogen bir görünüşə sahib idi. Ümumiyyətlə bu görünüş xəttdəki təpələrin sayı ilə hesablana bilər. Bu məlumatlar, verilənlər bazasının tamamilə şəhər, tamamilə kənd və ya bu iki kateqoriyanın qarışığı olub olmadığına əsasən uyğun bir alqoritm seçmək üçün istifadə edilmişdir. Bu testi həyata keçirmək üçün tətbiq olunan qaydalar, bir qövs başına orta zirvələrin sayı az olduqda (15 təpə və ya daha az) və əlaqəli standart sapma eyni dərəcədə kiçik olduqda, verilənlər bazasının homogen sayıldığı. Bu bircinsli verilənlər bazasında bir qövsün orta uzunluğu araşdırılıb 400 metrdən az olduğu aşkar edildikdə, verilənlər bazası da tamamilə şəhər hesab edilmişdir. Dəstin qarışıq olduğu və bu səbəbdən homojen olmadığı aşkar edilərsə, tərkibindəki şəhər və kənd hissələrinə bölündü. Bu, 15 təpədən az olan və daha çox olanı olan yaylar arasında fərq qoyaraq həyata keçirilmişdir. Bu iki hissə daha sonra əlaqəli kənd və şəhər alqoritmi rutinlərinə ötürüldü. Təsnifat dəyərləri empirik olaraq müəyyən edilmişdir. Şəhər ərazilərində sərhədlərin antropogen xüsusiyyətləri (əsasən yollar) izlədikləri və bu səbəbdən sərhədlərin çaylar kimi daha təbii xüsusiyyətlərə söykənən digər kənd ərazilərindən xeyli az zirvələrə sahib olduqları müşahidə edilmişdir. Kategoriyalar arasındakı fərqlilik, istifadə ediləcək daha uyğun bir parametr seçilməsinə imkan verərək, prosesi bütün verilənlər bazasına tətbiq ediləcək bir parametr seçməyindən daha dəqiqləşdirir. Sadələşdirmə rutinləri özləri bir tolerantlıq parametri əldə etmək üçün alt qurulmuş məlumat dəstlərindən hesablanmış əlavə statistik məlumatları istifadə etdilər. Müvafiq bir parametr əldə etmək üsulları tədqiqatın əsas diqqət mərkəzində idi və daha sonra ətraflı şəkildə göstərilmişdir.

İkinci mərhələ analiz mərhələsindəki məlumatları istifadə edərək bir həll (sintez) yaratmaq idi. Tədqiqatın praktiki məsələsi zaman məhdudiyyəti, proqram təminatı, möhkəmlik və məlumat bütövlüyü daxilində məlumatların azaldılması üçün bir alqoritm hazırlamaq idi. Zamanın məhdudluğu alqoritmin İnternet ötürülməsi üçün gözlənilən ağlabatan bir müddət ərzində işləməsini tələb edirdi. Proqramın məhdudluğu, alqoritmin ArcInfo GIS proqramından istifadə edərək həyata keçirildiyi deməkdir, çünki bu məlumatların saxlandığı formatdır. Verilənlərin məhdudluğu alqoritmin müstəsna sərhəd ayırmalarının və məlumat dəstlərindəki uyğunsuzluqların və səhvlərin öhdəsindən gələ bilməsi demək idi. ya özünəməxsus olan və ya aşağı səviyyəli inzibati vahidlərdən daha yüksək səviyyəli sərhədlər qurma prosesi ilə yaradılan Alqoritmin dizaynındakı möhkəmlik tələbi, sadələşdirmə alqoritmi hər dəfə çağırıldıqda işlənən bir həll tələb olunduğunu göstərirdi. Bəzi hallarda, məlumatların azaldılmış formada olması halında, məlumatların sadələşdirilməsi bütövlüyünü poza biləcəyi üçün həll yolu verilənlər bazasının sadələşdirilməmiş formasını qaytarmaq ola bilər. Əksər məlumat dəstləri üçün həll, verilənlər bazasının ən azı bir hissəsini sadələşdirmək və onları birləşdirmək idi. Metod tolerantlıq parametrinin optimal seçimi yolu ilə məqbul bir həll təmin etməyi hədəf alarkən, məlumatların azaldılması məhsulları ilə istənməyən hadisələrin baş verməməsinə zəmanət vermək mümkün deyildi. Sadələşdirmə prosesi nəticəsində bu topoloji uyğunsuzluqlar yarandıqda, az sayda təsirlənmiş sətri çıxarmaq və onları orijinal forması ilə əvəz etmək üçün verilənlər bazasına daha bir alqoritm qaydası tətbiq edildi. Bu proses daha sonra izah olunur.

Nəticə həllinin göstərilən meyarlara uyğun gəldiyini təmin etmək üçün qiymətləndirildi. Əgər uğursuz olarsa, sadələşdirildikdən sonra daha çox poliqon olduğundan istifadəçiyə prosedurun uğursuz olduğu və orijinal məlumatlarla təmin edildiyi bildirildi. Bu qiymətləndirmə mərhələsi, istifadəçinin edilmiş dəyişiklikləri qiymətləndirə bilməsi üçün verilənlər bazasında baş verən dəyişiklikləri əks etdirən bir meta məlumat sənədinin yaradılmasını əhatə edir. Belə bir sənədin nümunəsi Şəkil 9-da göstərilmişdir. Bu üç mərhələli metodologiya xəttin sadələşdirilməsi üçün Douglas-Peucker alqoritmi ətrafında qurulmuşdur (aşağıda təsvir edilmişdir). Vurğulanmalıdır ki, istənilən sayda alternativ sadələşdirmə alqoritmi istifadə oluna bilərdi, lakin bu tədqiqatın məqsədi sadələşdirmə alqoritminin özündən çox təhlil və özünü qiymətləndirmə metodologiyasına yönəlmişdi.

6. Bir xətti təmsil etmək üçün istifadə olunan nöqtələrin sayının azaldılması

Douglas-Puecker alqoritmi (Douglas və Puecker, 1973) təkrarlanan bir şəkildə ardıcıl şəkildə rəqəmsal bir xətt çəkərək və bu nümayəndəliyin müəyyən bir tolerantlıq dəhlizində olan bütün nöqtələri aradan qaldıraraq işləyir. Tipik olaraq bir tolerantlıq seçimi, metodların böyük ölçüdə subyektiv bir elementidir ki, modellərin parametrləşdirilməsi, nəticədə ortaya çıxan xəritələri vizual olaraq yoxlamaq və fərqli tolerantlıqlar ilə təcrübə etməklə həyata keçirilən intuitiv bir məşqdir. Əllə götürüldükdə bu çətin və potensial etibarsız bir işdir (Buttenfield, 1991, Zhan və Buttenfield 1996). Tədqiqatın vacib bir elementi bu tolerantlıq parametrinin istifadəçi tərəfindən özbaşına seçilməsindən fərqli olaraq, verilənlər bazasının xüsusi xüsusiyyətləri ilə əlaqəli olması üçün avtomatlaşdırılmış vasitələrlə seçilməsi üçün texnika təmin etmək idi. Əvvəlcə sadələşdirmənin məlumat həcminə və məlumat həllinə təsirlərini müəyyənləşdirmək lazım idi. Əvvəlcə analiz tək sətrin xüsusiyyətləri ilə məhdudlaşdırılmışdır. Bununla birlikdə, sətir-sətirdə dözümlülük dəyərləri təyin etmək üçün işləmə xərcləri çox böyük idi. Xətt formalarının çeşidi standart CİS funksiyalarından əldə olunan statistik məlumatlardan istifadə etməklə sətirlərin təsnifatını təmin etmək üçün çox mürəkkəb idi (Buttenfield, 1985). Alternativ bir yanaşma olaraq, tipik istifadəçi sorğularını əks etdirən bir sıra məlumat dəstlərindən istifadə edərək məlumatların toplanması səviyyəsində statistik təhlillər aparıldı.

7. Test məlumatlarının sadələşdirilməsindən müşahidələr

Verilənlər bazasındakı dəyişikliklərin riyazi funksiyalarla necə yaxınlaşdırılacağını və bu funksiyalarla məlumat dəstlərinin xüsusiyyətləri arasında hansı əlaqələrin ola biləcəyini müəyyənləşdirmək üçün 17 test məlumat dəstindən istifadə etməklə bir sıra təcrübələr aparılmışdır. Dözümlülük baxımından ümumi xətt uzunluğu və ümumi təpə sayındakı dəyişikliklər, bunlar araşdırıldıqdan sonra məlumat keyfiyyətində dəyişiklik və məlumat həcmində dəyişiklik ölçüsünü təmin etdi. Məlumat dəstləri əvvəlcə uzunluq dəyişikliyinə və zirvələrin sayının dəyişməsinə dözümlülük dəyişikliyi ilə əlaqəli tənlikləri təyin etmək üçün ən kiçik kvadratlar reqressiyasından istifadə edərək fərdi olaraq təhlil edildi. Daha sonra, məlumat dəstlərinin müxtəlif təxmini əlaqələrin əmsalı və əlaqələri arasındakı əlaqələri tapmağa çalışmaq üçün birlikdə təhlil edildiyi məlumat dəstləri. Bu analiz münasibətləri müəyyənləşdirmək üçün yenidən ən kiçik kvadratlar reqressiyasından istifadə etdi. Test məlumat dəstlərindən dördünün tipik profilləri Şəkil 1-də verilmişdir, tolerantlıq funksiyası olaraq zirvələrin sayının azalmasını göstərir. Şəkil 2 cəmi xətt uzunluğu ilə artan tolerantlıq arasındakı əlaqəni göstərir. Şəkil 3, üç ölçülü bir əlaqənin iki ölçülü bir qrafasıdır və 1 ilə 50 metr arasında istifadə olunan hər bir tolerantlıq dəyəri üçün ümumi uzunluğa qarşı zirvələr qurur. Döngədə bir tolerantlıq dəyərinin alt hissəsi etiketlənir. Aydınlıq səbəbi ilə yalnız Dorset ilçe palataları üçün nəticə göstərilir (digər nümunələr oxşar profillər yaradır).

Şəkil 1 Bir sıra məlumat dəstləri üçün sadələşdirilmiş dözümlülük funksiyası kimi zirvələrin azaldılması.

Şəkil 2 Bir sıra test məlumat dəstləri üçün sadələşdirilmiş dözümlülük funksiyası olaraq ümumi uzunluğun faizində azalma.

Şəkil 3. Dorset ilçe palataları üçün ümumi uzunluq, təpə sayı və sadələşdirmə toleransları arasındakı əlaqə.

Şəkil 1 toleransların artması ilə zirvələrdəki itkinin eksponent nisbətdə getdiyini və bu xüsusi profilin hər bir fərdi verilənlər bazasının xüsusiyyətləri ilə müəyyən edilmiş bir amil olduğunu göstərir. Bu əlaqənin ümumi formasının y = ax -b funksiyası ilə ən yaxşı şəkildə tapıldığı aşkar edilmişdir. Şəkil 2 cəmi xətt uzunluğundakı itkinin tolerantlığın artmasına təxminən xətti olan bir sürətlə getdiyini göstərir, ümumi y = ax + b şəklində bir əlaqə. Burada yenə də bu funksiyanın xüsusi gradientinin (a) hər bir fərdi verilənlər bazası ilə fərqləndiyi aşkar edildi. Əslində, Şəkil 3 aşağı toleransların təpə nömrələrində yüksək dəyişiklik və ümumi xətt uzunluğunda aşağı dəyişikliklər yaratdığını göstərir (Şəkil 3-də 1 ilə 10 arasındakı tolerantlıq dəyərləri). Ancaq daha yüksək toleranslar üçün ümumi xətt uzunluğunda sürətlə artan bir itkiyə görə getdikcə daha az zirvələr silinir.

Bu müşahidələrdən sonra növbəti mərhələ sadələşdirmə alqoritminin tolerantlığını seçmək üçün istifadə edilə bilən üsulları inkişaf etdirmək idi. İki fərqli yanaşmadan istifadə edərək tolerantlıq dəyəri seçilə bilər. Birincisi, keyfiyyət itkisini minimuma endirən bir tolerantlıq seçməkdir. İkincisi, həcmi azaltmağı optimallaşdıran bir tolerantlıq seçməkdir. Xətt uzunluğundakı dəyişikliklər, verilənlər bazasının keyfiyyətindəki dəyişikliklərin əvəzedici göstəricisidir və vertex nömrələrindəki azalma, fayl ölçüsünün azaldılması üçün bir əsasdır. Bu nəzarətləri idarə etmək üçün üç texnika araşdırıldı. Birincisi, ümumi xətt uzunluğundakı dəyişikliyi və digər iki model vertex nömrələrindəki dəyişikliklərdən istifadə edərək modellenmiş toleransları istifadə etdi. Bu üç yanaşma aşağıda təsvir edilmişdir.

8. Məlumat keyfiyyətinə nəzarət olunan ümumiləşdirmə

Veritlərin zirvələrlə xətt uzunluğu itkisinə dair təhlili, test verilənlər dəstlərinin əksəriyyətində məlumatların keyfiyyətinin itirilmədən bir hissəsinin silinə biləcəyini ortaya çıxardı. Bu müşahidə, Döngənin yuxarı hissəsindəki qısa düz 'yayla' şəklində təmsil olunan Şəkil 4-də göstərilmişdir. Düz hissə, təpələrin itkisini, lakin xəttin dikləşdiyi nöqtəyə qədər cüzi bir uzunluq itkisini təmsil edir. Nəzəri olaraq bu 'plato' da ortaya çıxa bilər, çünki karikatura edilmiş xəttin tolerantlıq dəhlizində heç bir təpə yox idi, çünki tolerantlıq hər hansı bir məlumat nöqtəsini süzmək üçün çox kiçik ola bilər. Bununla birlikdə, eksperimental sahələr arasındakı müqayisə, uyğun tolerantlıq aralıkları üçün vertex saylarında əhəmiyyətli bir azalma olduğunu göstərdi və bunun belə olmadığını göstərdi. Hadisələr sərhəd məlumatlarını göstərmək üçün həddindən artıq məlumat nöqtələrindən istifadə olunduğu üçün baş verir. Bu, məlumatların toplanması prosesində axının rəqəmsallaşdırılması və ya tarama üsulu ilə baş verə bilər (Barber və digərləri, 1995, Herbert və digərləri, 1992).

Şəkil 4. Keyfiyyətə nəzarət olunan sadələşdirmə üçün tolerantlıq seçimi prosesinin təsviri.

Çətinlik, xəttin dik olduğu nöqtədə, yəni xətt uzunluğunun itirilməsinə başladığı nöqtədə tolerantlıq dəyərini tapmaqdır. Düz xətt üçün tənlik, müxtəlif toleranslardan istifadə edərək verilənlər bazasının iki dəfə sadələşdirilməsi ilə müəyyən edilmişdir. Bu tənlikdən istifadə edərək, bu sətrin nöqtəsini sadələşdirmədən əvvəl ümumi sətir uzunluğuna bərabər olan bir tolerans müəyyən edilə bilər. Şəkil 4 bunun necə əldə edildiyini şematik olaraq göstərir.

9. Məlumat həcminə nəzarət olunan ümumiləşdirmə

Həcm nəzarətli ümumiləşdirmə keyfiyyətə nəzarət yanaşmasının alternatividir. Bu yanaşma məlumat məcmuələrini kollektiv olaraq nəzərdən keçirdi və fərdi məlumatların xüsusiyyətlərindəki dəyişikliklərin məlumat nöqtələrinin sayının azalması ilə dəyişən tolerantlıqla əlaqəsini necə təsir edə biləcəyini araşdırdı. Əvvəllər müşahidə edildiyi kimi, bu əlaqə y = ax -b təxmini funksiyanın a və b əmsalları ilə müəyyən edilmişdir. Bu səbəbdən verilənlər bazası üçün müvafiq a və b əmsalları ilə əlaqəli olduğu hər bir məlumat bazasının fərqli xüsusiyyətləri. Daha sonra ən kiçik kvadratlar reqressiyasından istifadə edərək məlumat dəstləri arasında bir əlaqə axtarıldı. Bir əmsalın ümumi təpələr sayına xətti olaraq korrelyasiya etdiyi aşkar edildi. Bunun y = ax -b funksiyasında x bir olduğu zaman a olacağı gözləniləndir, çünki istənilən gücə qaldırılan birə bərabər olacaqdır. B katsayısının hər sətir üçün orta sətir sayının xassəsi ilə ən yaxşı əlaqəsi olduğu aşkar edildi. Bu əlaqə, xəttin orta mürəkkəbliyi azaldıqca nöqtələrin itirilmə nisbətində eksponent bir azalma olduğunu göstərir. Şəkil 5, 17 məlumat dəsti üçün b əmsalı parametrləşdirilməsini təsvir edir.

Şəkil 5. Sabit b və bir yay başına orta zirvələrin sayı arasındakı əlaqə.

Funksiya əmsallarının təhlili və parametrləşdirilməsi o demək idi ki, zirvələrdə dəyişiklik sürətinin bir verilənlər bazasının ilkin şərtlərinə əsasən proqnozlaşdırıla bilər. Bundan sonra, istənilən məlumat azaldılması dərəcəsini əldə etmək üçün lazımi tolerantlığı proqnozlaşdırmaq üçün istifadə edilə bilər. Məsələn, empirik müşahidələr nəticəsində məlum olub ki, məlumat nöqtələrində% 50 azalma ilə uyğun gələn bir tolerantlıq əksər məlumat dəstlərini sadələşdirmək üçün kifayət qədər təhlükəsizdir. 'Təhlükəsiz' deməkdir ki, seçilmiş tolerantlığın vertex endiriminin ən sürətli olduğu aşağı toleranslar arasına düşməsi.

Dözümlülük seçiminə üçüncü yanaşma, tolerantlıqla təpələrin sayının azalmasının təhlilindən irəli gəldiyindən fərqli olaraq, son dözümlülük seçiminin daha az subyektiv olması üçün məlumat dəstinin xüsusiyyətlərinə daha çox diqqət yetirdi. ikinci texnika. Metod profil üçün optimal tolerantlıq dəyərini təyin etməyi hədəfləyir. Bu, təpələrin faiz sayındakı dəyişikliyin bir-birinə qarşı tolerantlığın dəyişməsinə bərabər olduğu nöqtədir. Bu nöqtə, Şəkil 6-dakı test məlumat dəstlərindən üçü üçün göstərilir və üç döngənin hər biri üçün mənşəyə ən yaxın olan əyri nöqtə kimi təsvir edilə bilər.

Şəkil 6. Fayl azaldılması üçün optimal nöqtəni təsvir etmək.

Bu 'dönüş nöqtəsi' nöqtələrin sayında sürətli azalma ilə daha da sadələşdirmənin forma itkisinə və öz-özünə kəsişməyə gətirib çıxaracağı sərhəd arasındakı keçidi qeyd etdi. Bu nöqtəni test məlumat dəstlərinin hər biri üçün çıxarmaq və sonra ən kiçik kvadratlar reqressiyasından istifadə edərək müvafiq məlumat xassəsi ilə əlaqələndirmək üçün analiz aparılmışdır. Ən uyğun əmlakın metrə görə zirvələri olduğu təsbit edildi. Şəkil 7, 17 məlumat dəstinin hər biri üçün optimal tolerans və metrə görə zirvələr arasındakı əlaqəni göstərir.

Şəkil 7 Ölçülmüş optimal tolerantlıq dəyərləri ilə metrə görə orta nöqtələrin sayı arasındakı əlaqə.

10. Kəsişən və öz-özünə kəsilən qövslərin çıxarılması

Dözümlülüyü əldə etmək üçün bu metodlardan istifadə edərək sadələşdirmə tamamilə hər bir vəziyyətdə öz-özünə kəsişmə halının olmayacağına zəmanət verə bilməzdi. Yenə də sağlam bir iş mühiti bunun belə olmasını istədi. Bu səbəbdən, alqoritm dizaynında, öz-özünə kəsişmənin sadələşdirmə prosesi nəticəsində meydana gəldiyi təqdirdə bu xarakterli ziddiyyətlərin aşkarlanması və yaxşılaşdırılması üçün bir texnikaya ehtiyac var idi. Hər hansı bir verilənlər bazası üçün çoxbucaqlıların xüsusiyyətlərindəki geniş dəyişikliyə görə seçilmiş tolerantlığın öz-özünə kəsişən hüdudlar yaratmayacağına zəmanət ola bilməz. Bu səbəbdən bir münaqişə ilə əlaqəli yayları çıxarmaq və onları orijinal, sadələşdirilməmiş xətləri ilə əvəz etmək üçün bir metod hazırlanmışdır. Şəkil 8. bu prosesi təsvir edir.

Şəkil 8. Topologiyanı qorumaq üçün istifadə edilən yenidən yerləşdirmə metodunun təsviri.

11. Seçmə texnikasının sadələşdirmə alqoritminə daxil edilməsi

Təhlil alqoritmdə tolerantlıq seçimini aparacaq üç texnika təqdim etdi. Alqoritmin ilkin versiyalarında yalnız uzunluqla idarə olunan texnika tətbiq olundu, çünki zirvələr idarə olunan alqoritmlər öz-özünə kəsişmə və sərhəd kəsişmə problemini qarşısını ala bilmədi. Uzunluq nəzarətində olan seçim, sərhəd xətlərinin heç birinin mövqeyini dəyişdirmədiyi üçün bu problemdən təsirlənmədi. Bununla birlikdə, silinə bilən məlumatların miqdarı məhdud idi və bu, verilənlər bazasında məlumatların saxlanılmasının ilkin səmərəliliyindən asılı idi. Həm də daha yavaşlaşdıran iki əlavə sadələşdirmə rutinin işləmə xərclərini əhatə etdi. Öz-özünə kəsişmə problemini aradan qaldırmaq üçün sonrakı bir rutin inkişafı məlumat həcminin idarə olunan sadələşdirilməsinin digər iki texnikasından istifadə edərək möhkəm bir alqoritmdən istifadə etməyə imkan verdi. Alqoritmin bu son versiyası alqoritm üçün tolerantlığı seçərkən hər iki texnikadan istifadə etmişdir. Alqoritm əvvəlcə zirvələrdə yüzdə 50 azalma əldə etmək üçün tələb olunan tolerantlığı hesabladı. Sonra verilənlər bazası üçün optimal tolerans hesablandı. Sonra iki toleransın alt hissəsi seçildi. Bu strategiya, təhlükəsiz tərəfdə səhv etmək üçün alqoritmdə yüzdə 50 azalma tavanını təyin etdi. Tavan müəyyən edilmişdi, çünki nümunə miqdarında daha çox məlumat həcminin azaldılmasına nail ola biləcəyimiz nümunələrdə, dözümlülüklə zirvələrin itkisini izah edən qradiyentdəki dəyişiklik nisbəti əvvəlcə çox dik idi. Bu səbəbdən proqnozlaşdırma üçün bir regresiya modelindən istifadə ilə əlaqəli qeyri-dəqiqliklərin həddindən artıq sadələşdirmə baxımından daha həddindən artıq nəticələrə sahib olduğu müşahidə edilə bilər. Bütün bu hallarda məlumatların azaldılmasının ən sürətli olduğu, lakin həddindən artıq sadələşdirmənin baş verməməsini təmin etmək üçün dəyişiklik nöqtəsindən kifayət qədər kənarlaşdırıldığı əyri bölgəsi daxilində olduğu üçün% 50 seçildi.

12. Alqoritmin nəticələri

Alqoritm on yeddi məlumat setində hərtərəfli sınaqdan keçirilmişdir. Hər nümunədə və sonrakı istifadədə alqoritm topoloji cəhətdən düzgün və dəqiq çoxbucaqlı və şəxsiyyət sayını saxlayan bir nəticəni təmin etdi. Fayl ölçüsündə azalma bəzi məlumat dəstləri üçün 80% -ə qədər, lakin daha çox% 20-40% arasında idi. Sadələşdirmədən əvvəl və sonra məlumat dəstləri arasındakı fərqlər görmə qabiliyyəti ilə fərqlənmirdi.Aydındır ki, bu yanaşma manuel yanaşmalarla müqayisədə çox əhəmiyyətli bir inkişafdır, çünki fayl ölçüsündə çox əhəmiyyətli azalmalara, forma saxlanmasına zəmanət verir, topologiyanın saxlanmasına zəmanət verir və buna heç bir müdaxilə, vizual yoxlama və ya istifadəçi ilə qarşılıqlı təsir olmadan nail olur.

13. Meta məlumatlar

Məlumat keyfiyyətinin qorunması tədqiqatın vacib bir məqsədi idi. Bu səbəbdən həyata keçirilən rutinin məqsədlərindən biri də sadələşdirmə nəticəsində meydana gələn məlumatlardakı dəyişikliklərin təfərrüatlarını təmin etmək idi. Bu, sadələşdirilmiş məlumatlar dəsti haqqında məlumatların meta məlumat sənədinə əlavə edilməsi ilə əldə edilmişdir. Meta məlumatların məqsədi istifadəçiyə məlumatdakı dəyişikliklərin bir göstəricisini təqdim etməkdir, beləliklə istifadəçiyə son məhsulun onların ehtiyaclarına uyğun olub-olmamasına qərar verməsinə kömək etməkdir. Şəkil 9 belə bir metadata faylının bir nümunəsini göstərir.

Şəkil 9. Sadələşdirmə qaydası ilə meta-fayla əlavə edilmiş məlumat nümunəsi, bu halda Uelsin Dyfed əyalətindəki sayım bölgələri üçün.

14. Nəticə

Beləliklə, son alqoritm çoxbucaqlıların qorunması, verilənlər bazasının homojen alt qruplara ayrılması və topoloji bütövlüyünün qorunması üçün bir qayda bazası sisteminin birləşməsi və alt qurulmuş məlumat dəstlərinin statistik xüsusiyyətlərinin qiymətləndirilməsi əsasında uyğun toleransların riyazi olaraq təyin edilməsi üçün bir komponent idi. Bu yanaşma, həm topoloji tutarlılıq, həm də üçüncü tərəf məlumat dəstləri ilə əlaqə baxımından məlumat dəstlərinin bütövlüyünü qorumaqla hədəflərini təmin etdi. Bu, kiçik poliqonları sadələşdirmədən qorumaq və kəsişən və ya öz-özünə kəsişən dəyişdirilmiş sərhəd xətlərini orijinal həndəsəsi ilə əvəz etmək üçün qaydaların tətbiqi ilə təmin edildi. Məlumatların azaldılmasını maksimuma çatdırmaqla yanaşı, məlumat keyfiyyətinin qorunması məqsədləri, məlumat nöqtələrinin əhəmiyyətli bir həcminin detal itkisinə qədər az xərclə silinə biləcəyinə dair empirik müşahidədən istifadə edilərək yerinə yetirildi. Bu müşahidə tolerantlıq baxımından optimallaşdırıldı. Detal itkisinin minimuma endirilməsi, eyni zamanda verilənlər bazasının tamlığının mümkün qədər qorunub saxlanmasını və beləliklə verilənlər bazasının son istifadəsi potensialında elastikliyin qorunmasını təmin etdi. Əlavə olaraq, verilənlər bazasının statistik xüsusiyyətlərindəki dəyişiklikləri qeydə alan kəmiyyət ölçüləri istifadəçiyə metadata kimi verilmişdir. Sağlamlığın məqsədi alqoritm tərəfindən bir sıra ilkin və sonrakı emal yoxlamaları və yaxşılaşdırılması yolu ilə həll edilmişdir. Bu, sadələşdirmənin verilənlər bazası üçün uyğun olmaması halında, məsələn, məlumatların əvvəlcə maksimum səmərəliliyində saxlanıldığı təqdirdə, orijinal məlumat bazasının qaytarılması deməkdir. Bu, səmərəlilik və möhkəmlik tələbləri ilə uzlaşır. Tədqiqat, insan müdaxiləsi olmadan bir xətt sadələşdirmə alqoritmi üçün parametrlərin avtomatik qiymətləndirilməsinə, qiymətləndirmə üsullarına və meta məlumatların verilməsinə yönəldildiyini vurğulamaq lazımdır. Məlumat dəstlərinin bu avtonom sadələşdirilməsi, daha tam avtomatlaşdırılmış mühitlərin təcrübə sahəsi GIS və avtomatlaşdırılmış kartoqrafiyadan kənarda ola biləcək daha geniş bir istifadəçi topluluğunu dəstəkləməsinin yolunu göstərir.

Təşəkkürlər

Müəlliflər, araşdırma qrantı H507255146, & quotÇox Ölçülü Sərhəd Dəstləri Almaq üçün Ümumiləşdirmə Alqoritmlərini Qiymətləndirərək Özümüzü Qiymətləndiririk & quot; mükafatını təqdim edən rəyçilərin şərhlərinə və bu layihənin İqtisadi və Sosial Araşdırmalar Şurasından maliyyələşdirilməsinə görə çox minnətdarıq. EDLİNE konsorsiumuna və GRO-ya verdiyi dəstəyə görə də minnətdarlıq bildirilir.

İstinadlar

Bader, M. və R. Weibel. 1997. Çoxbucaqlı xəritələrin ümumiləşdirilməsində ölçü və yaxınlıq ziddiyyətlərinin aşkarlanması və həlli. 18-ci ICA / ACI Beynəlxalq Kartoqrafiya Konfransı, c. 3, s. 1525-1532.

Baeijs, C., Y. Demazeau və L. Alvares. 1996. SIGMA: Çox Agent Sistemlərin Kartoqrafik Ümumiləşdirməyə Tətbiqi. Çox Agent Dünyada Muxtar Agentliklərin Modelləşdirilməsi üzrə 7-ci Avropa Çalıştayında, MAA-MAW'96, c. s. 163-176.

Barber, C, Cromley R. G və Andrle, R (1995). & quotKartoqrafik xətlərin çoxsaylı nümayişi üçün alternativ xətt sadələşdirmə stratergiyalarının qiymətləndirilməsi & quot; Kartoqrafiya və Coğrafi İnformasiya Sistemləri 22 (4): 276-290

Buttenfield, B. 1985. Kartoqrafik xəttin müalicəsi. Kartoqrafik, cild 22, yox. 2, s. 1-26.

Buttenfield, B. P. 1991. Xətt xüsusiyyət həndəsəsini təsvir etmək üçün bir qayda. Xəritənin ümumiləşdirilməsində: Biliyin təmsil olunması üçün qaydaların yaradılması, B. P. B. a. R. B. McMaster, (ed) Essex: Longman Scientific & amp Technical, s. 150-171.

Denham C (1993) & quotCensus Coğrafiya - bir baxış & quot; Dale, A & amp Marsh, C (eds) 1991 Census İstifadəçi Kılavuzu, London, HMSO

Douglas, D. H. və T. K. Peucker. 1973. Rəqəmsal xətt və ya karikatura şəklini göstərmək üçün lazım olan nöqtələrin sayının azaldılması üçün alqoritmlər. Kanadalı Kartoqraf, cild 10, yox. sf. 112-122.

Herbert, G., E. Joao və D. Rhind (1992). & quot Avtomatik Xətt Nəsilinin İstifadəçi Nəzarətini artırmaq üçün Süni Zəka Yanaşmasından istifadə & quot. EGIS '92, Münih, EGIS Vəqfi, 1, 554-563.

Mackaness, W. A. ​​1994. Avtomatlaşdırılmış Xəritənin Ümumiləşdirilməsində Münaqişələrin Təyini və Xüsusiyyətin Yer dəyişdirməsi Alqoritmi. Kartoqrafiya və Coğrafi İnformasiya Sistemləri, c. 21, yox. 4, s. 219-232.

Mackaness, W. A. ​​və G. Mackechnie. 1998. Avtomatik xəritə ümumiləşdirilməsində yol qovşaqlarının aşkarlanması və sadələşdirilməsi. GeoInformatica, cild yox. səh.

Medyckyj-Scott, D. və B. Morris. 1998. Virtual xəritə kitabxanası: İngiltərə Ali Təhsil Cəmiyyəti üçün WWW vasitəsilə Ordnance Survey rəqəmsal xəritə məlumatlarına giriş təmin etmək. Kompüterlər, Ətraf mühit və şəhər sistemləri. (mətbuatda)

Medyckyj-Scott, D. və H. M. Hearnshaw. 1993. Coğrafi İnformasiya Sistemlərində İnsan Faktorları. London: Belhaven Press.

Muller, J. C. 1991. Məkan verilənlər bazalarının ümumiləşdirilməsi. Coğrafi İnformasiya Sistemlərində D. J. Maguire, M. Goodchild və D. Rhind, (ed) London: Longman Scientific, s. 457-475.

Muller, J. C. 1991. 1990-cı illərdə Yeni Kartoqrafiyanın perspektivləri və maneələri. Kartoqrafiyadakı inkişaflar, J. C. Muller, (ed) London: Elsevier Tətbiqi Elm, s. I-14.

Muller, C. C. və W. Zeshen. 1992. Bölgə yamaqlı ümumiləşdirmə: rəqabətçi bir yanaşma. Kartoqrafik jurnal, c. 29, yox. Aralık, s. 137-144.

Ormsby, D. və Mackaness. W. A. ​​1998. Kartoqrafik Ümumiləşdirməyə Fenomenoloji Yanaşmanın İnkişafı. Kartoqrafiya və Coğrafi İnformasiya Sistemləri, c. Xüsusi buraxılış (mətbuatda), yox. səh.

Painho, M. 1995. Ümumiləşdirmənin Təbii Qaynaq Xəritələrində Xüsusiyyət Dəqiqliyinə Təsirləri. GIS və Ümumiləşdirmə: Metodologiya və Təcrübə, J. C. Muller, J. P. Lagrange və R. Weibel, (ed) London: Taylor and Francis

Wang, Z və Muller, J-C 1998. Forma Xüsusiyyətlərinin Təhlilinə əsaslanan Xətt Ümumiləşdirmə. Kartoqrafiya və Coğrafi İnformasiya Sistemləri, Cild. 25, № 1, s.3-15

Zhan, F. B. və B. P. Buttenfield. 1996. Rəqəmsal Xəttin Çox Ölçülü Təmsili. Kartoqrafiya və Coğrafi İnformasiya Sistemləri, c. 23, yox. 4, s. 206-228.


Videoya baxın: İfadələrin sadələşdirilməsi Toplu suallari dərslərdən geniş izah