Daha çox

ArcMap-da təsnifat vasitəsi ilə histoqram / statistika / dağılma sahəsi yaratmaq?

ArcMap-da təsnifat vasitəsi ilə histoqram / statistika / dağılma sahəsi yaratmaq?


Hazırda Landsat 8 görüntüləri ilə torpaq örtüyü təsnifatı üzərində işləyirəm. Artıq görüntüləri əvvəlcədən işlənməyə (atmosferik və topoqrafik düzəlişlər) tabe etdim və iki görüntüyə mozaika qoydum. İndi ArcMap-da bir təsnifat tətbiq etmək istəyirəm. Nə etməli olduğumu başa düşürəm, amma birtəhər statistikanı / histoqramları / dağınıq nöqtələrini yaratmaq üçün idarə edə bilmirəm. Statistikaya vurduğumda bütün dəyərlər sıfırdır. Digər tərəfdən raster təbəqələrinin xüsusiyyətlərinə baxdığımda, 'statistikanı hesabla' aləti ilə hesablanan statistikanı görə bilərəm. Heç bir histoqram yaratmır və səpələnmələr ekranın ortasında yalnız 1 nöqtədir. Kimsə mənim problemimin nə olduğunu və bunu necə həll edə biləcəyimi bilirmi?


Problem, təsnifat alətlər panelindəki uyğun raster qatını seçməməyiniz ola bilər.

Yalnız təsnifat alətlər çubuğunda vurğulanan raster qatını yoxlayın və bunun təsnif etmək istədiyiniz eyni raster olduğunu yoxlayın.


Rasteriniz üzən nöqtədirsə, bu problemlə qarşılaşacaqsınız. Beləliklə, onların tam ədədə olmasına ehtiyacınız var, Math aləti Int () bu işdə sizə kömək edəcəkdir.


Epidemiologiya və ArcGIS anlayışları - hissə 1

Peşəkar karyeramın çox hissəsini məkan təhlili və epidemiologiyada işləmişəm. Bunlar, məndən nə etdiyinizi soruşduqda tez-tez boş baxışlarla qarşılanan terminlər idi. Ancaq indi, illər keçdikcə nə demək istədiklərini izah etmək məcburiyyətində qaldıqdan və CIS ilə əlaqəli olan COVID-19 pandemiyası zamanı əvvəllər 'epidemiya əyrisi' kimi mütəxəssis terminləri gündəlik dilə daxil oldu. Buna görə bu mövzuda sürətli bir blog üçün mükəmməl bir vaxt kimi görünür.

Epidemiologiya bir sıra fərqli fənlərin kəsişməsində oturur və məsələn, səhiyyə, tibb və statistika sahələrindəki bilik və metodlardan istifadə edir. İnfeksion xəstəliklər, genetika, xroniki xəstəliklər və ətraf mühit və məkan epidemiologiyasına yönəlmiş geniş epidemiologiya çərçivəsində də çox sayda fən var. Xüsusilə ətraf mühit və məkan epidemiologiyası haqqında ehtirasla yaza bilsəm də, bu bloqu bir az daha ümumi saxlamağa çalışdım, amma (məkan) qərəzli olduğumu əvvəlcədən elan etməli olduğumu düşündüm. Ardıcıllıq üçün bu icmal zamanı aprel 2020-ci ildən etibarən COVID-19 nümunələrindən istifadə edərək epidemiologiyanı nümayiş etdirəcəyəm. ArcGIS Insights-ın epidemioloqun bəzi analitik ehtiyacları üçün necə güclü, eyni zamanda əlçatan bir həll təmin etdiyini, bunun necə ola biləcəyini də nümayiş etdirəcəyəm. geniş yayılmış digər epidemioloji yanaşmalarla vəhdətdə istifadə olunur və bunun geniş ictimaiyyətə və qərar qəbul edənlərə məlumatların çatdırılmasına necə kömək edə bilər.

Qısaca araşdıracağım on əsas mövzunu nümunələrlə müəyyənləşdirdim. Bunlar yalnız qəhvə fasiləsi uzunluğunda qalmaq üçün iki blog arasında bölünəcəkdir! Ümumilikdə, iki blog, analitik bir çərçivə təmin etmək üçün on əsas epidemioloji tədqiqat sahəsini və CİS-in əhatə dairəsini müəyyənləşdirdi. Hissə 1-də ilk beş sahəni təsvir edirəm. Hissə 2-də, on sahəyə daha beş sahə ilə tamamlayacağam.

Sağlamlıq məlumatlarının xüsusiyyətləri

Ən sadə sağlamlıq hadisəsi məlumatları da çox fərqli şəkildə toplanacaq, analiz ediləcək və hesabat veriləcəkdir. Xəstəliyin ümumi sayı və sağlamlıq hadisələrinin nisbəti tez-tez bir-birinin əvəzinə istifadə olunur, lakin hər biri çox fərqli məlumat verir.

Sağlamlıq tədbirlərinin ümumi sayı potensialın planlaşdırılması və maliyyələşdirilməsi üçün dəyərli ola bilər. Sağlamlığa reaksiya verildiyi zaman ölüm, doğuş və xəstəxanaya yerləşdirmə kimi sağlamlıq hadisələrinin sayı, lazım olan hər hansı bir profilaktik tədbirin miqdarını və ya həqiqətən ehtiyac duyulan səhiyyə xidmətini təyin etmək üçün dəyərlidir.

Əksər hallarda, sağlamlıq hadisələrinin sayı yalnız mənşə olduğu əhalinin ölçüsünə istinad edilərək başa düşülə bilər. Epidemiologiyada nisbət müəyyən bir müddətdə müəyyən bir populyasiyada baş verən hadisələrin tezliyidir. Buna görə dərəcələr, fərqli populyasiyalardakı sağlamlıq hadisələrini müqayisə etmək üçün faydalıdır.

Cəmi və dərəcələrin xəritələşdirilməsi, eyni zamanda mütənasib nisbət işarələri və choropletlərdən istifadə edərək fərqli texnika tələb edir. Xəritənizi göstərmək üçün istifadə olunan proyeksiya, xüsusən qiymətlər sahələrə görə göstərildiyi zaman dərəcələrə və xüsusən daha böyük sahələrə (yəni daha kiçik miqyaslı) baxılmalıdır.

Sağlamlıq məlumatlarının paylanması

Hər hansı bir modelləşdirmədən əvvəl məlumatların araşdırılması və yaxşı başa düşülməsi lazımdır. Bir çox yanaşma bir sıra fərziyyələrin yerinə yetirilməsini tələb edir. Sağlamlıq hadisələri ümumiyyətlə nadir hallarda rast gəlinən, bəzən təkrarlanan, xəstəxanaya yerləşdirmə hadisələri ilə xarakterizə olunur, bunlar normal yayılmamış, Poisson paylanması ilə olduqca müsbət əyilmişdir (Poisson paylanması nadir hadisələrin böyük bir populyasiyada yayılmasını təsvir etmək üçün istifadə olunur). Əksər sağlamlıq təhlillərində tez-tez güclü qarşılıqlı əlaqələr mövcuddur və məlumatların bir-birinə uyğunluğu bəzi metodlar üçün vacib bir fikirdir.

Veri dağılımlarını anlamaq üçün, əyri və kurtoz kimi statistika ilə birlikdə histoqramlar və qutular istifadə edilə bilər. Dəyişənlər arasındakı məlumat korrelyasiyaları dağınıq nöqtələr və dağınıq matrislərdən istifadə etməklə reqressiya analizindən asılı və müstəqil dəyişənlər arasındakı əlaqənin gücünü və istiqamətini qiymətləndirmək üçün istifadə edilə bilər. Məlumat boşluqlarını, nümunələri və ya əyri olub olmadığını yoxlamaq üçün məkan məlumatlarının paylanması da təhlil edilməlidir.

Bir histoqram ədədi məlumatların paylanmasını araşdırmağa imkan verir. Bunlar paylama formasının, mərkəzi meylin, məlumatların dəyişməsinin və məlumat dəyərlərindəki boşluqların və ya kənarların vizual qiymətləndirilməsinə imkan verir. Histograma orta, orta və normal paylanma kimi bəzi statistika əlavə edilə bilər. Verilər üzərində əlavə əlaqəli statistika da hesablana bilər və ArcGIS Insights-da, qrafiki ölçmək üçün qrafik kartlarının arxasına avtomatik olaraq daxil edilir. Normal paylanışa malik bir histoqram simmetrikdir və əyilmə dərəcəsi 0 olacaqdır. Tərkibin istiqaməti paylanmanın quyruğu ilə göstərilir, belə ki, sağdakı quyruq daha uzundursa (yuxarıda göstərildiyi kimi), əyrilik müsbətdir. Sol tərəfdəki quyruq daha uzundursa, əyilmə mənfi olur.

Qutu sahələri, paylanma müqayisəsinə imkan verən vəziyyət kimi kategorik bir dəyişənlə qruplaşdırıla bilər. Məlumatlar elə qurulub ki, məlumatların 50% -i alt (Q1) və yuxarı (Q3) dördlüyü arasındakı qutunun içərisində olsun və orta bir xətt olaraq göstərilsin. Bığlar, qutunun uzunluğu olan dördüncü aralığın (IQR) üstündə və altında daha 25% məlumat ehtiva edir (Üst kvartil - alt kvartil). 1.5 IQR-dən yuxarı olan dəyərlər daha yüksəkdir.

Verilənlərin vizual olaraq araşdırılması təhlilin əsas mərhələsidir və modelləşdirmə səhvlərini azalda bilər. Modelləşdirmə zamanı məlumatlar tez-tez analizdə statistik möhkəmliyə sahib olması üçün kifayət qədər məlumat nöqtələrinin olmasını təmin etmək üçün toplanır, lakin bu addım itkin məlumatları gizlədə bilər və ya xəstəliklərin kodlaşdırma praktikasının beynəlxalq təsnifatındakı dəyişikliklər kimi məlumat toplama dəyişikliklərini gizlədə bilər.

Fərqli vizuallaşdırmalar məlumatlara fərqli bir baxış bucağı verəcək və məlumatları çoxsaylı yollarla araşdırıb görselleştirebilmek, iş məlumatlarının bir çox aspektlərini anlamağa kömək edə bilər. Təhlil nə qədər çox iştirak edərsə, hər hansı bir modelləşdirmə aparılmadan əvvəl məlumatları təsvir etmək və görüntüləmək o qədər vacibdir.

Sağlamlıq məlumatlarının müvəqqəti ölçüləri

Epidemioloji məlumatlarla vaxt assosiasiyaları və nümunələri ən çox fasiləsiz tarix / vaxt məlumatları üçün sətir qrafikləri və ənənəvi olaraq boşluqlar olmadan çubuqlardan istifadə edən epidemiya əyriləri istifadə olunur.

Epidemik əyrilər xəstəliyin başlama tarixi ilə müqayisədə yeni hadisələrin tezliyini qrafik olaraq göstərir. Bir epidemiya və ya epi əyrisi x oxunda və şaquli olaraq, y oxu halların sayını göstərir. İstifadə olunan vaxt vahidi xəstəliyin inkubasiya dövrünə və hadisələrin paylandığı zamana əsaslanır. Döngənin ümumi forması baş vermə növünü aşkar edə bilər (məsələn, ümumi qaynaq, nöqtə mənbəyi və ya yayılmışdır).

Epidemioloji analizlər uzun müddət əhatə edən məlumatları əhatə edə bilər (kifayət qədər hadisələri və ya nadir nəticələri əldə etmək üçün), bunlar daxilində məlumat toplama metodologiyasında bir çox dəyişiklik ola bilər. Analiz prosesinin bir hissəsi olaraq giriş məlumatları yaxşı başa düşülməli və xüsusən də tam başa düşülə bilməyən mürəkkəb qarşılıqlı əlaqəli işlər üçün məhdudiyyətlər qeyd edilməlidir. Eyni, tərifinə görə, zəif başa düşülən yeni xəstəliklər üçün də ola bilər. Keçmiş məlumatlar və buna bənzər hadisələr məkana və zamana yayılan xəstəliklərin potensial nümunələrini anlamaq üçün istifadə edilsə də, erkən mərhələlərdə bildirilən məlumatlar naməlum (və qeyri-müəyyən) səhv və qeyri-müəyyənliyə meylli olacaqdır. Bu qeyri-müəyyənlik, əvvəlki hadisələrin əslində bənzər olub olmadığını və buna görə müqayisə edilə biləcəyini anlamağı çətinləşdirən əlavə təsir göstərir.

Müvəqqəti məlumatları bir zaman çizelgəsində görselləşdirmək, məsələn, məlumat toplanmasında məlumat boşluqlarını aşkar etməyə kömək edir. Məkan və zamana görə dəyişə bilən məlumatların təhlili həm təhlildən əvvəl həm müvəqqəti, həm də məkan baxımından qiymətləndirilmədən aparılmamalıdır.

Bir çox müvəqqəti təhlildə fərqli əhali alt qrupları arasındakı nümunələri qiymətləndirmək üçün onillik siyahıyaalma sorğularının nəticələri kimi ümumi məlumatlar istifadə ediləcəkdir. Ancaq siyahıyaalma ilindən nə qədər uzaq olsanız, bu məlumatların dəqiqliyi o qədər azalacaq. Bu məhdudiyyət qəbul edilməli olsa da, bilinən məlumatlar arasındakı müvəqqəti fərqləri araşdırmaq modelləşdirməyə və şərhə kömək edə bilər.

Fərqli sağlamlıq coğrafiyaları ilə məşğul olmaq

Müdaxilə və reaksiya sahələri epidemioloji analiz üçün istifadə olunan sahələrdən fərqli ola bilər, hər biri çox fərqli tələblərə malikdir. Cavab ehtiyacları, məsələn, sağlamlıq bölgələrindən qaynaqlana bilər, halbuki təhlil köməkçi məlumatların mövcudluğu və (əksər hallarda ehtimal olunur) bu ərazilərin sosial-iqtisadi homojenliyi sayəsində siyahıyaalma sahələri ilə daha yaxından uyğunlaşmağa meyllidir.

Məkan təhlili iş sahələrini (sahələrini) müəyyənləşdirmək üçün istifadə edilə bilər. Məlumatların süzülməsi xəritədən sahələr seçilərək və ya əlavə sərhəd məlumat dəstlərindən istifadə etməklə edilə bilər. Bu, məlumatları məruz qalan populyasiyalara və ya hallara və məruz qalmayan və ya nəzarət edən populyasiyalara bölmək üçün dəyərli ola bilər. Təhlil üçün istifadə olunan məlumatların əksəriyyəti inzibati sərhədlər əsasında toplanacaq, əksinə inzibati ərazilər tərəfindən təyin olunmayan əhali.

Bəzi hallarda, verilənlər bazası bir məlumat sahəsi olaraq məkan vahidləri içərisində olduqda, məlumatlar fərqli coğrafi sərhədlər tərəfindən məkansız olaraq təhlil edilə bilər. Digər hallarda, məlumatların verilənlər bazasında olmayan coğrafi ərazilərə ‘köçürülməsi’ lazım olduqda, məkan məkanı məlumatları fərqli ərazilərə ‘köçürmək’ üçün istifadə edilə bilər. Bu hallarda, məlumatlar fərdi sayma şəklində və ya əraziyə görə ümumilikdə əldə edilə bilər. Fərqli coğrafiyalar arasında məlumatların yenidən paylanması çox fərqli coğrafiyalar arasında məlumatların tərcüməsinə imkan verir və beləliklə, müxtəlif hüdudlarda ümumiləşdirilmiş məlumatların hesabatlandırılmasına imkan verir.

Ənənəvi olaraq, şəhər və kənd əhalisi arasında müəyyən sosial-iqtisadi fərqlər mövcuddur. Bu tendensiya dəyişməyə başlamasına baxmayaraq, məkan məlumatlarının dəqiqliyi və dəqiqliyi tez-tez əhali sıxlığı ilə əlaqələndirilir, kənd yerləri müəyyən sosial və iqtisadi fərqləri əhatə edə biləcək geniş sahələri əhatə etməyə meyllidir. Bu fərqlər şəhər və kənd yerləri arasındakı fərqlərə səbəb ola bilər. Məkan təhlilinin daxil edilməsi məlumatların asanlıqla təbəqələşdirilməsini təmin edir, məsələn, epidemioloji modelləşdirmə üçün şəhər / kənd yerləri.

Sağlamlıq təhlili üçün fərqli məlumatlar növləri birləşdirilir

Ənənəvi olaraq, bir CİS məkan məlumatlarını yerləşdiyi yerə görə bir xüsusiyyət olaraq saxlayır. Məlumat nöqtələr, xətlər və ya çoxbucaqlılar (sahələr) istifadə edərək müntəzəm hüceyrələrdən və ya vektordan istifadə edərək raster ola bilər. Hər yerdə bir və ya bir neçə əlaqəli məlumat ola bilər (məsələn, inzibati əraziyə görə əhali). Bununla birlikdə, epidemiologiyada demək olar ki, bütün təhlillər yeri üzrə çoxsaylı komponentləri əhatə etməlidir (məsələn, yaşa görə cins və əhalinin bölünməsi). Texniki olaraq, bu birdən çoxa (sağlamlıq və demoqrafik dəyişənlərə xas olan) bir əlaqə tələb edir.

Bu fərqli məlumat strukturlarının öhdəsindən gəlmək üçün təhlilin bir mərhələsi olaraq məlumatlar birləşdirilə bilər ki, hər bir yer, o nöqtə, xətt və ya sahə bir çox məlumat atributları və ya sıra ilə əlaqələndirilə bilsin. Bu, məkan və epidemioloji analizin uğurla inteqrasiya olunmasını təmin etmək üçün həlledici bir addımdır. Bundan əlavə, bəzi hallarda qarışıq birləşmələrə ehtiyac var (məsələn, yer və vaxtdan istifadə etməklə).

Xülasə

Bu blogda epidemiologiyada beş müzakirə mövzusu və ArcGIS Insights-ın analiz həllinin bir hissəsi kimi necə istifadə ediləcəyi barədə qısa məlumat verilib.

Bu mövzulardan bir çoxu daha çox iştirak edir və bütün analitik işlərdə olduğu kimi, effektiv təhlil əvvəlki müvafiq tədqiqatların əsaslı məlumatları ilə birlikdə etibarlı məlumatlar tələb edir. Bir epidemioloq ya çatışmazlığı aradan qaldırmaqda yaxşı bilməli və tez-tez, əsl təcrübənin olduğu yer budur.

Mürəkkəb modellər və nəticələrin effektiv ünsiyyəti prosesin əsas hissəsidir. Bu bloğun 2-ci hissəsində başqaları arasında bu mövzuları araşdıracağıq.


Bu materialı tədris, tədqiqat və ya başqa bir şey üçün istifadə edirsinizsə, xahiş edirəm mənə (Andy) Twitter və ya e-poçt vasitəsilə bildirin - bir [nöqtə] maclachlan [at] ucl [dot] ac [dot] uk).

Paylaş - materialı istənilən mühitdə və ya formatda kopyalayıb yaymaq

Uyğunlaşın - hər hansı bir məqsəd üçün, hətta kommersiya baxımından da materialı dəyişdirin, dəyişdirin və qurun.

Bununla birlikdə, müvafiq kredit verirsiniz, lisenziyaya bir keçid verir və dəyişikliklərin olub olmadığını göstərirsiniz. Materialı yenidən düzəldirsinizsə, dəyişdirirsinizsə və ya qurarsanız, öz töhfələrinizi orijinal ilə eyni lisenziya altında paylamalısınız.

Lakin, kütləvi məkanda olan materialın elementləri üçün lisenziyaya və ya tətbiq oluna bilən bir istisna və ya məhdudlaşdırma ilə istifadənizə icazə verilməsinə ehtiyac yoxdur.

Bu praktik kitabdakı kod MIT lisenziyası altında mövcuddur, buna görə mənbəyə istinad etdiyiniz müddətdə (istənilən məqsəd üçün) istifadə etmək pulsuzdur.


Dağılım Plot Naviqasiya Nəzarətləri

  • Sahəni böyütmək və ya kiçiltmək üçün Dağıtma Torpağını vurun və siçan çarxını böyütmək üçün yuxarıya, böyütmək üçün aşağıya çevirin. Və ya orta siçan düyməsini (təkər) basıb saxlayın və istifadə edin Ctrl+ Yaxınlaşdırmaq üçün ərazinin ətrafına bir qutu çəkmək üçün sürükləyin. Sahə görünüşünü sıfırlamaq üçün düyməsini vurun Aralığı sıfırlayın düyməsini basın.
  • Dağılım sahəsi yoxdursa Tam Qrup rejimi, həm Image pəncərəsini, həm də Dağılım Plotunu böyüdə bilərsiniz. Şəkil pəncərəsini vurun və siçan çarxını yuxarı və ya aşağıya çevirin.
  • Əsas pəncərədə şəkil pəncərəsində böyütmək, silmək, uçmaq və s. Üçün digər manipulyatorları vurmaq olar. Dağılım Plot pəncərəsinə fokusu qaytarmaq üçün düyməsini vurun Səpələnmə sahəsi düyməsini basın.

Bu vacib yeniləmədə SpaceStat, idxal / ixrac fayl növlərini geodatabase (gdb) formatına genişləndirdi. SpaceStat-ın inkişaf etmiş vizualizasiyası, yer-zaman təhlili və modelləşdirmə texnikaları Esri texnologiyalarından istifadə edən iş axınlarına asanlıqla inteqrasiya olunur. Məsələn, məlumatlarınızı əldə etmək, redaktə etmək və manipulyasiya etmək üçün Esri’nin ArcGIS-dən istifadə edə bilərsiniz və sonra səhiyyə müdaxilələrini hədəf almaq, səhiyyə fərqlərini qiymətləndirmək və proqnozlaşdırıcı modelləşdirmə aparmaq üçün zaman dinamik məlumatları analiz etmək üçün SpaceStat-dan istifadə edə bilərsiniz.

(Terminoloji dəyişikliyinə dair qeyd: Kullanışlılıq araşdırmalarının nəticələrinə və apardığımız bir sorğuya əsasən, bu buraxılışda, istifadəçilərimizi başa düşmələrinə kömək etmək üçün & # 8220fəza interpolasiyası & # 8221 metod adını & # 8220 miqyaslı dönüşüm / interpolasiya & # 8221 olaraq dəyişdirdik. bu prosedur istifadəçilərimizə xidmət edə biləcək bir çox tətbiq.)

(Esri və esri.com, Amerika Birləşmiş Ştatları, Avropa Birliyi və ya digər bəzi yurisdiksiyalarda Esri'nin ticarət markaları, qeyd edilmiş ticarət markaları və ya xidmət markalarıdır.)


ArcMap-da təsnifat vasitəsi ilə histoqram / statistika / dağılma sahəsi yaratmaq? - Coğrafi İnformasiya Sistemləri

Yerleşim görüntülərini göstərmək və təhlil etmək üçün görüntü işləmə tətbiqi

Bu aləti çalıştırmadan əvvəl giriş etməlisiniz.

Versiya 3.51 - 10 sentyabr 2020-ci il tarixdə yayımlandı

Kateqoriya

Nəşr olundu

Mücərrəd

MultiSpec, yerleşim şəkillərini göstərmək və təhlil etmək üçün bir görüntü işləmə vasitəsidir. Onlayn versiya Macintosh və Windows masa üstü versiyalarındakı bütün xüsusiyyətlərə malikdir. MultiSpec haqqında daha çox məlumatı MultiSpec saytında tapa bilərsiniz.

Mygeohub'da bir hesab (qeyd) yaratmağınız lazım olduğunu unutmayın. Hər dəfə giriş etməməyiniz üçün girişdə qalmağınız üçün qura bilərsiniz. (Hesabın təsdiqlənməsindən əvvəl qeydiyyatdan keçdikdən sonra bir gecikmə olacağını unutmayın. Hesabın təsdiqlənməsini yoxlamaq üçün b & # x69e & # x68l & # 64 & # x70 & # 117 & # x72d & # x75 & # x65. & # X65du'ya bir e-poçt göndərin.)

MultiSpec Reference, MultiSpec üçün sənədləri ehtiva edir. Bir neçə dərslik (aşağıda sadalananlar) da mövcuddur.

Prosessor- & gtDisplay Image menyu maddəsinin istifadəsinə dair təlimatlar aşağıdakılardır:

- Tutorial 2: Görüntü inkişaf etdirmə xüsusiyyətləri.

Nəzarət olunmayan Təsnifat haqqında təlimat:

- Tutorial 3: İşlemci- & gtCluster menyu istifadə edir.

Nəzarət olunan Təsnifat haqqında təlimat:

- Tutorial 4: Processor- & gtStatistics menyu (və daha bir neçə menyu) istifadə edir.

MultiSpec-də yüksək işıqlandırma xüsusiyyətləri olan digər dərsliklər:

- Tutorial 5: Ayrı-ayrı Təsvir Dosyalarını Tək Bir Çoxpektrallı Şəkil Faylına Birləşdirmək.

- Dərslik 6: Şəkil Pəncərəsindəki Yerləşdirmə Şəkilləri.

- Tutorial 7: Şəkil Pəncərəsində və Koordinat Görünüşündə Seçim Sahələri.

- Tutorial 8: Bitki İndeksləri Şəkillərinin yaradılması.

- Tutorial 9: HDF və netCDF Biçimli Şəkil Dosyaları ilə işləmək.

- Tutorial 10: Böyüyən Dərəcəli Günü (GDD) Şəkillərinin Görüntülənməsi.

Kanalların təsvirləri Landsat Analysis Ready Data (ARD) dəstləri və Sentinel görüntü sənədləri ilə əlaqələndiriləcək şəkildə dəyişikliklər edildi. Sentenel şəkillər S2A_ və S2B_ tam yol adında bir yer olduğu müddətdə tanınacaq.

ERDAS Imagine formatlanmış faylların histogram statistikasının düzgün oxunması üçün dəyişiklik edildi. Bəzi Təsəvvür formatlanmış sənədlər üçün işə yaramadı.

Bütün şəkil pəncərəsi əvəzinə bir şəkil pəncərəsi seçimi istifadə edildikdə, MultiSpec-in düzgün ərazini saxlaya biləcəyi bir düzəliş edildi.

MultiSpec-in histoqramları disk sənədinə saxlayarkən qəzaya uğramaması üçün bir düzəliş edildi. Windows və Onlayn versiyalarda daha az MacOS versiyası ilə qəzalar tez-tez baş verə bilər. Histogram xülasəsi üçün formatlaşdırmada da dəyişikliklər edildi.

Kanal informasiya qutularına və mətn pəncərəsindəki prosessor çıxışına daxil olan kanal təsvirləri üçün maksimum uzunluq 16-dan 24-ə dəyişdirildi. Landsat və Sentinel kimi tanınan sensorlar üçün standart kanal təsvirləri indi Bn ) dalğa boyu məlumatından əvvəl. MultiSpec, varsayılan olaraq, bantları dalğa uzunluğu sırasına qoymağa çalışır, bu da bəzi hallarda sensor zolaq identifikasiyasının sırası deyil.

Sürüm 3.33 (31.03.2020) EPSG kodları ilə təyin olunmuş coğrafi koordinat sistemlərinin tanınmamasına və / və ya düzgün işlənməsinə səbəb olan Edit- & gtMap Parameters menyu bəndindəki problemi həll edir. Həm də üfüqi və şaquli piksel ölçüləri üçün daha dəqiqliyə imkan verən bir dəyişiklik edildi. Bu coğrafi koordinat sistemləri üçün lazım ola bilər.

Sürüm 3.32 (20.02.2020) MultiSpec Online kodunu açıq mənbə halına gətirmək üçün hazırlanan hər bir sənəddəki lisenziya məlumatında dəyişikliklər daxildir.

Bu SVM təsnifatçısı və mövcud seçimlər haqqında ətraflı məlumat üçün cjlin / libsvm.

Dəyişdirmə Düyməsi: Biri dəyişdirmə düyməsini basıb saxlasa, kursor gözə çevriləcəkdir. Siçan düyməsini (solda) aşağı basmaqla sinifin və ya qrupun rəngini fon rəngi dəyişəcəkdir. Siçan düyməsini buraxmaq, rəngin orijinalına dəyişməsini təmin edəcəkdir.

Dəyişdirmə və Nəzarət və ya z və ya / Tuşlar: Əgər sürüşmə və idarəetməni və ya z və ya / düymələri aşağı tutarsa, imlec gözə çevriləcəkdir. Siçan düyməsini basmaqla digər siniflərin və ya qrupların hamısının rəngini fon rəngi dəyişəcəkdir. Siçan düyməsini buraxmaq rəngləri orijinala qaytaracaq. Birinin Control və ya z və ya / düymələrindən istifadə etməsinin brauzerdən asılı olduğunu unutmayın. Bəzi brauzerlərdə idarəetmə açarı işləmir. Bu səbəbdən digər variantlar mükəmməl deyil, ancaq qabiliyyət işləyir.

Dəyişdirmə və Seçim ya da ya da & # 39 Düymələri: Biri növbə və seçim və ya bir və ya # 39 düymələrini basıb saxlayırsa, imlec gözə çevriləcəkdir. Siçan düyməsini basmaqla bu sinifin və ya qrupun rəngləri dəyişəcək və seçilmişdən az sinif / qrup nömrələri ilə fon rəngi dəyişəcəkdir. Siçan düyməsini buraxmaq rəngləri orijinala qaytaracaq. Bu seçim, təsnif prosessorunun yaratdığı ehtimal şəkilləri üçün xüsusi olaraq təqdim edilmişdir.


Torpaq Təsnifatı və Torpaqdan istifadə

Coğrafi istinad tapşırıqlarımı (1995, 1975 və 1959-cu illər) tamamladıqdan sonra mənə daha çox coğrafi istinad (1965) və ya torpaq növlərini və əraziləri təsnif etmək üçün bir metod yaratmaqdan ibarət olan bir az fərqli bir yol arasında seçim verildi. istifadə edir. Başlıqdan aydın deyilsə, Geo-referancing 1965 & # 8230 seçdim

Torpaq təsnifatı, təsəvvürün piksel dəyərinə əsaslanan bir xüsusiyyətin nə olduğunu müəyyənləşdirmə metodudur (vəziyyətə görə piksel dəyəri fərqli olaraq şərh edilə bilər). Bu, fərqli xüsusiyyətlərin yerləşdiyi konteksti oxumaq və görselləşdirmək üçün asanlıqla nəticələnən rəngarəng bir təqdimata və ayrılmağa imkan verir. Nəticələr dəyişə bilər və görüntü keyfiyyətinə çox bağlıdır. Təsvir və ya görüntü nə qədər keyfiyyətli olsa, təsnifatların bir o qədər ümumiləşdirilməsi və qeyri-dəqiqliyi.

Hər halda, ərazi təsnifatı sadə ola bilər və bu da olduqca çətin ola bilər. Zaten mövcud alətlərdən və ya görüntü təsnifatı üçün hazırlanmış bir proqramdan istifadə edirsinizsə, asanlıqla ərazi təsnifatına / torpaq istifadəsinə başlaya bilərsiniz. Əvvəlcədən mövcud materialdan istifadə edirsinizsə, tez bir zamanda istədiyiniz təsnifatları əldə etmək üçün düzgün rəqəm birləşməsini tapmaq məsələsi olacaqdır. Bu metod çox çətin deyil, nəticənizi əldə etmək baxımından daha yorucu. Bununla birlikdə, sıfırdan yanaşsanız, əhəmiyyətli dərəcədə daha cəlbedici olacaqdır. Aşağıdan yuxarıya yaxınlaşmaq üçün prosesi mahiyyətcə ayırmaq lazımdır. Təsəvvürlərinizi təhlil etməli, piksel dəyərlərini çıxarmalı, piksel dəyərlərini qruplaşdırmalı, hamısını bir faylda birləşdirməli və nəhayət əvvəllər qeyd edilmiş atribut və ya piksel dəyərinə əsasən simvollaşdırmalısınız. Bunu etməkdən daha asan deyilir.

Hazırda tapşırığa artıq yaradılmış alətlər vasitəsi ilə yaxınlaşıram, amma bu məsələdə bir seçimim olsaydı, aşağıdan yuxarıya doğru üsulla yaxınlaşaraq bunu sıfırdan yaratmağa çalışardım, çünki bu barədə daha çox məlumat var və daha çox şey var mənə müraciət. Asılı olmayaraq, yaxşı torpaq təsnifatlarını təyin etmək üçün istifadə etdiyim rəqəmləri, aralıkları və təsnifatları ehtiva edən məlumat sənədləri və ya sənədlər yaradıram. Əvvəllər söylədiklərimdən fərqli olaraq, görüntülər keyfiyyətsiz olduğundan və iynəni iplədirənə qədər aralıqlarla yazmağın pərəstişkarı olmadığım üçün bu mənim üçün olduqca çətindi.

İstifadə etdiyim cari vasitə, ESRI paketi vasitəsilə mövcud olan yenidən təsnifləşdirmə vasitəsidir və bunun üçün Məkan Analisti uzantısı lazımdır. Bu vasitə tək bir şəkil daxil edilməsinə imkan verir, seçilmiş görüntüyü təsnif etmək üçün istifadə etmək istədiyiniz aralıklar və fayl. Çox sınaqdan sonra yalnız maksimum 24 təsnifat ola biləcəyinə əminəm (bu, ehtimal ki, kifayət qədər çoxdur). Bundan əlavə, alət toplu şəkildə işlənə bilər (əksər ESRI alətləri ola bilər), yəni eyni anda birdən çox şəkildə işləyə bilər. Bu, bir çox vəziyyət üçün çox ehtiyac duyulan xüsusiyyətlərdir, çünki ən çox düşündüyüm kimi, fərdlər bir görüntüyü təsnif edib bitməyəcəklər (və ya ən azı mən belə olmayacağam).

Yenidən təsnif alətindən istifadə edərək yenidən təsnif edilmiş bir görüntüdür. Aləti hələ tam anlamadığımdan və hər dəfə aralıqlar verdiyimdə, daxil etmədiyim eyni ümumi aralıqları tükürdüyüm üçün bunun bir təsnifatın nə qədər yaxşı olduğuna əmin deyiləm (bu bir az sinir bozur, amma gəlir ərazi ilə). Əminəm ki, bu, insan səhvidir və vasitə deyil. Son nəticənin nə olacağından əmin deyiləm, ancaq bir dəfə buna nail olduğumdan əmin olacağam (heç etsəm və # 8230).


Bir Dəyişənin Dağılımının Təhlili

Histoqram

Təhlilimizə tək bir dəyişənin paylanmasının sadə təsviri ilə başlayırıq. Şübhəsiz ki, ən tanış statistik qrafik dəyişənin sıxlıq funksiyasının ayrı-ayrı təsviri olan histoqramdır. Əslində, dəyişənin aralığı (maksimum və minimum arasındakı fərq) bir sıra bərabər fasilələrə (və ya qutulara) bölünür və hər zibil qutusuna düşən müşahidələrin sayı çubuq qrafada təsvir olunur.

Histogram funksionallığı seçilərək başlayır Histogramı araşdırın menyudan və ya düyməsini basaraq Histoqram alət çubuğu nişanı, Şəkil 2-dəki ən sol simvol.

Bu gündəmə gətirir Dəyişən Ayarlar məlumat dəstindəki bütün ədədi dəyişənlərin siyahısını verən dialoq (simli dəyişənlər analiz edilə bilməz). Seçə bilənə qədər Şəkil 3-də olduğu kimi siyahı aşağıya fırladın uşaqlar 2000, 2000-ci ildə 18 yaşından kiçik uşaqları olan ev təsərrüfatlarının yüzdəsi. Bu, bəzi Xəritəçəkmə funksiyalarını göstərmək üçün istifadə etdiyimiz eyni dəyişkəndir.

Şəkil 3: Histogram dəyişən seçimi

Tıkladıqdan sonra tamam, Şəkil 4-də olduğu kimi 55 müşahidənin yeddi qutuda paylanmasını göstərən standart histoqram meydana çıxır. Maraqlıdır ki, ikinci zibilin fərqli bir aralıq dəstinin daha uyğun ola biləcəyinə dair müşahidələrin olmadığını görərik.

Şəkil 4: Varsayılan histoqram

Histogram üçün bir sıra vacib seçimlər mövcuddur. Şübhəsiz ki, ən əhəmiyyətlisi qutu sayını və ya alternativ olaraq kəsmə nöqtələri üçün dəyərləri təyin etməkdir.

Şəkil 5-də göstərilən histoqram seçimləri, qrafikə sağ vurmaqla adi qaydada gətirilir.

Şəkil 5: Intervallar histoqram seçimini seçin

Histogram qutularının sayının seçilməsi

The Aralıqları seçin Şəkil 5-də göstərilən seçim, histoqramdakı qutu sayının özəlləşdirilməsinə imkan verir. Bu dəyəri açıq şəkildə təyin etməyə imkan verən bir informasiya qutusu görünür. Varsayılan 7-dir, lakin nümunəmizdə bunu Şəkil 6-da olduğu kimi 5-ə dəyişdiririk.

Şəkil 6: Histogram intervalları 5-ə ayarlanır

Nəticədə yaranan histoqramda artıq şəkil 7-də olduğu kimi beş çubuq var.

Şəkil 7: 5 intervallı histoqram

Bu, itkin müşahidələrlə zibil qutusunun problemini həll edir.

Xüsusi bir təsnifatdan istifadə

Üçün dəyərlər aralığına əsasən xüsusi bir xəritə təsnifatı necə yaratdığımızı xatırlayın uşaqlar 2000və etiketlədi xüsusi1. Layihə sənədini NYC məlumatları ilə yüklədiyiniz təqdirdə, bu xüsusi təsnifat bir seçim olaraq veriləcəkdir Histogram təsnifatı, Şəkil 8-də göstərildiyi kimi, sıfırdan başlamış olsanız, xüsusi təsnifatı yenidən yaratmalısınız (spesifikasiyalar üçün Xəritəçəkmə bölməsinə baxın).

Şəkil 8: Xüsusi bir histoqram təsnifatının seçilməsi

Xüsusi təsnifat GeoDa-nın zibil sayının əvəzinə kəsmə nöqtələrinin göstərilməsinə imkan verdiyi yoldur. İlə xüsusi1 seçildikdə, histoqram bu təsnifatla müəyyənləşdirildiyi kimi altı qutu ilə Şəkil 9-dakı kimi formanı alır. Histoqram, şəkildəki şəklə bənzər bir forma sahibdir Kateqoriya redaktoru bu xüsusi kateqoriyalar yaradarkən interfeys.

Şəkil 9: Xüsusi fasilələrlə histoqram

Kategorik dəyişənlər üçün histoqramlar

Histoqramın arxasındakı standart məntiq maraq dəyişəninin (maks - min) aralığını nəzərə almaq və kəsilmiş nöqtələri göstərilən zibil sayına əsasən hesablamaqdır. Kategorik dəyişənlər üçün bu, arzuolunmaz nəticələrə gətirib çıxarır.

Bunu göstərmək üçün bir xəritə hazırlayırıq uşaqlar 2000 ilə xüsusi1 kateqoriyalar və istifadə Kateqoriyalar saxla kategorik bir dəyişən yaratmaq (deyək pişik) bu təsnifat üçün. 2 Bu dəyişən üçün standart histoqram Şəkil 10-dakı kimidir, açıq şəkildə kateqoriyalarla əlaqəli ayrı-ayrı tam dəyərləri əks etdirən bir şey deyil. Daha doğrusu, kəsmə nöqtələri 5-in aralığına, 7 saylı qutu sayına və ya təxminən 0,7 bir qutu genişliyinə bölünməyə əsaslanır. Həqiqətən, ilk zibil 1-dən 1,7-ə qədərdir.

Şəkil 10: Kategorik dəyişənlər üçün standart histoqram

The Bax histogramın seçimi, kəmiyyət dəyişkənləri ilə Unikal dəyər olaraq təyin edin maddə, Şəkil 11-də göstərilmişdir. Bu seçim, kategorik dəyişənin ayrı-ayrı təbiətini tanıyır və kəsmə nöqtəsini müvafiq olaraq tənzimləyir.

Şəkil 11: Benzersiz bir dəyər histoqram təsnifatının seçilməsi

Nəticə Şəkil 12-də göstərilir, hər biri müəyyən bir tam ədədi ilə əlaqəli altı kateqoriya ilə.

Şəkil 12: Kategorik dəyişənlər üçün unikal dəyər histoqramı

Histogram statistikasını göstərin

Histogram (və digər hər hansı bir statistik qrafik) üçün vacib bir seçim, maraq dəyişəni üçün təsviri statistikanı göstərə bilməkdir. Bu seçim yolu ilə həyata keçirilir Statistikaları göstərin içində Bax histogram üçün seçim (bax Şəkil 11)

Bu seçim qrafikin altına bir sıra təsviredicilər əlavə edir. Xülasə statistikası altındakı, Şəkil 13-də göstərilmişdir uşaqlar 2000 xüsusi kateqoriyalar ilə. 55 müşahidənin minimum 8.3815, maksimum 55.3666, orta 38.2278, ortalama 36.04 və 11.2881 standart bir sapma olduğunu görürük. Bundan əlavə, histoqram üçün hər bir interval üçün təsvir intervalı verilir, interval üçündür, müşahidələrin sayı və ümumi müşahidələrin sayına nisbəti və ortalamadan kənar standart sapmaların sayı göstərilir. zibil qutusunun mərkəzi üçün. Bu, potensial hədləri müəyyən etməyə imkan verir, məsələn, bu müşahidələr tərəfindən müəyyən edildiyi kimi, ortalamadan iki standart kənarlaşma daha çoxdur. Bizim nümunəmizdə heç bir kateqoriya bu meyarı təmin etmir.

Müəyyən bir qutu üçün xülasə xüsusiyyətləri, kursor müvafiq çubuğun üstünə keçdikdə vəziyyət çubuğunda da görünür. Bu təsviri statistika seçiminin açıq olub-olmamasından asılı olmayaraq işləyir. Şəkil 13-dəki nümunəmizdə imlec dördüncü kateqoriyanın üstündədir.

Şəkil 13: Təsviri statistika ilə histoqram

Digər histogram seçimləri

Mövcud olan digər əşyalar Bax seçiminə uyğun olaraq baltaların dəqiqliyini və göstərilən statistikanı uyğunlaşdırmaq daxildir View & gt Eksenlərdə Ekran Dəqiqliyini AyarlayınView & gt Ekran Dəqiqliyini Ayarlayın.

Bundan əlavə, histogram üçün standart seçimlərə müxtəlif rəng parametrlərinə düzəlişlər daxildir (Rəng) seçimi saxlayaraq (xəritə funksiyası üçün gördüklərimizə bənzər), Görüntüyü Panoya köçürün və qrafiki bir şəkil faylı olaraq qeyd etmək (yenə də xəritə funksiyası ilə eynidir).

Bir histoqram və xəritənin bağlanması

Anlayışını göstərmək üçün əlaqəli qrafiklər və xəritələr, xüsusi histoqram ilə davam edirik və standart temasız xəritənin mövcudluğundan əmin oluruq. Histogramdakı ən sağdakı iki çubuğu seçdiyimiz zaman (seçimi genişləndirmək üçün klikləyin və sürüşdürərək vurun), seçilmiş çubuqlar rənglərini qoruyur, seçilməyənlər isə şəkil 14-dəki sağ qrafikdə olduğu kimi şəffaf olur. GeoDa-da bir qrafada seçimi görüntüləmək üçün bu standart yanaşmadır. 3

Immediately upon selection of the bars in the graph, the corresponding observations in the map are also highlighted, as in the left-hand graph in Figure 14. In our current example, the map is a simple themeless map (all areal units are green), but in more realistic applications, the map can be any type of choropleth map, for the same variable or for a different variable. The latter can be very useful in the exploration of categorical overlap between variables.

Figure 14: Linking a histogram and a map

The reverse linking works as well. For example, using a rectangular selection tool on the themeless map, we can select sub-boroughs in Manhattan and adjoining Brooklyn, as in the map in Figure 15. The linked histogram (right-hand graph in Figure 15) will show the attribute distribution for the selected spatial units as highlighted fractions of the bars (the transparent bars correspond to the unselected areal units).

In practice, we will be interested in assessing the extent to which the distribution of the selected observations (e.g., a sub-region) matches the overall distribution. When it does not, this may reveal the presence of spatial heterogeneity, to which we return below.

Figure 15: Linking a map and a histogram

As we have seen before, it is also possible to save the selection in the form of a 0-1 indicator variable with the Save Selection option.

The technique of linking, and its dynamic counterpart of brushing (more later) is central to the data exploration philosophy that is behind GeoDa (for a more elaborate exposition of the philosophy behind GeoDa , see Anselin, Syabri, and Kho 2006) .

Box Plot

A box plot is an alternative visualization of the distribution of a single variable. It is invoked as Explore > Box Plot, or by selecting the Box Plot as the second icon from the left in the toolbar, shown in Figure 2.

Identical to the approach followed for the histogram, next appears a Variable Settings dialog to select the variable. In GeoDa , the default is that the variable from any previous analysis is already selected. In our example, we change this to the variable rent2008, which we already encountered in the illustration of the box map in the mapping Chapter.

The box plot for rent2008 is shown in Figure 16 (make sure to turn off any previous selection of observations).

Figure 16: Default box plot

The box plot focuses on the quartiles of the distribution. The data points are sorted from small to large. The median (50 percent point) is represented by the horizontal orange bar in the middle of the distribution. The green dot above corresponds with the mean.

The brown rectangle goes from the first quartile (25th percentile) to the third quartile (75th percentile). The difference between the values that correspond to the third (1362.5) and the first quartile (1000) is referred to as the inter-quartile range (IQR). The inter-quartile range is a measure of the spread of the distribution, a non-parametric counterpart to the standard deviation. In our example, the IQR is 362.5 (1362.5 - 1000).

The horizontal lines drawn at the top and bottom of the graph are the so-called fences və ya hinges. They correspond to the values of the first quartile less 1.5xIQR (i.e., roughly 1000 - 362.5x1.5 = 275), and the third quartile plus 1.5xIQR (i.e., roughly 1362.5 + 362.5x1.5 = 2087.5). Observations that fall outside the fences are considered to be outliers. 4

In our example in Figure 16, we have a single lower outlier value (corresponding to three observations), and six upper outlier observations. Note that the lower outliers are the observations that correspond with a value of 0 (the minimum), which we earlier had flagged as potentially suspicious. The outlier detection would seem to confirm this. Checking for strange values that may possibly be coding errors or suggest other measurement problems is one of the very useful applications of a box plot.

Box plot options

The default in GeoDa is to list the summary statistics at the bottom of the box plot. As was the case for the histogram, the statistics include the minimum, maximum, mean, median and standard deviation. In addition, the values for the first and third quartile and the resulting IQR are given as well. The listing of descriptive statistics can be turned off by unchecking View > Display Statistics (i.e., the default is the reverse of what held for the histogram, where the statistics had to be invoked explicitly).

The typical multiplier for the IQR to determine outliers is 1.5 (roughly equivalent to the practice of using two standard deviations in a parametric setting). However, a value of 3.0 is fairly common as well, which considers only truly extreme observations as outliers. The multiplier to determine the fence can be changed with the Hinge > 3.0 option (right click in the plot to select the options menu, and then choose the hinge value, as in Figure 17).

Figure 17: Change the box plot hinge

The resulting box plot, shown in Figure 18, no longer characterizes the lowest value as an outlier.

Figure 18: Box plot with hinge = 3.0

The other options for the box plot can be seen in Figure 17. Except for the Hinge option, these are the same as for the histogram, and are not further considered here.

Also, as is the case for any graph in GeoDa , linking and brushing are implemented, as already illustrated in the mapping Chapter.

The main purpose of the box plot in an exploratory strategy is to identify outlier observations. We have already seen how that is implemented in the idea of a box map to show whether such outliers also coincide in space. In later Chapters, we will cover more formal methods to assess such patterns.


6. Conclusions

This study was designed as a demonstration project to quantify the spatial and temporal characteristics of supercells across Oklahoma over a 10-yr period. A criteria-based approach was applied to the identification and classification of storm types using level-II and level-III radar data. Furthermore, GIS was utilized in a new and innovative way to organize, visualize, and analyze the spatial aspects of storms across various time scales. This methodology resulted in the identification of 943 supercells across Oklahoma during 1994–2003. While the observation of nearly 1000 supercells during a decade is quite significant, the sample size is too small to represent long-term spatial and temporal characteristics of supercell thunderstorms across Oklahoma.

A number of key findings resulted from the spatiotemporal analysis of supercells across Oklahoma during the limited 10-yr demonstration study period. Key results included the following:

  • The location of the maxima of supercell occurrences was identified across three main regions: east-central Oklahoma, southwest Oklahoma, and west-central into northeast Oklahoma.
  • The mean supercell initiation location moved west between January and September and moved east from September through the end of the calendar year.
  • Initiation was most frequent between 2000 and 0000 UTC.
  • Termination was most common between 2300 and 0300 UTC.
  • Supercell initiation density was the greatest across portions of southwest, north-central, and east-central Oklahoma.
  • Supercell termination density was most common across northern and northeastern Oklahoma.
  • The month of May was composed of three important climatological features: a supercell outbreak peak in early May, a midmonth relative minimum of activity, and a peak in supercell days at the end of May.
  • The secondary supercell season was identified during late September to early October.
  • The monthly mean supercell tracks were oriented from southwest to northeast from January through May, from northwest to southeast from June through September, and from southwest to northeast through the end of the year.

Storm report data were analyzed using several spatial density tools and revealed that the distribution of point reports (wind, hail, and tornadoes) was approximately correlated with population centers. The density of tornado tracks did not exhibit the same population bias however, only north-central Oklahoma was strongly correlated with supercell locations for the same period. Overall, the GIS-based supercell dataset was found to be a valuable, new form of storm archive that enabled the efficient query of past storms, powerful spatial analyses, and multiple data overlay. The combined use of radar storm classification and GIS as a database creation and analysis tool proved highly effective in quantifying the spatial characteristics of past supercells across Oklahoma during a 10-yr period. If applied on a larger scale, utilizing a set of more automated methods such as storm algorithm identification combined with quality assurance measures, similar detailed analyses could be extended to larger regions of the United States over longer periods of time.

It is the authors’ recommendation that a national center be given the task of creating an automated framework for developing GIS datasets consisting of critical storm information gathered in a real-time, quality-assured manner. While Storm Data will continue to serve as a useful storm reporting and National Weather Service verification tool, new approaches are needed to more effectively document and research storm occurrences. For example, with the availability of extensive WSR-88D coverage across the country, the potential exists for more effective use and storage of important radar-derived storm features such as hail detections, mesocyclone detections, or storm cell identification and tracking information. The storage of such data into GIS datasets would enable effective data mining of past storm days, facilitate incorporation with other datasets, and ultimately foster further meteorological research and data discovery. The resultant storm datasets would provide beneficial information to a range of sectors, including forecast operations, synoptic and mesoscale research, and economic interests. With continued increases in GIS-compatible meteorological datasets, such as the ones proposed herein, it appears likely that GIS will serve as an important tool for archiving, visualizing, and analyzing a vast array of meteorological data in the future.


Statistics of Multiple Attributes

A data set often has multiple attributes that may or may not depend on each other.

Dependence and Independence

Quite often two sets of data may be related to each other, at the very least because their values are measured at the same time or location, or both. For example, a weather station might make hourly measurements of temperature, humidity, wind speed, etc.

Census data is another common example, such as the layer MASSCENSUS2010BLOCKGROUPS.shp , whose attribute table includes information not only about total population but also the white population, black population, hispanic population, housing units, etc. in particular locations in a particular year:

Beyond the basic connection they have due to their location-based collection, these different sets of data might have other relationships, e.g. there can be simple constraints of definition such as:

POP_2010 = POP_WHITE + POP_BLACK + POP_NATV + POP_ASN + POP_ISLND + POP_OTHER + POP_MULTI

See the U.S. Census Bureau's document “About Race” to learn how they define these categories.

The Census Bureau also allows for the possiblity that a person of Hispanic or Latinx ethnicity could be in any one of these categories. See the U.S. Census Bureau Guidance on the Presentation and Comparison of Race and Hispanic Origin Data for more information.

Importantly, there can also be more complicated relationships resulting from societal factors. For example, the ratio of blacks to whites is not uniform but tends to be inversely related as whites and blacks cluster together in different locations.

The relationship between different attributes can be visualized, to some extent, by plotting each pair within a record on a two-dimension graph of their values, which is known as a .

Procedure 5: Visualizing Attribute Relationships with Scatterplots

  1. In ArcMap , menu View , then select the menu item Graphs , and then select the menu item Create Scatterplot Matrix… .
  2. In the dialog Create Scatterplot Matrix Wizard , in the menu Layer/Table , select the layer or table of interest, e.g. MASSCENSUS2010BLOCKGROUPS.shp .

  1. Show all features/records with selected items highlighted (the default)
  2. Show all features/records with selected items appearing the same as others
  3. Show only selected records.

Scatterplots often reveal several types of relationships between attributes:

    A linear relationship, clearly visible in the the POP_OTHER vs. HISPanic graph expanded above:

Recall that &alpha (the Greek letter “alpha”) is the and &beta (the Greek letter “beta”) is the of the line.

In other words, where there are more whites there are fewer blacks, and where there are fewer whites, there are more blacks.

Inverse relationships can often be approximated by linear relationships with negative slopes.

Some pairs of attributes may have no obvious relationship, such as POP_OTHER vs. POP_MULTI, perhaps indicating an overlap in meaning or a more complicated relationship involving other attributes. Relationships between z-scores can sometimes be clearer, because these values are mostly smaller than 1 (mathematically speaking, nonlinear terms will be less important).

When an attribute remains constant relative to another attribute, or if they have a purely random relationship, we can say that they are of each other if, on the other hand, the attribute has a clear mathematical relationship to another attribute, we can say they are on each other.

Somewhat confusingly, when expressed as a mathematical relationship such as the above, the attribute on the left of the equal sign is called the or the , and the attribute in the expression on the right is called the , which implies an asymmetric relationship that requires qualification or justification.

An important aphorism to remember when considering dependent relationships is that correlation does not imply causation, i.e. two attributes may be dependent upon each other not because one causes the other, but because they both arise from a third attribute. For example, black households are more likely to have lower incomes than white households, not because being black causes lower incomes but because of their historical origins and ongoing discrimination.

Correlation

The degree to which the two sets of data have a linear relationship can be described by calculating their , defined by Pearson as

This expression multiplies two attributes’ z-scores feature-by-feature, sums the result, and divides by the total number N (replaced by N̂ &minus 1 for sample data sets).

The correlation of two attributes will vary between &minus1 and +1, with the latter occurring if all pairs of values < ai , bi > are exactly the same (because the sum is then the same as that of the standard deviation squared), and the former when the values differ only by a minus sign.

If two attributes are independent of each other, the correlation will be close to zero. This is obviously true when one of the attributes is constant, since that value will equal its mean and its z-score will always be zero. More generally, since z-scores are distributed around zero, there will be roughly the same number of positive and negative terms, which will tend to cancel each other out.

In ArcGIS, you can calculate the correlation of two attributes by calculating their z-scores, then calculating a third attribute that is the product of their z-scores, then summarizing the latter to find its mean value. (You can also calculate a linear regression see the next section.) Excel provides a function CORREL which is somewhat easier to use to calculate correlations.

For the Massachusetts data above, we can create a with the same form as the scatterplot matrix:

POP_WHITE 0.88
POP_BLACK 0.13 -0.27
POP_NATV 0.16 -0.02 0.24
POP_ASN 0.33 0.10 0.10 0.00
POP_ISLND 0.13 0.03 0.12 0.15 0.06
POP_OTHER 0.14 -0.21 0.40 0.46 0.03 0.20
POP_MULTI 0.42 0.04 0.52 0.41 0.27 0.24 0.70
HISP 0.17 -0.16 0.38 0.48 0.05 0.20 0.95 0.67
POP_2010 POP_WHITE POP_BLACK POP_NATV POP_ASN POP_ISLND POP_OTHER POP_MULTI

The color codes indicate the strength and sign of the correlation (similar to the standardized map above). From this we see that the POP_OTHER and HISP attributes have the strongest correlation at 0.95, while for POP_WHITE and POP_BLACK there is a weak negative correlation of &minus0.27, both matching our visual characterization.

Question: The second strongest correlation is between the white and total populations at 0.88 why do you think that would be?

Linear Regression

An attribute such as the Hispanic population can be characterized by its mean value and standard deviation, but consider the graph at the right, which plots HISP on the y axis vs. POP_OTHER on the x axis.

The mean value of HISP, &mu = 126 (the solid green line), is also plotted, along with the confidence interval 3 &sigma = 636 (the dashed green line).

Clearly a significant fraction of the HISP data is quite far from the mean and even outside of the 3 &sigma confidence interval — but it’s much closer to the blue line, which varies with POP_OTHER.

If we want to model the relationship between , the simplest type of relationship between two attributes A and B is a linear one, viz.

The &alpha and &beta are called the and , respectively. Note that if the slope &beta is zero, then A will be represented by the constant value &alpha , which we might expect to be the mean &mu .

In general there will be a dispersion of data that prevents a perfect representation by such a line, as in the graph at the right.

The difference between a dependent value and the corresponding calculated value of a representational line is known as a :

(&epsilon is the Greek letter “epsilon”).

We’d like to calculate values for the coefficients &alpha and &beta , a process known as . The most common procedure, , is based on the idea that the line that fits the data best is the one that minimizes the :

squaring the residuals puts values above and below the regression line on an even footing. Also note that, if the slope &beta is zero, the sum is the same as that in the expression for &sigmaa , since the mean &mu is the value of &alpha that minimizes the sum.

Question: Where have you seen a least-squares fit previously? (Hint: the residuals were represented by blue lines between two geographic locations.)

is also possible when there is more than one explanatory variable:

In this case, with n coefficients and n – 1 different explanatory variables, it’s helpful to express the latter as z-scores in order to compare their relative importance to the dependent variable. Then the slopes < &beta k > will represent the effect of a one-standard-deviation change in the corresponding variables.

The derived expressions for the intercept &alpha and slopes < &beta k > are unenlightening and won’t be listed here. But they can be calculated with a number of tools, including Excel and ArcGIS (see below).

As an example, consider the relationship discussed earlier,

which was notable because these two attributes appear to be strongly correlated. It has least-squares intercept and slope of

resulting in the equation

HISP = 16.5 + 1.788 × POP_OTHER

and the solid blue regression line that is plotted in the graph above.

Question: How might you interpret a slope of 1.788 in this case?

Goodness of Fit

How well a linear regression equation fits the data is an important consideration, and a number of statistical measures have been devised to test its .

The describes the distribution of the dependent values around the best-fit line, and is similar to the standard deviation around the mean value:

Again the &epsiloni are the residuals of the dependent values, and smaller values represents a smaller spread from the regression line, as seen in the graph to the right.

As before N is the number of data points, so if more of them fit within a given spread of residuals, that will reduce the standard error.

Finally, n is the number of coefficients the more of them there are the greater the standard error, because they add to the equation and make it easier to fit more precisely, even though the data hasn’t changed. It is therefore subtracted from the total number of data points N , which decreases the denominator and increases the standard error.

Remember “ n equations for n unknowns”? That means that one data point is required for each coefficient to determine them exactly, and the remaining N – n data points are responsible for the variation around the line (the residuals).

The standard error of the HISP(POP_OTHER) regression is

Note that in the above graph, almost all of the data lies close to the regression line, falling within the confidence interval ±3 &Sigma = ±201, denoted by the dashed blue lines. This is much better than simply describing the dependent variable by its mean value, since ±3 &sigmaa = ±636. This model therefore accounts for a large fraction of the variation in the HISP data, leaving a much smaller set of residuals that must be accounted for by other factors. We can say that we have the variation between the model and the remaining residuals.

The is a convenient and accepted way to compare the standard error of the equation &Sigma and the dependent variable’s standard deviation &sigmaa , and thereby describe the overall goodness-of-fit of the equation:

If the regression line perfectly fits the data, the residuals &epsilon i will all be zero and R 2 will be one when the residuals approach the standard deviation of the dependent variable, the second term will be one and R 2 will be zero.

One way to interpret the coefficient of determination is as a generalization of correlation to a set of explanatory variables. It can be shown that, when there is only one explanatory variable, R 2 will equal the square of the correlation &rho with the dependent variable. For the HISP(POP_OTHER) regression,

which matches the correlation calculated above, since 0.95 2 = 0.90. So R 2 .

Because the coefficient of determination can improve simply by adding more explanatory variables, i.e. by increasing n , a related quantity that provides a better estimate of significance is the :

R̅ 2 will always be less than or equal to R 2 , and it can be negative, unlike R 2 . The significance of your equation will be greatest when R̅ 2 is maximized.

For the example regression,

since N (4979) is much larger than n (2).

The is another common way to analyze the dependence of your model on the number of explanatory variables you’ve chosen. It compares the “explained” variance R 2 that follows from these n – 1 variables to the “unexplained” variance 1 – R 2 remaining in the N – n unfitted data points:

F can be as small as 0, when the numerator R 2 /( n – 1) is 0: none of the variance in the dependent variable is explained.

F can be as large as ∞, when the denominator (1 – R 2 )/( N – n ) is 0: all of the variance in the dependent variable is explained.

So the regression is better when F >> 1 for the HISP(POP_OTHER) regression, F = 45,000.

But could a different set of coefficient values be substituted and produce a better result? When coefficient values are selected with random probability and their F values are calculated, an results, such as the graph of ∂F p versus F shown at the right clearly some F values are more likely than others.

Generally speaking values of F >> 1 have a low probability per unit value ∂F p , and the total probability p that random coefficient values will have F > F Regression is very small, as suggested by the red portion of the F distribution graph.

Is there a significant probability p that random coefficient values could produce better results than the regression best-fit? This question is an example of a .

A is a value of p below which you may decide to reject the null hypothesis, i.e. decide that F Regression is significant. Commonly these are stated in the form p < 0.1 or p < 0.05. The former represents a less-than-1-in-10 chance and the latter a less-than-1-in-20 chance that a random result will produce a better F .

For the HISP(POP_OTHER) regression, p ≈ 0, so F Regression is clearly significant and we can reject the null hypothesis.

Standard Errors of the Coefficients

Once the overall goodness-of-fit has been established, the individual coefficients should come under scrutiny.

Because the best-fit regression line is only one of many that could pass through the data, the coefficients also clearly have a range of values, e.g. tilting the line upward for a larger slope or downward for a smaller slope. These values therefore have their own distributions whose widths are described by , which for the HISP(POP_OTHER) regression are:

You will commonly see coefficient errors expressed together with the coefficients in the form &beta ± s &beta , e.g.

HISP = (16.5 ± 1.1) + (1.788 ± 0.008) × POP_OTHER

Note that this is an expression of just one possible confidence interval to claim more certainty, a multiple of this value is generally necessary.

In addition, we can set up another null hypothesis: can these values be left out of the model with little effect, i.e. are they significantly different than zero? A simple test for their significance is based on the :

Like the F-statistic, we can test these values with the , which, like the F distribution, charts the probability that a random set of values could produce the observed coefficient.

When these values are greater than two, i.e. the coefficients ± the standard errors are significantly different than zero, the values are considered good estimates. More precisely, suppose the data was completely random, e.g. HISP showed no dependence on POP_OTHER then we would expect the coefficients to be all zero and &alpha = &mu .

The coefficient of determination for the dependence of the HISP attribute on the POP_OTHER attribute is good, but looking at the scatterplot matrix there appears to be correlation not just with POP_OTHER but also with POP_MULTI and, to a lesser extent, with POP_BLACK and POP_NATV. In general, we also know that Spanish-speaking people can be of any racial background. We may therefore be able to produce a better fit by including them in the analysis with a multiple linear regression.

Procedure 6: Multiple Linear Regression

ArcGIS provides a tool for calculating the ordinary least squares fit to a multiple linear regression of an attribute dependent on multiple other attributes, providing detailed statistical characteristics of a fit described by the equation

This includes the coefficient of determination R 2 , meaning that it can also be used to calculate the correlation between any pair of attributes, too.

  1. The Ordinary Least Squares tool requires that the input feature class have an integer attribute with unique values for every feature if your layer doesn’t already have one, open its attribute table and add a new field, e.g. UniqueID , and use the field calculator as described above to copy the attribute FID (which unfortunately doesn’t work for this purpose).
  2. In ArcMap , open ArcToolbox (see Constructing and Sharing Maps for details).
  3. Double-click on Spatial Statistics Tools , then on Modeling Spatial Relationships , and finally on Ordinary Least Squares .
  4. In the dialog Ordinary Least Squares , in the menu Input Feature Class , select the data layer to be symbolized, e.g. MASSCENSUS2010BLOCKGROUPS . If the layer is not already added to ArcGIS, you can click instead on the button Browse to select one.
  5. In the menu Unique ID Field , choose an integer field with unique values, e.g UniqueID .
  6. In the text field Output Feature Class , choose a location and name for the output layer file, e.g. Geostatistics.gdbHISP_OLS , by typing it or by clicking on the button Browse to select it. You will probably want to put it in the same location as the data layer it’s modeling.
  7. In the menu Dependent Variable , choose the attribute you would like to explain, e.g HISP .
  8. In the menu Explanatory Variables , click haqqında the attribute(s) that you think will explain the dependent variable, e.g POP_OTHER_Z .
  9. In the text field Output Report File , choose a location and name for an output report in PDF format, e.g. HISP_OLS_Report.pdf , by typing it or by clicking on the button Browse to select it. You will probably want to put it in the same location as the data layer it’s modeling.
  10. Optionally, you can request a Coefficient Output Table and a Diagnostic Output Table these have almost the same information as in the PDF report, but in a table format that can and will be loaded into ArcGIS. One statistic the former provides that isn’t in the PDF report is the standard error of the equation S .
  11. Click on the button OK .
  12. If you have turned off background processing (see Constructing and Sharing Maps for details), the dialog Ordinary Least Squares will appear, describing the process, and eventually displaying the Completed results (you may need to enlarge the window and scroll up to see everything):

Quite a few statistical characteristics are included here, including the ones we have already described. In particular, this model of the hispanic population

Again, if there are a large number of polygons you may want to turn off the polygon outlines as described in step 12 of Procedure 2.

Excel provides a function LINEST that can also be used to calculate regression coefficients and standard errors, but it’s a bit cumbersome to use.


Videoya baxın: Install ArcGIS with license and crack