Daha çox

İstilik xəritəsini hazırlamaq üçün cədvəldən sayları necə əldə etmək olar?

İstilik xəritəsini hazırlamaq üçün cədvəldən sayları necə əldə etmək olar?


Poçt kodu əsasında hər bir poçt kodu üçün həkimlərin istilik xəritəsini yaratmağa çalışıram. Həkimlər və poçt kodları olan bir masam var, bəziləri poçt kodu başına birdən çox həkim olduğuna görə təkrarlanır. Poçt kodlarının çoxbucaqlı xüsusiyyətlərinə malik bir şəkil sənədim də var.

Mənim üçün heç bir şey etməyən Alma sayını (satırların ümumi sayını qaytaran) və Dublikat tap alətini sınadım. Tap Duplicate, əslində mərkəz sütunda düzgün giriş dəyərləri olmayan (çoxu fərqli bir şey idi) və sağdakı sütunlar gördüyüm saylarla üst -üstə düşməyən orijinal ilə eyni miqdarda qeydləri olan çaşqın bir cədvəl hazırladı. atributu ilə seçin: zipcode = thiszipcode, nəticə: x seçildi).

Fikrim budur ki, həkimlər cədvəlinə əsaslanaraq hər bir unikal dəyəri (poçt kodunu) və sayını göstərən bir masa yarada bilərəm. Daha sonra bu cədvələ poçt kodunun şəkil sənədinə qoşularaq gözəl bir istilik xəritəsi yaradardım. Çox sadə görünür, amma sayını necə əldə edəcəyimi anlaya bilmirəm. Fikirləriniz varmı?


Poçt cədvəlini poçt kodu ilə ümumiləşdirə bilərsiniz. Poçt kodunu Statistika Sahəsi və COUNT Statistikası olaraq seçin. Sonra Case Field üçün poçt kodunu seçin. Çıxış cədvəli sizə poçt koduna görə həkim sayını verəcəkdir.
Bunu ArcMap -də ümumiləşdirmək istədiyiniz sahəyə sağ tıklayaraq 'ümumiləşdir' seçimini edərək də edə bilərsiniz.


Tableau İstilik Xəritəsi

Məlumatları rənglərlə birlikdə göstərmək üçün Tableau Heat Map istifadə olunur. Bir və ya daha çox Ölçü üzvü və Ölçmə dəyərindən istifadə edərək bir istilik xəritəsi yarada bilərik. Tableau -dakı İstilik Xəritəsi, məlumatları rənglərinə görə müqayisə etməyə kömək edəcək. Məsələn, Neçə məhsul çatışmır və nə qədər məhsul gözlədiyimizdən üstündür.

Bu yazıda, bir nümunə ilə Tableau İstilik Xəritəsinin necə yaradılacağını sizə göstərəcəyik. İstilik Xəritəsi demosu üçün SQL Server Məlumat Mənbəsinə qarşı Xüsusi SQL Sorğusu yazacağıq.

Zəhmət olmasa konfiqurasiyaları başa düşmək üçün Tableau -nu SQL Server -ə bağlamaq məqaləsinə daxil olun. Bu Tableau Heatmap hesabatı üçün istifadə edəcəyimiz xüsusi SQL sorğusu:


Matplotlib.pcolor istəyirsiniz:

Bu gün buna baxan insanlar üçün, burada sənədləşdirildiyi kimi Seaborn istilik xəritəsini () tövsiyə edərdim.

Yuxarıdakı nümunə aşağıdakı kimi ediləcək:

Harada %matplotlib, tanımayanlar üçün bir IPython sehrli funksiyasıdır.

Hər söz üçün bir süjetə ehtiyacınız yoxdursa və dəyərləri cədvəl formatında təmsil etmək üçün rəng əlavə etməklə maraqlanırsınızsa, pandas məlumat çərçivəsinin style.background_gradient () metodundan istifadə edə bilərsiniz. Bu üsul, məsələn, pandas məlumat çərçivələrinə baxarkən görünən HTML cədvəlini rəngləndirir. JupyterLab Notebook və nəticə elektron tablo proqramında "şərti formatlaşdırma" dan istifadə etməyə bənzəyir:

Ətraflı istifadə üçün, əvvəllər eyni mövzuda verdiyim daha ətraflı cavaba və pandas sənədlərinin üslub bölməsinə baxın.


  • The Radius kaydırıcı, təsir radiusunu piksel olaraq təyin edir. Daha yüksək dəyərlər daha hamar bir görünüş verir.
  • The Şəffaflıq kaydırıcı, istilik xəritəsinin rənglərinin nə qədər şəffaf olduğunu nəzarət edir.
  • İsteğe bağlı Ağırlıq sütun, intensivliyini göstərilən sütun dəyərinə vuraraq hər nöqtənin əhəmiyyətini tənzimləyir.

İstilik xəritələri Maps API İstilik Xəritəsi qatını istifadə edir, buna görə də onu göstərməzdən əvvəl məlumatları brauzerə çəkirlər. Bu, serverdəki xəritə plitələrini göstərən Fusion Tables xüsusiyyət xəritələrindən fərqli deyil. Bu səbəbdən yalnız ilk 1000 satır xəritələnir. Satır sayını məhdudlaşdırmamaq üçün xəritənizə filtrlər əlavə edə bilərsiniz.

Coğrafi kodlaşdırılmış ünvanların istilik xəritələri Fusion Tables -da baxıla bilər, lakin dərc edilə bilməz. Nəşriyyat, Google Geocoding API -nin istifadə məhdudiyyətləri ilə icazə verilməyən geokodları çıxaracaq.


Lazım olan Python paketlərini idxal edin

Aşağıdakı Python paketlərini idxal edirik:

Veri toplusunu yükləyin

Veri toplusunu pandalardan read_csv funksiyasından istifadə edərək oxuyuruq və çap ifadəsini istifadə edərək ilk on sətri görüntüləyirik.

Python Numpy serialı yaradın

6 x 5 matris qurmaq istədiyimiz üçün & ldquoSymbol & rdquo və & ldquoChange & rdquo sütunları üçün eyni formalı n ölçülü bir sıra yaradırıq.

Python -da bir Pivot yaradın

Pivot funksiyası verilən məlumat çərçivəsi obyektindən & ldquodf & rdquo -dan yeni bir cədvəl yaratmaq üçün istifadə olunur. Funksiya indeksi, sütunları və dəyərləri olan üç arqument alır. Yeni cədvəlin hüceyrə dəyərləri, bizim vəziyyətimizdə & ldquoChange & rdquo sütunu olan dəyərlər parametri olaraq verilən sütundan götürülür.

İstilik Xəritəsinə Annotasiya Verən Bir Array Yaratın

Bu addımda, dənizin doğulduğu istilik xəritəsini qeyd etmək üçün istifadə ediləcək bir sıra yaradırıq. Python siyahılarını bir sətirdə düzləşdirmək üçün & ldquosymbol & rdquo və & ldquopercentage & rdquo massivlərindəki düzləşdirmə üsulu adlandırırıq. İteratoru qaytaran zip funksiyası, Python -da bir siyahını sıxışdırır. Python For döngəsini işə salırıq və format funksiyasından istifadə edərək stok simvolunu və faiz dəyişikliyi dəyərini ehtiyacımıza uyğun olaraq formatlayırıq.

Matplotlib fiqurunu yaradın və süjetini müəyyənləşdirin

Boş bir Matplotlib sahəsi yaradırıq və rəqəmin ölçüsünü təyin edirik. Başlığı da süjetə əlavə edirik və set_position metodundan istifadə edərək başlıq və rsquos font ölçüsünü və süjetdən olan məsafəni təyin edirik.

Yalnız səhm simvollarını və onların bir günlük faiz dəyişikliyini göstərmək istəyirik. Beləliklə, X və Y oxları üçün gənələri gizlədirik və hər iki oxu istilik xəritəsindən çıxarırıq.

İstilik Xəritəsini yaradın

Son mərhələdə, dənizkənarı python paketinin istilik xəritəsi funksiyasından istifadə edərək istilik xəritəsini yaradırıq. İstilik xəritəsi funksiyası aşağıdakı arqumentləri götürür:

məlumatlar ndarray -a məcbur edilə bilən ndash 2D məlumat dəsti. Bir Pandas DataFrame təmin edilərsə, indeks/sütun məlumatları sütunları və satırları etiketləmək üçün istifadə olunacaq.

qeyd & ndash, istilik xəritəsinə annotasiya etmək üçün istifadə olunan məlumatlar ilə eyni formalı bir sıra.

smap & ndash matplotlib Colormap adı və ya obyekti. Bu, məlumat dəyərlərini rəng sahəsinə uyğunlaşdırır.

fmt & ndash sətir formatlaşdırma kodu əlavə edərkən istifadə ediləcək.

xətt genişliyi & ndash, hər bir hüceyrəni böləcək xətlərin genişliyini təyin edir.

Burada & rsquos seçilmiş dərman şirkətləri qrupu üçün dənizdə doğulmuş piton istilik xəritəsinin son çıxışımız. Olduqca səliqəli və təmiz görünür, elə deyilmi? Bu istilik xəritəsinə qısa bir nəzər saldıqda, bazarın bu dövr üçün necə inkişaf etdiyini asanlıqla anlamaq olar.

Python İstilik Xəritə Kodunu yükləyin

Oxucular, aşağıda təqdim olunan yükləmə düyməsini istifadə edərək dənizin bütün Python kodunu və excel faylını yükləyə və öz xüsusi istilik xəritələrini yarada bilərlər. Python kodunda bir az çimdik və bu Python kodunu istifadə edərək istənilən bazar indeksi və ya istənilən dövr üçün dənizdə doğulmuş Python istilik xəritələri yarada bilərsiniz. Dənizkənarı istilik xəritəsi, real vaxt məlumat axını Python kodunda oxunan excel faylına qoşularaq canlı bazarlarda istifadə edilə bilər.


Məzmun

İstilik xəritələri, məlumat matrisindəki dəyərlərin 2D göstərilməsindən qaynaqlanır. Daha böyük dəyərlər kiçik tünd boz və ya qara kvadratlarla (piksel), daha kiçik dəyərlər isə daha açıq kvadratlarla təmsil olunurdu. Loua (1873), Paris bölgələrində sosial statistikanı görselleştirmek üçün bir kölgə matrisi istifadə etdi. [1] Sneath (1957), oxşar dəyərləri bir -birinə yaxın yerləşdirmək üçün matrisin satır və sütunlarını dəyişdirərək çoxluq analizinin nəticələrini göstərdi. Jacques Bertin, Guttman ölçüsünə uyğun olan məlumatları göstərmək üçün oxşar bir təqdimatdan istifadə etdi. Məlumat matrisinin satır və sütunlarına çoxluq ağaclarının qoşulması ideyası 1973-cü ildə Robert Ling tərəfindən yarandı. Ling, bozun müxtəlif rəngli çalarlarını, piksel başına bir simvol genişliyini təmsil etmək üçün həddindən artıq nəzarətçi yazıcı simvollarından istifadə etdi. Leland Wilkinson, 1994-cü ildə yüksək keyfiyyətli rəngli qrafikli çoxluqlu istilik xəritələri istehsal etmək üçün ilk kompüter proqramını (SYSTAT) hazırladı. Eisen və başqaları. şəkildə göstərilən ekran, əvvəlki SYSTAT dizaynının bir kopyasıdır. [ sitata ehtiyac var ]

Proqram dizayneri Cormac Kinney, 1991 -ci ildə maliyyə bazarı məlumatlarını əks etdirən 2D ekranı təsvir etmək üçün 'istilik xəritəsi' termini ilə ticarət nişanı atdı. [2] 2003 -cü ildə Kinneyin ixtirasını əldə edən şirkət, istəmədən ticarət markasının qüvvədən düşməsinə icazə verdi. [3]

İstilik xəritələrinin müxtəlif növləri var:

  • Biologiya istilik xəritələri, bir qayda olaraq, bir çox müqayisə olunan nümunələrdə (məsələn, fərqli dövlətlərdəki hüceyrələr, fərqli xəstələrdən alınan nümunələr) bir çox genin ifadə səviyyəsini təmsil etmək üçün molekulyar biologiyada istifadə olunur.
  • Ağac xəritəsi, vizual olaraq istilik xəritəsinə bənzəyən məlumatların 2D hiyerarşik bölünməsidir.
  • Mozaika sahəsi, iki tərəfli və ya daha yüksək məlumat cədvəlini təmsil etmək üçün döşənmiş bir istilik xəritəsidir. Treemaplarda olduğu kimi, mozaika sahəsindəki düzbucaqlı bölgələr iyerarxik olaraq təşkil edilmişdir. Bu o deməkdir ki, bölgələr kvadratlar əvəzinə düzbucaqlıdır. Dostluq (1994) bu qrafikin tarixini və istifadəsini araşdırır.
  • Yoğunluq funksiyasının vizualizasiyası, xəritədə nöqtələrin sıxlığını əks etdirən istilik xəritəsidir. Zoom faktorundan asılı olmayaraq nöqtələrin sıxlığını dərk etməyə imkan verir. Perrot və başqaları. (2015), Spark və Hadoop ilə böyük məlumat infrastrukturundan istifadə edərək milyardlarla və milyardlarla nöqtəni görüntüləmək üçün sıxlıq funksiyasından istifadə etməyi təklif etdi. [5]

İstilik xəritəsini göstərmək üçün bir çox fərqli rəng sxemləri istifadə edilə bilər, hər biri üçün qavrayış üstünlükləri və mənfi cəhətləri. Göy qurşağı rəngli xəritələr tez -tez istifadə olunur, çünki insanlar bozdan daha çox rəng çalarları qəbul edə bilirlər və bu, ehtimal ki, görüntüdə hiss olunan detalların miqdarını artıracaq. Bununla belə, elmi ictimaiyyətin bir çoxları aşağıdakı səbəblərə görə bunu rədd edirlər: [6] [7] [8] [9] [10] [11]

  • Rənglər, boz rəngli və ya qara cisim spektrli rəngli xəritələrdə olan təbii algılanma sırasından məhrumdur. [6] [11]
  • Ümumi rəngli xəritələr (bir çox vizual proqram paketlərində standart olaraq istifadə olunan "reaktiv" rəngli xəritələr kimi) parlaqlıqda nəzarətsiz dəyişikliklərə malikdir ki, bu da görüntü və ya çap üçün boz rəngə keçməyə mane olur. Bu da faktiki məlumatlardan yayındırır, özbaşına olaraq sarı və mavi rəngli bölgələri əslində ən vacib olan məlumatların bölgələrindən daha görkəmli edir. [6] [11]
  • Rənglər arasındakı dəyişikliklər, əslində mövcud olmayan qradiyentlərin qəbul edilməsinə səbəb olur, bu da faktiki qradiyentləri daha az görkəmli edir, yəni göy qurşağı rəngli xəritələrinin əslində qaranlıq təkmilləşdirmək əvəzinə bir çox hallarda detallar. [6] [10] [11]
  • Göy qurşağı rəng xəritəsindəki bütün rənglər rəng görmə qüsurlu oxucular tərəfindən fərqləndirilə bilməz, bu da bu rəng sxemlərindən istifadə edən rəqəmləri əhalinin əhəmiyyətli bir hissəsinə əlçatmaz edir. [11]

Choropleth xəritələrinə bəzən səhv olaraq istilik xəritələri deyilir. Bir xoroplet xəritəsində coğrafi sərhədlər daxilində fərqli bir kölgə və ya nümunə var ki, bir maraq dəyişəninin nisbətini göstərir, halbuki istilik xəritəsinin rənglənməsi (xəritə kontekstində) coğrafi sərhədlərə uyğun gəlmir. [12]

Bir neçə istilik xəritəsi proqram təminatı sərbəst şəkildə mövcuddur:

    , statistik hesablama və qrafika üçün pulsuz bir proqram mühiti, istilik xəritələrini izləmək üçün bir neçə funksiyanı ehtiva edir, [13] [14] interaktiv çoxluq istilik xəritələri [15] daxil olmaqla (heatmaply R paketi vasitəsilə). universal və pulsuz əmr satırı qurma proqramı, 2D və 3D istilik xəritələrini izləyə bilər. [16] coğrafi məlumatların 1000 nöqtəsi ilə məhdudlaşan bir Google Cədvəl elektron tablodan bir istilik xəritəsi yarada bilər. [17] 'cubehelix' rəng sxemi, qara və ağ yazı skript cihazlarında monoton olaraq artan bir boz rəng olaraq çap edən bir rəng sxemi üçün qaynaqlar təmin edir. [18] 3, bir vektor təbəqəsində bütün coğrafi xüsusiyyətlərin seçilmiş xüsusiyyətinin istilik xəritəsi qatını göstərə bilər. [19], [20] [21] AnyChart [22] [23] və Highcharts [24] [25], hissədən başlayaraq yüksək səviyyəyə qədər interaktiv istilik xəritəsi cədvəlləri yaratmaq imkanı verən məlumatların vizuallaşdırılması üçün JavaScript kitabxanalarıdır. onların həll yollarından.

Göl təsirli qar - hava radarı məlumatları ümumiyyətlə istilik xəritəsindən istifadə etməklə göstərilir.

İnsan səsi, STFT böyüklüyünü əks etdirən bir istilik xəritəsini bir spektrogramla görüntüləyir. Alternativ bir görselleştirme şəlalə sahəsidir.

İstilik xəritəsi, səth sahəsi və eyni məlumatların kontur xətləri arasındakı əlaqələri göstərən bir nümunə

Səth hündürlüyü funksiyanın amplitüdünü, rəng isə faz bucağını təmsil etdiyi səth sahəsi və istilik xəritəsinin birləşməsi.


Bir neçə ay əvvəl bu paketə rast gəldim.

Github üzərindəki 0573195c07 öhdəliyinə görə, kod bir qruplaşdırma = arqumenti ilə işləməyəcək. Gəlin Cümə ayıqlama sessiyasına gedək.

Github -dan sıxılmış bir versiyanı yükləməklə başlayın. R/likert.R faylını, xüsusən likert və plot.likert funksiyalarını sındırmalısınız. Birincisi, likert olaraq, cast () istifadə olunur, lakin yenidən qurma paketi heç vaxt yüklənmir (baxmayaraq ki, NAMESPACE faylında idxal (yenidən formalaşdırma) təlimatı var). Bunu əvvəlcədən özünüz yükləyə bilərsiniz. İkincisi, 175 -ci xəttin ətrafında bir i -nin asıldığı maddələrin etiketlərini götürmək üçün yanlış bir təlimat var. Bu da düzəldilməlidir, məsələn. likert $ items [, i] bütün təzahürlərini likert $ items [, 1] ilə əvəz etməklə. Sonra paketi maşınınıza tətbiq etdiyiniz şəkildə qura bilərsiniz. Mac -da bunu etdim

Sonra, R ilə aşağıdakıları sınayın:

Bu yalnız işləməlidir, amma çox sayda maddə olduğuna görə vizual göstərmə dəhşətli olacaq. Qruplaşdırmadan işləyir (məsələn, süjet (likert (resp))), baxmayaraq ki.

Beləliklə, məlumat dəstinizi daha kiçik maddələr qrupuna endirməyi təklif edərdim. Məsələn, 12 maddə istifadə edərək,

Mən 'oxunaqlı' yığılmış bir barcart alıram. Yəqin ki, sonradan onları emal edə bilərsiniz. (Bunlar ggplot2 obyektləridir, ancaq oxunaqlılıq problemi üzündən onları gridExtra :: grid.arrange () ilə tək bir səhifəyə yerləşdirə bilməyəcəksiniz!)


Məlumatların vizuallaşdırılması

Orta, median və ya varyans kimi ədədi kəmiyyətləri hesablamağa əlavə olaraq, məlumatları təqdim etmək, təsvir etmək və ümumiləşdirmək üçün vizual metodlardan istifadə edə bilərsiniz. Bu bölmədə, aşağıdakı qrafiklərdən istifadə edərək məlumatlarınızı vizual olaraq necə təqdim edəcəyinizi öyrənəcəksiniz:

  • Qutu sahələri
  • Histoqramlar
  • Pasta qrafikləri
  • Bar qrafikləri
  • X-Y sahələri
  • İstilik xəritələri

matplotlib.pyplot çox rahat və geniş istifadə olunan bir kitabxanadır, lakin bu məqsədlə mövcud olan yeganə Python kitabxanası deyil. Bu şəkildə idxal edə bilərsiniz:

İndi, idxal edilmiş və istifadəyə hazır olan matplotlib.pyplot var. İkinci ifadə, rəngləri, xətt genişliklərini və digər üslub elementlərini seçərək sahələrinizin üslubunu təyin edir. Varsayılan stil parametrlərindən razı qaldığınız təqdirdə bunları atmaqdan azadsınız.

Qeyd: Bu bölmə diqqət mərkəzindədir məlumatları təmsil edir və üslub parametrlərini minimuma endirir. Matplotlib.pyplot -dan istifadə olunan rutinlər üçün rəsmi sənədlərin bağlantılarını görürsünüz, burada qazandığınız variantları araşdıra bilərsiniz.

İşləmək üçün məlumat əldə etmək üçün yalançı təsadüfi ədədlərdən istifadə edirsiniz. Bu bölməni başa düşmək üçün təsadüfi ədədlər haqqında məlumatlara ehtiyacınız yoxdur. Sadəcə bəzi ixtiyari nömrələrə ehtiyacınız var və yalançı təsadüfi generatorlar onları əldə etmək üçün əlverişli bir vasitədir. Np.random modulu yalançı təsadüfi ədədlər silsilələri yaradır:

NumPy 1.17, yalançı təsadüfi ədədlərin istehsalı üçün başqa bir modul təqdim etdi. Bu barədə daha çox məlumat əldə etmək üçün rəsmi sənədləri yoxlayın.

Qutu sahələri

The qutu sahəsi verilən məlumatların təsviri statistikasını əyani şəkildə göstərmək üçün əla vasitədir. Aralığı, kvartil aralığını, medianı, rejimi, kənarları və bütün dördlükləri göstərə bilər. Birincisi, bir qutu sahəsi ilə təmsil etmək üçün bəzi məlumatlar yaradın:

İlk ifadə, NumPy təsadüfi ədəd generatorunun toxumunu seed () ilə təyin edir, buna görə də kodu hər işlədərkən eyni nəticələri əldə edə bilərsiniz. Toxumu təyin etməməlisiniz, ancaq bu dəyəri göstərməsəniz, hər dəfə fərqli nəticələr əldə edəcəksiniz.

Digər ifadələr, normal paylanmış yalançı təsadüfi ədədləri olan üç NumPy dizisi yaradır. x 1000 maddədən ibarət olan yaya aiddir, y 100 -ə malikdir və z 10 elementdən ibarətdir. Artıq işləyəcəyiniz məlumatlara sahib olduğunuz üçün qutu sahəsini əldə etmək üçün .boxplot () tətbiq edə bilərsiniz:

.Boxplot () parametrləri aşağıdakıları müəyyən edir:

  • x məlumatlarınızdır.
  • vert Səhv olduqda süjet istiqamətini üfüqi olaraq təyin edir. Varsayılan istiqamət şaqulidir.
  • şou vasitələri Doğru olduqda məlumatlarınızın ortalamasını göstərir.
  • orta xətt Doğru olduqda ortanı bir xətt olaraq təmsil edir. Varsayılan təqdimat bir nöqtədir.
  • etiketlər: məlumatlarınızın etiketləri.
  • patch_artist qrafikin necə çəkiləcəyini müəyyənləşdirir.
  • medianprops medianı təmsil edən xəttin xüsusiyyətlərini ifadə edir.
  • orta paylar ortanı təmsil edən xəttin və ya nöqtənin xüsusiyyətlərini göstərir.

Başqa parametrlər də var, lakin onların təhlili bu təlimatın çərçivəsindən kənardır.

Yuxarıdakı kod belə bir görüntü yaradır:

Üç qutu sahəsini görə bilərsiniz. Onların hər biri tək bir verilənlər bazasına (x, y və ya z) uyğundur və aşağıdakıları göstərir:

  • Məna qırmızı kəsikli xəttdir.
  • Median bənövşəyi xəttdir.
  • İlk dördlük mavi düzbucağın sol kənarıdır.
  • Üçüncü dördlük mavi düzbucağın sağ kənarıdır.
  • Qruplararası sıra mavi düzbucağın uzunluğudur.
  • Aralıq soldan sağa hər şeyi ehtiva edir.
  • Xaricilər sol və sağdakı nöqtələrdir.

Bir qutu sahəsi tək bir rəqəmlə bu qədər məlumat göstərə bilər!

Histoqramlar

Veri toplusunda çox sayda unikal dəyər olduqda histoqramlar xüsusilə faydalıdır. Histogram, sıralanan bir verilənlər bazasındakı dəyərləri aralıqlara bölür, buna da deyilir zibil qutuları. Çox vaxt bütün çöp qutuları eyni genişliyə malikdir, baxmayaraq ki, bu belə olmamalıdır. Zibil qutusunun alt və yuxarı sərhədlərinin dəyərlərinə deyilir zibil kənarları.

The tezlik hər bir qutuya uyğun gələn vahid bir dəyərdir. Çöpün kənarları arasındakı dəyərləri olan verilənlər bazasının elementlərinin sayını & rsquos. Konvensiyaya görə, sağdakılardan başqa bütün zibil qutuları yarı açıqdır. Aşağı sərhədlərə bərabər olan dəyərləri ehtiva edir, lakin yuxarı sərhədlərə bərabər olan dəyərləri istisna edir. Ən sağdakı zibil qutusu bağlanır, çünki hər iki hüdudu ehtiva edir. Bir məlumat dəstini 0, 5, 10 və 15 zibil kənarları ilə bölsəniz, üç zibil var:

  1. Birinci və ən sol zibil qutusu 0 -dan böyük və ya 5 -dən az olan dəyərləri ehtiva edir.
  2. İkinci zibil qutusu 5 -dən böyük və ya 10 -dan az olan dəyərləri ehtiva edir.
  3. Üçüncü və ən sağdakı zibil qutusu 10 -dan böyük və ya bərabər, 15 -dən kiçik və ya bərabər olan dəyərləri ehtiva edir.

Np.histogram () funksiyası histogramlar üçün məlumat əldə etmək üçün əlverişli bir yoldur:

Verilənlərinizi və zibil qutularının sayını (və ya kənarlarını) götürür və iki NumPy dizisini qaytarır:

  1. tarix hər bir qutuya uyğun olan maddələrin tezliyini və ya sayını ehtiva edir.
  2. bin_edges zibil qutusunun kənarlarını və ya sərhədlərini ehtiva edir.

Nə histogram () hesablayır, .hist () qrafik olaraq göstərə bilər:

.Hist () in ilk arqumenti məlumatlarınızın ardıcıllığıdır. İkinci arqument qutuların kənarlarını təyin edir. Üçüncüsü, məcmu dəyərləri olan bir histogram yaratmaq seçimini deaktiv edir. Yuxarıdakı kod belə bir rəqəm yaradır:

Yatay oxda zibil kənarlarını və şaquli oxda tezlikləri görə bilərsiniz.

Cumulative = True to .hist () arqumentini təqdim etsəniz, histogramı maddələrin məcmu sayı ilə əldə etmək mümkündür:

Bu kod aşağıdakı rəqəmi verir:

Histogramı məcmu dəyərlərlə göstərir. Birinci və ən sol zibil qutusunun tezliyi bu çöpdəki əşyaların sayıdır. İkinci zibil qutusunun tezliyi birinci və ikinci qutulardakı əşyaların sayının cəmidir. Digər çöplər də eyni modeli izləyir. Nəhayət, son və ən sağdakı zibil qutusunun tezliyi, verilənlər bazasındakı elementlərin ümumi sayıdır (bu halda 1000). Arxa planda matplotlib istifadə edərək birbaşa pd.Series.hist () ilə histoqram çəkə bilərsiniz.

Pasta qrafikləri

Pasta qrafikləri az sayda etiket və verilən nisbi tezliklərlə məlumatları təmsil edir. Sifariş verilə bilən etiketlərlə belə yaxşı işləyirlər (nominal məlumatlar kimi). Bir pasta qrafiki, çoxsaylı dilimlərə bölünmüş bir dairədir. Hər bir dilim, verilənlər bazasından ayrı bir etiketə uyğundur və bu etiketlə əlaqəli nisbi tezliyə mütənasib bir sahəyə malikdir.

Üç etiketlə əlaqəli məlumatları & rsquos təyin edək:

İndi .pie () ilə bir pasta qrafiki yaradın:

.Pie () -in birinci arqumenti sizin məlumatlarınızdır, ikincisi isə müvafiq etiketlərin ardıcıllığıdır. autopct, şəkildə göstərilən nisbi tezliklərin formatını təyin edir. Aşağıdakı kimi bir rəqəm əldə edirsiniz:

Pasta qrafiki x -ı dairənin ən kiçik hissəsi, y -ni sonrakı ən böyük hissəsi və sonra z -ni ən böyük hissəsi kimi göstərir. Faizlər, hər bir dəyərin cəmi ilə müqayisədə nisbi ölçüsünü ifadə edir.

Bar Qrafikləri

Bar qrafikləri verilmiş etiketlərə və ya ayrı -ayrı rəqəmsal dəyərlərə uyğun olan məlumatları da göstərir. İki məlumat toplusundan məlumat cütlərini göstərə bilərlər. Bir dəstin elementləri etiketlər, digərinin müvafiq maddələri isə onlarındır tezliklər. İsteğe bağlı olaraq, tezliklər ilə əlaqəli səhvləri də göstərə bilərlər.

Çubuq diaqramı adlanan paralel düzbucaqlıları göstərir barlar. Hər bir çubuq tək bir etiketə uyğundur və etiketinin tezliyinə və ya nisbi tezliyinə mütənasib yüksəkliyə malikdir. Let & rsquos, hər biri 21 maddədən ibarət üç məlumat dəsti yaratsın:

X əldə etmək üçün np.arange () istifadə edirsiniz və ya 0 -dan 20 -ə qədər ardıcıl tam ədədlər dizisini. Bunu etiketləri təmsil etmək üçün istifadə edirsiniz. y, eyni zamanda 0 ilə 20 arasında bərabər paylanmış təsadüfi tam ədədlərdir. Bu sıra tezlikləri təmsil edəcək. err, səhvlər olan normal paylanmış üzən nöqtə nömrələrini ehtiva edir. Bu dəyərlər isteğe bağlıdır.

Şaquli çubuklar istəsəniz .bar () və ya üfüqi çubuqlar istəsəniz .barh () ilə bar qrafiki yarada bilərsiniz:

Bu kod aşağıdakı rəqəmi yaratmalıdır:

Qırmızı çubuqların hündürlüyü y tezliklərinə uyğundur, qara xətlərin uzunluqları isə səhvlərin səhv olduğunu göstərir. Səhvləri daxil etmək istəmirsinizsə, .bar () yerr parametrini buraxın.

X-Y sahələri

The x-y sahəsi və ya səpələnmə planı iki məlumat kümesindeki məlumat cütlərini təmsil edir. Üfüqi x oxu x çoxluğunun dəyərlərini, şaquli y oxu isə y dəstinin müvafiq dəyərlərini göstərir. İsteğe bağlı olaraq reqressiya xəttini və korrelyasiya əmsalını daxil edə bilərsiniz. Qoy & rsquos iki məlumat toplusu yaratsın və scipy.stats.linregress () ilə xətti reqressiya həyata keçirsin:

X verilənlər bazası yenə də 0 -dan 20 -ə qədər tam ədədləri olan dizidir. Y bəzi təsadüfi səs -küylə təhrif edilmiş x -in xətti funksiyası olaraq hesablanır.

linregress bir neçə dəyər qaytarır. Reqressiya xəttinin yamacına və kəsişməsinə, həmçinin r korrelyasiya əmsalına ehtiyacınız var. Sonra x-y planını əldə etmək üçün .plot () tətbiq edə bilərsiniz:

Yuxarıdakı kodun nəticəsi bu rəqəmdir:

Məlumat nöqtələrini (x-y cütləri) qırmızı kvadratlar və mavi regressiya xətti olaraq görə bilərsiniz.

İstilik xəritələri

A istilik xəritəsi bir matrisi vizual olaraq göstərmək üçün istifadə edilə bilər. Rənglər matrisin ədədlərini və ya elementlərini təmsil edir. İstilik xəritələri kovarians və korrelyasiya matrislərini göstərmək üçün xüsusilə faydalıdır. .İmshow () ilə bir kovarians matrisi üçün istilik xəritəsini yarada bilərsiniz:

Burada istilik xəritəsində 'x' və 'y' etiketləri və kovarians matrisindəki ədədlər var. Belə bir rəqəm əldə edirsiniz:

Sarı sahə 130.34 matrisindəki ən böyük elementi, bənövşəyi isə ən kiçik elementə 38.5 uyğundur. Aralarındakı mavi kvadratlar 69.9 dəyəri ilə əlaqələndirilir.

Eyni məntiqə uyğun olaraq korrelyasiya əmsalı matrisi üçün istilik xəritəsini əldə edə bilərsiniz:

Nəticə aşağıdakı rəqəmdir:

Sarı rəng 1.0 dəyərini, bənövşəyi rəng isə 0.99 göstərir.


İstilik Xəritəsi, müxtəlif GIS proqramlarında istehsal edilə bilən GIS dünyasında olduqca populyardır, QGIS Proqramından istifadə edərək İstilik Xəritəsinin Yaratılması haqqında bir dərs yazdım. Bu dərslik, 2013-2017 -ci illərdə Microsoft Excel versiyasını istifadə edərək bir istilik xəritəsi yaratmağı göstərəcək. Bu excel versiyasında proqramı yükləyə və müəyyən bir səbəbdən istifadə edə bilərsiniz. İstilik xəritəsi yaratmaq üçün istifadə edəcəyik Coğrafi İstilik Xəritəsi Proqram və pulsuz.

1. Excel vərəqinizi açın və sonra gedin Tətbiqlərimi daxil edin və gt edin.

2. Sonra üzərinə vurun Mağaza və mətni yazın Coğrafi İstilik Xəritəsi üstündə axtarış Qutu. Sonra üzərinə vurun Əlavə et düymə.

3. Tətbiqi əlavə etdikdən sonra, ilk dəfə avtomatik olaraq Coğrafi İstilik Xəritəsi pəncərəsini açacaq.

Aşağıdakı məlumatlardan istifadə edirəm.

Həmçinin oxuyun: Power Map istifadə edərək Microsoft Excel 2013 -də Xəritələr yaradın

4. Sonra üzərinə vurun Alın Başladı düyməsini basdıqda, növbəti pəncərə açılacaqdır. İstifadə edərək məlumatları seçin Məlumat seçin düymə. Altında Xəritə seçin seçin Dünya , Bölgələr alacaq Adı sahə və Dəyərlər sahəyə sahib olacaq Dəyər . Ayrıca, təyin edin Rəng mövzusu və Xəritə Başlıq. Nəhayət vurdu Yadda saxla xəritə yaratmaq üçün düyməni basın.

5. Tərəfindən Son Çıxış xəritəsi Coğrafi İstilik Xəritəsi Tətbiq.

6. Dəyərləri redaktə etmək istəyirsinizsə, üzərinə vurun qəbulu düymə.


PARTITIONS görünüşü

Bu məhsul və ya xüsusiyyət Google Bulud Platforması Xidmət Şərtlərinin GA Öncəsi Təklif Şərtləri ilə əhatə olunur. GA əvvəli məhsullar və xüsusiyyətlər məhdud dəstəyə malik ola bilər və GA əvvəli məhsul və xüsusiyyətlərdə edilən dəyişikliklər digər GA əvvəli versiyalarla uyğun gələ bilməz. Daha çox məlumat üçün başlanğıc mərhələsinin təsvirlərinə baxın.

INFORMATION_SCHEMA.PARTITIONS görünüşünü sorguladığınızda, sorğu nəticələri hər bölmə üçün bir sətirdən ibarətdir.

INFORMATION_SCHEMA.PARTITIONS görünüşü aşağıdakı sxemə malikdir:

Nümunələr

Aşağıdakı nümunə, bigquery-public-data.crypto_bitcoin verilənlər bazasındakı bütün cədvəllərdə hər bir saxlama səviyyəsinin istifadə etdiyi bayt miqdarını hesablayır.

Konsol

Cloud Console -da BigQuery səhifəsini açın.

Aşağıdakı standart SQL sorğusunu daxil edin Sorğu redaktoru Qutu. INFORMATION_SCHEMA standart SQL sintaksisini tələb edir. Standart SQL, Cloud Console -da standart sintaksisdir.

Sorğu əmrindən istifadə edin və --nouse_legacy_sql və ya --use_legacy_sql = saxta bayraqdan istifadə edərək standart SQL sintaksisini göstərin. INFORMATION_SCHEMA sorğuları üçün standart SQL sintaksisi tələb olunur.

Nəticələr aşağıdakı cədvələ bənzəməlidir. Məlumat bazası zamanla yeniləndikcə dəqiq bayt sayıları dəyişə bilər.

Başqa cür qeyd edilmədiyi təqdirdə, bu səhifənin məzmunu Creative Commons Attribution 4.0 Lisenziyası altında və kod nümunələri Apache 2.0 Lisenziyası altında lisenziyalaşdırılmışdır. Ətraflı məlumat üçün Google Yaradıcı Sayt Siyasətlərinə baxın. Java, Oracle və/və ya filiallarının qeydiyyatdan keçmiş ticarət nişanıdır.


Videoya baxın: Sıra sayları Aytən M