Články

11.4: Vykreslenie údajov - matematika


Tu sú niektoré predbežné príkazy, ktoré sa majú spustiť, ak ešte neboli.

A v tejto časti budeme musieť dať Julii vedieť, aby mohla používať balík Pozemky:

Budeme chcieť vytvoriť grafy množín údajov, začneme iba niekoľkými náhodnými údajmi. Nasledujúce vytvára hodnoty 1 až 10 pre x a náhodné celé čísla medzi 1 a 10 pre y:

Nasledujúci text vytvorí bodový graf údajov, kde sa každý bod vykreslí ako bod.

Ak sme chceli, aby boli dáta vykreslené čiarami spájajúcimi body, použijeme to istézápletkapríkaz, ako sme to urobili vyššie.

a môžeme vykresliť body aj priamky pomocou:


Zostrojte dáta vo formáte CSV a urobte štatistické výkazy v Mathematica / WA

Po prvé, som v Mathematice úplne nový, takže vopred sa ospravedlňujem, ak sa niektoré otázky zdajú byť triviálne.

Mám súbor CSV, ktorý vyzerá takto:

perc je percento medzi 0… 1 l1 a l2 sú čísla, rozdiel je rozdiel medzi l1 a l2. Toto sú prvé riadky celej sady

150 000 riadkov s perc od 0 do 1.

Chcem tieto údaje vykresliť a WolframAlpha (a dokonca aj GoogleDocs) tu odvádzajú dobrú prácu a dostanem takýto výsledok (v skutočnosti to nie je úplne správne). perc by sa malo zakresliť X, l1, l2 a rozdiel na Y. Dúfam, že viete, čo tým myslím.

Toto však funguje, iba ak je môj súbor CSV menší ako

4 000 riadkov. Ak je väčší, WA zlyhá a pre Dokumenty Google „nevie, ako interpretovať údaje“. Takže to chcem v Mathematice prerobiť, ale neviem ako / nefunguje.

data = Import ["data.csv", "Table", "HeaderLines" - & gt 1]

Ale potom zlyhám s ListPlotom, pretože neviem, aké možnosti potrebuje na vykreslenie údajov zodpovedajúcim WA.


Základné koncepty

Aj keď sú si istí, že na strednej škole zažili plány a grafy, študenti často zápasia so základmi grafov. Keď učím grafy, zisťujem, že existuje päť dôležitých konceptov, ktoré by mali moji študenti pravdepodobne poznať:

  1. Čo je to graf?
  2. konštruovanie zmysluplných grafov a grafov
  3. vykreslenie údajov x-y do grafu
  4. popisujúce grafy alebo grafy
  5. čítanie a interpretácia údajov z pozemkov

Bod môžete určiť pomocou usporiadaného páru čísel (x, y). Prvé číslo v páre zodpovedá číslu na osi x a druhé číslo zodpovedá číslu na osi y. Čísla v usporiadanom páre sa nazývajú súradnica x a súradnica y bodu.

Body A, B a C sú zobrazené v grafe na súradnicovej rovine vyššie. Počnúc počiatkom postupujte podľa krokov uvedených nižšie a vyhľadajte skutočné číslo pre každú súradnicu v usporiadanom páre.

  1. V bode A posuňte doprava o 3 jednotky na osi x, aby ste získali súradnicu x 3, potom posuňte nahor o 4 jednotky na osi y, aby ste dostali súradnicu y o 4.
  2. V bode B posuňte doľava o 4 jednotky na osi x a získate súradnicu x -4. Pretože neexistuje žiadna vertikálna vzdialenosť na pohyb po osi y, súradnica y je 0.
  3. V bode C posuňte doprava o 4 jednotky na osi x, aby ste získali súradnicu x 4, potom posuňte nadol o 4 jednotky na osi y, aby ste dostali súradnicu y -4.

Priemer, medián a režim: trendy v údajoch, zisťovanie anomálií a použitie v športe

- Sprievodca Autor: Corin B. Arenas, zverejnené 17. októbra 2019

V škole si za test pýtame priemerné skóre, aby sme zistili, či máme dobrú známku. Pokiaľ ide o nákup drahých výrobkov, často sa pýtame na priemernú cenu, aby sme našli najvýhodnejšie ponuky.

Je to iba niekoľko príkladov toho, ako sa priemery používajú v skutočnom živote.

V tejto časti sa dozviete o rôznych druhoch priemerov a o tom, ako sa počítajú a používajú v rôznych oblastiach, najmä v športe.

Čo znamená pojem „priemer“?

Keď ľudia popisujú „priemer“ skupiny čísel, často sa odvolávajú na aritmetický priemer. Toto je jeden z 3 rôznych typov priemeru, ktoré zahŕňajú medián a režim.

Druhy priemeruPopis
Zlý Priemer čísel v skupine.
Medián Stredné číslo v množine čísel.
Režim Číslo, ktoré sa najčastejšie vyskytuje v množine čísel.

Z konverzačného hľadiska hovorí väčšina ľudí iba „priemerne“, keď skutočne myslí priemer. Aritmetika znamenajú a priemer sú synonymné slová, ktoré sa podľa Dictionary.com používajú zameniteľne.

Vypočítava sa to tak, že sa spočítajú čísla v súprave a vydelí sa to celkovým počtom v súprave. Čo robí väčšina ľudí pri hľadaní priemeru. Pozri príklad nižšie.

Sada: 8, 12, 9, 7, 13, 10
Priemer = (8 + 12 + 9 + 7 + 13 + 10) / 6
= 59 / 6
= 9.83
Priemerný alebo aritmetický priemer v tomto príklade je 9.83.

Medián

The medián, na druhej strane, je ďalší typ priemeru, ktorý predstavuje stredné číslo v usporiadanej postupnosti čísel. Funguje to tak, že sa zoradí postupnosť čísel (vo vzostupnom poradí) a potom sa určí počet, ktorý sa vyskytne v strede súpravy. Pozri príklad nižšie.

Priemerný medián

Sada: 22, 26, 29, 33, 39, 40, 42, 47, 53
V tomto príklade 39 je stredná alebo stredná hodnota v množine.

The režim je v zásade najčastejšou hodnotou, ktorá sa opakuje v súbore hodnôt. Napríklad ak má vaša súprava 21, 9, 14, 3, 11, 33, 5, 9, 16, 21, 5, 9, aký je režim?

Odpoveď je 9, pretože táto hodnota sa opakuje 3-krát.

V štatistike sú priemer, medián a režim všetky výrazy používané na meranie centrálnej tendencie vo vzorke údajov. To ilustruje graf normálneho rozdelenia uvedený nižšie.

Graf normálneho rozdelenia sa používa na vizualizáciu štandardnej odchýlky v analýze údajov. Distribúcia štatistických údajov ukazuje, ako často sa vyskytujú hodnoty v súbore údajov.

V grafe vyššie percentuálne hodnoty predstavujú množstvo hodnôt, ktoré spadajú do každej sekcie. Zvýraznené percentá v zásade ukazujú, koľko údajov spadá blízko stredu grafu.

Aký je vzťah medzi priemerom, stredom a režimom?

Na prvý pohľad by sa zdalo, že medzi stredom, stredom a režimom neexistuje žiadna súvislosť. Existuje však empirický vzťah, ktorý existuje pri meraní stredu súboru údajov.

Matematici zistili, že medzi mediánom a režimom je zvyčajne rozdiel a je to trojnásobok rozdielu medzi priemerom a mediánom.

Empirický vzťah je vyjadrený v nasledujúcom vzorci:
Priemer - režim = 3 (priemer - medián)

Zoberme si príklad populačných údajov založených na 50 štátoch. Napríklad priemerná populácia je 7 miliónov, s mediánom 4,8 milióna a módom 1,5 milióna.

Priemer - režim = 3 (priemer - medián)
7 miliónov - 1,5 milióna = 3 (7 miliónov - 4,8 milióna)
5,5 milióna = 3 (2,2)
5,5 milióna = 6,6 milióna

Zaznamenať si: Profesorka matematiky Courtney Taylor, Ph.D. uviedol, že nejde o presný vzťah. Keď robíte výpočty, čísla nie sú vždy presné. Ale zodpovedajúce čísla budú relatívne blízko.

Asymetrické alebo skosené údaje

Podľa stránky Microeconomicsnotes.com, keď hodnoty priemernej hodnoty, mediánu a režimu nie sú rovnaké, distribúcia je asymetrická alebo skreslená. Stupeň šikmosti predstavuje mieru, v ktorej sa súbor údajov líši od normálneho rozdelenia.

Ak je priemer väčší ako stredná hodnota a stredná hodnota je väčšia ako režim (stredná hodnota & gt stredná hodnota & gt režim), jedná sa o pozitívne skreslená distribúcia. Je opísaný ako „zošikmený doprava“, pretože dlhý koniec zákruty je smerom doprava.

V ukážkovom grafe nižšie sú medián a režim umiestnené vľavo od priemeru.

Na druhej strane, pri záporne skreslenej distribúcii je priemer menší ako medián a stredná hodnota je menšia ako mód (Mean & lt Median & lt Mode). Koniec longtailu sa nachádza smerom k ľavej strane grafu.

Graf nižšie zobrazuje medián a režim umiestnené na pravej strane priemeru.

Meniaci sa priemer z mediánu: odolné numerické súhrny

Ak je v súbore údajov stredná hodnota vysoká, čitateľ by mohol predpokladať, že stredná hodnota bude tiež vysoká. Nie vždy to však nasleduje.

Rozdiel medzi priemerom a mediánom sa stane zrejmým, keď má súbor údajov vonkajšiu rozdielnu hodnotu. Táto situácia upozorňuje na koncept rezistentných číselných zhrnutí. Odolná štatistika je číselný súhrn, v ktorom extrémne čísla nemajú podstatný vplyv na jeho hodnotu.

Ukážme si to na príklade toho, ako dopady na prítomnosť Billa Gatesa znamenajú stredné bohatstvo, keď vojde do miestnosti.

Napríklad 10 ľudí večeria v reštaurácii. Nazvime to množina A. Nasledujúca tabuľka zobrazuje ich príjem od najnižšieho po najvyšší.

názov Ročný príjem
Raffy $33,000
Jessie $38,000
Corin $39,000
Pavla $42,000
Kat $46,000
Luigi $49,000
Carl $52,000
Susan $60,000
Miguel $68,000
Ján $79,000

Celkový príjem ľudí v reštaurácii je 506 000 dolárov, so stredným príjmom 50 600 dolárov.

Pretože v sade je 10 ľudí, aby sme dostali medián, musíme pridať 5. a 6. hodnotu (ročný príjem Kat a Luigi) a vydeliť ju 2.

Medián = (46 000 + 49 000) / 2 = 95 000/2
= 47,500
Stredný príjem skupiny bol 47 500 dolárov.

Rozsah predstavuje rozdiel medzi najnižším príjmom (Raffy) a najvyšším príjmom (John), čo je 46 000 dolárov.

Stanovte si ročný príjem

Celkový príjem $506,000
Zlý $506,000
Medián $47,500
Rozsah $46,000

Ak teraz John opustí reštauráciu a vojde Bill Gates, ako to ovplyvní štatistiku ročného príjmu skupiny? Zavolajme túto ďalšiu skupinu skupín B.

Podľa Forbes Bill Gates od roku 2017 do roku 2018 zarobil 90 miliárd dolárov.

názov Ročný príjem
Raffy $33,000
Jessie $38,000
Corin $39,000
Pavla $42,000
Kat $46,000
Luigi $49,000
Carl $52,000
Susan $60,000
Miguel $68,000
Bill Gates $90,000,000,000

Stanovte ročný príjem B.

Celkový príjem $90,000,427,000
Zlý $9,000,042,700
Medián $47,500
Rozsah $89,999,967,000

S Billom Gatesom je celkový príjem teraz 90 miliárd dolárov plus nižší príjem ľudí v reštaurácii. Priemerný príjem a rozsah skupiny sú teraz príliš vysoké.

Medián však zostáva rovnaký, okolo 47 500 dolárov.

Medián ukazuje, že ide o lepšiu indikáciu skutočného finančného stavu ľudí. Rovnako môžeme povedať, že Bill Gates je odľahlý podnik s ročným príjmom, ktorý dosahuje miliardy.

Tento príklad ukazuje, že stredná hodnota a rozsah nie sú odolné voči extrémnym hodnotám. Zatiaľ čo medián ako numerické zhrnutie všeobecne vykazuje odpor.

Čo nám to hovorí? Prítomnosť extrémnych hodnôt alebo odľahlých hodnôt naznačuje, že distribúcia je skreslená. Extrémne hodnoty zvyčajne ťahajú priemer smerom k chvostu.

Dôležitosť identifikácie šikmosti

Pozorovanie šikmosti v grafe dáva analytikom jasnejšiu predstavu o trende súboru dát. Napríklad, ak ste zhromaždili údaje od 500 študentov, ktorí sa zúčastnili Scholastic Assessment Test, mali by ste vedieť o trende skóre.

Ak vykreslíte údaje do grafu, budete vedieť, že sú kladne skreslené, ak existujú niekoľko vysokých skóre a väčšina hodnôt je zoskupená smerom k spodnej strane stupnice. Ak skóre smeruje k vyššej strane stupnice, potom niekoľko nízkych skóre, distribúcia je negatívne skreslená.

Pri financiách investori berú na vedomie krivicu, keď analyzujú rozdelenie návratnosti. Je to dôležité, pretože im to umožňuje vidieť extrémne rozsahy údajov a nielen sústrediť sa na priemerné hodnoty.

Distribúcia vykazuje krivku (stupeň asymetrie) alebo špičatosť, keď výnosy klesnú vonku normálne rozdelenie. Kurtosis meria odľahlé hodnoty v obidvoch chvostoch zošikmeného grafu. Vypočíta sa miera dosiahnutia maxima grafu v porovnaní s normálnym rozdelením.

Ako pomáha investorom? Pozorovanie šikmosti alebo špičatosti pomáha analytikom predvídať riziká, ktoré vzniknú pri porovnaní modelu nasledujúceho po normálnom rozdelení so súborom údajov s tendenciou k vyššej štandardnej odchýlke. Riziko sa určuje výpočtom toho, ako ďaleko sú čísla od normálneho rozdelenia.

Ako identifikovať dátové anomálie

V štatistikách sú mimoriadne hodnoty alebo anomálie neobvyklými pozorovaniami, ktoré nepatria k určitej populácii.

Ak sú umiestnené v grafe, jedná sa o body, ktoré spadajú ďaleko od hodnôt množiny údajov. Vedci bežne nachádzajú mimoriadne hodnoty na základe veľkých a dobre štruktúrovaných údajov.

Aká rozdielna by mala byť hodnota, aby sa považovala za odľahlú? Ak to chcete zistiť, môžete použiť medzikvartilový rozsah (IQR).

IQR je opísaný ako päťčíselný súhrn, ktorý obsahuje:

  • Minimálna hodnota súboru údajov
  • Prvý kvartil (Q1) - Čo je štvrtina cesty sekvenciou súboru údajov
  • Medián
  • Tretí kvartil (Q3) Čo je tri štvrtiny celej postupnosti všetkých údajov
  • Maximálna hodnota súboru údajov

Medzikvartilový rozsah (IQR) je tiež podobný rozsahu, ale považuje sa za menej citlivý na extrémne hodnoty (rezistentná štatistika). Aby ste ho našli, musíte vziať prvý kvartil a odpočítať tretí kvartil. To ukazuje, ako sa údaje šíria okolo mediánu.

Zisťovanie odľahlých hodnôt pomocou IQR

Prakticky všetky súbory údajov možno opísať súhrnom 5 čísel. Tu je príklad, ako môžete pomocou IQR vyhľadať mimoriadne hodnoty:

  1. Vypočítajte medzikvartilový rozsah pre množinu údajov
  2. Vynásobte IQR o 1,5
  3. Pridajte IQR x 1,5 do tretieho kvartilu. Pravidlo: Akákoľvek vyššia hodnota, ktorá predstavuje príliš veľkú hodnotu.
  4. Odčítajte IQR x 1,5 od prvého kvartilu. Pravidlo: Akákoľvek hodnota menšia ako táto je krajná hodnota.

Tu je príklad. Predpokladajme, že nachádzate odľahlú hodnotu súboru údajov nižšie:
1, 5, 6, 6, 9, 10, 10, 11, 12, 13, 18
5 číselné zhrnutie:

  • Minimálna hodnota = 1
  • Q1 = 6
  • Medián = 10
  • Q3 = 12
  • Maximálna hodnota = 18

IQR x 1,5 =?
6 x 1,5 = 9
9 + Q3 = ?
9 + 12 = 21 (akákoľvek hodnota väčšia ako 21 je odľahlá hodnota)

6 - Q1 = ?
6 – 9 = -3 (akákoľvek hodnota menšia ako -3 je odľahlá hodnota)

Zatiaľ nie je žiadna hodnota v súprave menšia ako -3 alebo väčšia ako 21. Aj keď maximálna hodnota 18 je o 5 bodov viac ako 13, nepovažuje sa to za odľahlú hodnotu pre tento súbor údajov.

Ako sa používajú štatistické priemery v analýze športu

V športovej analýze vedci zhromažďujú štatistické údaje na meranie potenciálu a schopností profesionálnych športovcov.

Podľa Competitive Edge Athletic Performance Center sú metriky športového výkonu relevantné pre celkový atletický rozvoj. Na dosiahnutie úspechu v akomkoľvek športovom odbore musia jednotlivci dosiahnuť určitú úroveň atletiky, aby mohli súťažiť na pokročilých úrovniach.

Mnoho profesionálnych športových tímov sa v skutočnosti poradí so štatistikmi, aby pomohli športovcom sledovať ich konkurenčné výhody. To ich vedie pri zlepšovaní ich silových a kondičných rutín.

Sledovanie metrík výkonu pomáha športovcom robiť 4 zásadné veci:

  1. Pomáha im poznať ich súčasnú úroveň alebo východiskovú hodnotu.
  2. Akonáhle sa zlepšia, umožní im to súťažiť na vyšších športových úrovniach.
  3. Umožňuje športovcom identifikovať individuálne tréningové potreby.
  4. Môže pomôcť znížiť riziko zranenia.

Populárne športové priemery

Priemer odpaľovania (BA) je štatistika výkonnosti používaná v bejzbale, krikete a softbale. Meria počet priemerných behov, ktoré hráč môže streliť, skôr ako sa dostane von.

Je to najstarší merací prístroj, ktorý meria úspešnosť cestoho. Vyššia BA znamená, že cesto má väčší potenciál na skórovanie v behoch bez toho, aby sa dostalo von.

BA sa počíta vydelením zásahov hráča jeho celkovým počtom netopierov v hodnote od 0,000 do 1 000.

Podľa webovej stránky Major League Baseball sa ligová BA v posledných rokoch udržala na úrovni okolo 260. Najlepšie pálky v hre môžu presiahnuť 0,300.

Niektorí výnimoční športovci však dosiahli viac ako 0,400, čo sú 4 zásahy na každých 10 netopierov. MLB uvádza, že to žiadny hráč neurobil počas celej sezóny od čias Teda Williamsa (0,406) z Boston Red Sox v roku 1941.

V sezóne 1994, ktorá bola skrátená štrajkom, sa Tony Gwynn priblížil k zásahu 400, pričom odpálil 394, pričom 164 zásahov zaznamenal 419 pri netopieroch v 110 hrách.

Tu je tabuľka hráčov MLB, ktorá ukazuje priemerných vodcov odpaľovania v základnej časti od roku 1985 do roku 2019:

Rok Líder národnej ligy Tím NL BA Vedúci americkej ligy AL tím BA
2019 Christian Yelich MIL .329 Tim Anderson CHW .335
2018 Christian Yelich MIL .326 Mookie Betts BOS .346
2017 Charlie Blackmon COL .331 Jose Altuve HOU .346
2016 DJ LeMahieu COL .348 Jose Altuve HOU .338
2015 Dee Gordon MIA .333 Miguel Cabrera DET .338
2014 Justin Morneau COL .319 Jose Altuve HOU .341
2013 Michael Cuddyer COL .331 Miguel Cabrera DET .348
2012 Buster Posey SFG .336 Miguel Cabrera DET .330
2011 Jose Reyes NYM .337 Miguel Cabrera DET .344
2010 Carlos Gonzalez COL .336 Josh Hamilton TEX .359
2009 Hanley Ramirez FLA .342 Joe Mauer MIN .365
2008 Štiepkovač Jones ATL .364 Joe Mauer MIN .328
2007 Matt Holliday COL .340 Magglio Ordonez DET .363
2006 Freddy Sanchez PIT .344 Joe Mauer MIN .347
2005 Derrek Lee CHC .335 Michael Young TEX .331
2004 Barry Bonds SFG .362 Ichiro Suzuki MORE .372
2003 Albert Pujols STL .359 Bill Mueller BOS .326
2002 Barry Bonds SFG .370 Manny Ramirez BOS .349
2001 Larry Walker COL .350 Ichiro Suzuki MORE .350
2000 Todd Helton COL .372 Nomar Garciaparra BOS .372
1999 Larry Walker COL .379 Nomar Garciaparra BOS .357
1998 Larry Walker COL .363 Bernie Williams NYY .339
1997 Tony Gwynn SDP .372 Frank Thomas CHW .347
1996 Tony Gwynn SDP .353 Alex Rodriguez MORE .358
1995 Tony Gwynn SDP .368 Edgar Martinez MORE .356
1994 Tony Gwynn SDP .394 Paul O'Neill NYY .359
1993 Andres Galarraga COL .370 John Olerud TOR .363
1992 Gary Sheffield SDP .330 Edgar Martinez MORE .343
1991 Terry Pendleton ATL .319 Julio Franco TEX .341
1990 Willie McGee STL .335 George Brett KCR .329
1989 Tony Gwynn SDP .336 Kirby Puckett MIN .339
1988 Tony Gwynn SDP .313 Wade Boggs BOS .366
1987 Tony Gwynn SDP .370 Wade Boggs BOS .363
1986 Tim Raines PO .334 Wade Boggs BOS .357
1985 Willie McGee STL .353 Wade Boggs BOS .368

V basketbale sa percento gólov z poľa (FG) používa na meranie toho, ako efektívne tím počas hry strelí loptu.

FG berie do úvahy všetky strely, ktoré hráč urobil. Nezahŕňa však trestné hody, ktoré sa merajú nezávisle ako percento voľného hodu.

Vzorec pre FG je počet úspešných výstrelov vydelený celkovým počtom pokusov o výstrel.

FG 0,500 alebo 50% a viac sa zvyčajne považuje za dobré percento. Podľa Basketball Reference je aktívnym hráčom s najvyšším percentom v súčasnosti DeAndre Jordan so 66,96%.

Pozoruhodné basketbalistky ako Michael Jordan majú FG 49,69% s hodnotením 151, zatiaľ čo Lebron James je na 111 s 50,42%. Sieň slávy ako Kareem Abdul-Jabbar je na 14 s 55,95%, zatiaľ čo Magic Johnson na 64 s 51,97%.

Basketball Reference identifikoval 4 faktory, ktoré pomáhajú tímom vyhrávať hry:

Zo 4 je streľba najdôležitejším faktorom, po ktorej nasledujú obraty, odskoky a trestné hody. Iní by však tvrdili, že okrem efektívneho percenta z poľa v poli sa vyhráva zápas so solídnou obrannou stratégiou.

Ďalej je uvedená tabuľka hráčov NBA s najvyšším percentom gólu z poľa.

Aktívni hráči sú v tučne.
* Označuje člena siene slávy

Poradie názov FG%
1. DeAndre Jordan .6696
2. Artis Gilmore * .5990
3. Tyson Chandler .5960
4. Dwight Howard .5828
5. Shaquille O’Neal * .5823
6. Mark West .5803
7. Steve Johnson .5722
8. Darryl Dawkins .5720
9. James Donaldson .5706
10. JaVale McGee .5697
Amir Johnson .5697
12. Bo Outlaw .5673
13. Jeff Ruland .5637
14. Kareem Abdul-Jabbar * .5595
15. Jonas Valančiūnas .5583
16. Kevin McHale * .5538
17. Marcin Gortat .5514
18. Bobby Jones * .5504
19. Buck Williams .5492
20. Nenê Hilário .5478

Mnoho vedúcich percent v poli gólu sú veľkí muži, ktorí majú tendenciu namáčať a strieľať ďalšie vysoké percento vnútri striel. V posledných rokoch sa viac začal využívať 3-bodový výstrel. Značka vynikajúceho streleckého výkonu všade okolo je 50-40-90, kde hráč má 50% FG, 40% z 3-bodového rozsahu a 90% z čiary trestného hodu.

Spodný riadok

Existujú tri typy priemerov, a to sú priemer, medián a režim. Z týchto troch je najčastejšie používaný aritmetický priemer. Určuje sa to pridaním všetkých hodnôt do množiny a vydelením celkovým počtom faktorov.

Výpočet priemeru, mediánu a režimu umožňuje výskumníkom sledovať normálne rozdelenie alebo šikmosť v grafe. Vo financiách to investori používajú na meranie rizika distribúcie návratnosti. Na zistenie štatistických odchýlok od hodnoty používajú analytici interkvartilový rozsah.

Výpočetné priemery sú obzvlášť dôležité v analytike športu. Používa sa na stanovenie kritérií a zlepšenie športového výkonu. Metriky pomáhajú športovcom usmerniť silové a kondičné rutiny a vyhnúť sa zraneniam.


Výukový program pre matematiku Microsoft 4 a # 8211 na vykreslenie grafov

V tomto výučbe sa naučíme, ako vykresliť 2 a 3 rozmerné karteziánske grafy a 2 rozmerné polárne grafy. Ďalej sa učíme, ako upraviť nastavenia okna Graphing, ako je rozsah vykresľovania a proporcionálne zobrazenie.

1. Otvorte Microsoft Mathematics.

2. Vyberte ikonu Grafy tab.

2. Pod Rovnice a funkcie, určite si to 2D a Karteziánsky sú vybrané.

3. Typ a. Pre exponent použite symbol ^.

4. Po zadaní rovníc kliknite na ikonu Graf tlačidlo.

Po zobrazení grafu môžete pomocou tlačidiel na paneli nástrojov vykonať nasledujúce akcie:

  • Zobraziť / skryť Sekery, Vonkajšie rámya Mriežky grafu
  • Upravte Rozsah vykreslenia (minimálne a maximálne hodnoty osí x-y)
  • Povoliť zakázať Proporcionálny displej nastaviť pomer x-y na 1: 1
  • Priblíženie / oddialenie, ak Proporcionálny displej je umožnené
  • Na priblíženie alebo oddialenie použite koliesko myši (aj keď je vypnutý Proporcionálny displej
  • Obnoviť graf obnovíte predvolené nastavenie
  • Obnoviť kartu Grafy na vymazanie okna grafov
  • Uložiť graf ako obrázok

Zakreslenie polárnych grafov

Vymažte okno Grafy kliknutím na ikonu Obnoviť kartu Grafy na paneli nástrojov. Pod Rovnice a funkcie, vyberte 2D Polárny a graf. zadaním 4 + cos (theta) do r Textové pole.

Vytváranie grafov 3D

Vymažte okno Grafy kliknutím na ikonu Obnoviť kartu Grafy na paneli nástrojov. Pod Rovnice a funkcie, vyberte 3D karteziánsky graf a graf. zadaním z = x sin (x) + y sin (y) & # 8211 3 do prvého textového poľa.


Prvá analýza hlavných komponentov - časť PCA1

Prvá hlavná zložka silne koreluje s piatimi z pôvodných premenných. Prvá hlavná zložka rastie so zvyšujúcim sa skóre v oblasti umenia, zdravia, dopravy, bývania a rekreácie. To naznačuje, že týchto päť kritérií sa líši. Ak sa jedna zvýši, potom sa zvyšujú tiež zvyšné. Túto zložku možno považovať za meradlo kvality umenia, zdravotníctva, dopravy a rekreácie a nedostatočnej kvality bývania (pripomeňme, že vysoké hodnoty bývania sú zlé). Ďalej vidíme, že prvá hlavná zložka najsilnejšie koreluje s umeniami. V skutočnosti by sme mohli konštatovať, že na základe korelácie 0,985 je táto hlavná zložka predovšetkým mierou umenia. Z toho by vyplývalo, že spoločenstvá s vysokými hodnotami majú tendenciu mať k dispozícii veľa umenia, napríklad v divadlách, orchestroch atď. Zatiaľ čo spoločenstvá s malými hodnotami by mali veľmi málo z týchto druhov príležitostí.


Na úvod hlavnej lekcie vysvetľujem, že pomocou konverzných grafov je možné znázorniť situácie v reálnom živote, napríklad výmenný kurz meny a prevod medzi metrickým a imperiálnym meraním.

V prvom príklade diskutujeme o tom, ako prevádzať medzi GBP a EUR pomocou predkresleného konverzného grafu. Kópiu prezentačnej snímky poskytujem ako podklad pre študentov, aby so mnou mohli prekonať problémy.

Postupne pracujeme s otázkami a) až d), pričom dbáme na to, aby sme z osí nakreslili presné vodorovné a zvislé čiary. Diskutujeme o tom, že aj keď je dôležité byť čo najpresnejší, mali by sme používať vhodné aproximácie, najmä pokiaľ ide o meny.


Zoskupenie

Príklad: Prístup k elektrine na celom svete

Niektorí ľudia nemajú prístup k elektrine (žijú v odľahlých alebo zle obsluhovaných oblastiach). Prieskum mnohých krajín priniesol tieto výsledky:

Krajina Prístup k elektrine
(% populácie)
Alžírsko 99.4
Angola 37.8
Argentína 97.2
Bahrajn 99.4
Bangladéš 59.6
. . atď

Ale vydrž! Ako z toho urobíme bodový graf? Môže existovať iba jeden & quot; 59,6 & quot; a jeden & quot; 37,8 & quot, atď. Takmer všetky hodnoty budú mať iba jednu bodku.

Odpoveď je zoskupiť údaje (vložte do & quotbins & quot).

V takom prípade skúsme zaokrúhliť každú hodnotu na najbližších 10%:

Krajina Prístup k elektrine
(% populácie,
najbližších 10%)
Alžírsko 100
Angola 40
Argentína 100
Bahrajn 100
Bangladéš 60
. . atď

Teraz spočítame, koľko z každých 10% zoskupení a toto sú výsledky:

Prístup k elektrine
(% populácie,
najbližších 10%)
Počet
Krajiny
10 5
20 6
30 12
40 5
50 4
60 5
70 6
80 10
90 15
100 34

Takže bolo 5 krajín, kde malo prístup k elektrine iba 10% ľudí, 6 krajín, kde malo prístup k elektrine 20% ľudí, atď.


11.4: Vykreslenie údajov - matematika

A frekvenčné rozdelenie sa často používa na zoskupenie kvantitatívnych údajov. Hodnoty údajov sú zoskupené do tried s rovnakou šírkou. Nazývajú sa najmenšie a najväčšie pozorovania v každej triede triedne limity, zatiaľ čo hranice triedy sú jednotlivé hodnoty vybrané do samostatných tried (často ide o stredné body medzi hornými a dolnými limitmi susedných tried).

Napríklad tabuľka nižšie uvádza frekvenčné rozdelenie pre nasledujúce údaje:

Jeden by mal používať pekné „okrúhle“ čísla pre limity vašej triedy, pokiaľ neexistuje závažný dôvod, prečo sa tomu vyhnúť. Uľahčí to čítanie vašej frekvenčnej distribúcie. Napríklad, ak vaše dáta začínajú 43, 46, 48, 48, 52, 57, 58,. môžete zvoliť dolný limit triedy 40 a šírku triedy 5 (za predpokladu, že z toho vyplynul primeraný počet tried)

A relatívna distribúcia frekvencie je veľmi podobný, až na to, že namiesto hlásenia toho, koľko dátových hodnôt spadá do triedy, hlási zlomok dátových hodnôt, ktoré spadajú do triedy. Tieto sa nazývajú relatívne frekvencie a môžu sa uvádzať ako zlomky, desatinné miesta alebo percentá.

A kumulatívne rozdelenie frekvencií je ďalší variant frekvenčného rozdelenia. Tu namiesto hlásenia toho, koľko dátových hodnôt spadá do niektorej triedy, hlásia, koľko dátových hodnôt obsahuje buď táto trieda, alebo ľubovoľná trieda po jej ľavici.

Nasledujúca tabuľka porovnáva hodnoty pozorované pri rozdelení frekvencií, relatívnom rozdelení frekvencií a kumulatívnom rozdelení frekvencií pre nasledujúcu postupnosť hodov kockami $ textrm 7, 6, 7, 6, 7, 4, 4, 6, 10, 5, 6, 11, 4, 8, 2, 9, 6, 5, 3, 8, 3, 3, 12, 9, 10, 7, 6, 7, 4, 6 $ $ začiatok textrm & textrm & textrm & textrm & textrm hline 2 - 3 & 1,5 - 3,5 & 4 & 2/15 & 4 hline 4 - 5 & 3,5 - 5,5 & 6 & 1/5 & 10 hline 6 - 7 & 5,5 - 7,5 & 12 & 2/5 & 22 hline 8 - 9 & 7,5 - 9,5 & 4 & 2/15 & 26 hline 10 - 11 & 9,5 - 11,5 & 3 & 1/10 & 29 hline 12 - 13 a 11,5 - 13,5 a 1 a 1/30 a 30 koniec$

A frekvenčný histogram je grafická verzia rozdelenia frekvencií, kde sa šírka a poloha obdĺžnikov používa na označenie rôznych tried, pričom výšky týchto obdĺžnikov označujú frekvenciu, s akou údaje spadajú do priradenej triedy, ako naznačuje nasledujúci príklad.

Frekvenčné histogramy by mali byť označené buď hranicami triedy (ako je znázornené nižšie), alebo strednými bodmi triedy (v strede každého obdĺžnika).

Samozrejme je možné podobne zostaviť histogramy relatívnej a kumulatívnej frekvencie.

Účelom týchto grafov je „vidieť“ distribúciu údajov. Pri použití kalkulačky alebo softvéru na vykreslenie histogramov experimentujte s rôznymi voľbami hraníc, s výhradou vyššie uvedených obmedzení, aby ste zistili, ktoré grafické vlastnosti (modalita, šikmosť alebo symetria, odľahlé hodnoty atď.) Pretrvávajú a ktoré sú iba falošnými účinkami konkrétny výber hraníc. Potom použite hranice, ktoré najlepšie odhalia tieto trvalé vlastnosti.

Histogramy pravdepodobnosti

Typ grafu úzko súvisiaci s frekvenčným histogramom je a histogram pravdepodobnosti, ktorý zobrazuje pravdepodobnosti spojené s rozdelením pravdepodobnosti podobným spôsobom.

Tu máme obdĺžnik pre každú hodnotu, ktorú môže náhodná premenná predpokladať, kde výška obdĺžnika naznačuje pravdepodobnosť získania príslušnej hodnoty.

Keď možné hodnoty, ktoré náhodná premenná môže predpokladať, sú po sebe idúce celé čísla, ľavá a pravá strana obdĺžnikov sa považujú za stredné body medzi týmito celými číslami - čo ich prinúti skončiť číslom 0,5 $. Šírka každého obdĺžnika je potom $ 1 $, čo znamená, že nielen výška obdĺžnika sa rovná pravdepodobnosti výskytu príslušnej hodnoty, ale aj plocha obdĺžnika. (Tieto pozorovania sa stanú veľmi dôležitými neskôr, keď použijeme „korekciu spojitosti“ na priblíženie diskrétneho rozdelenia pravdepodobnosti ku spojitému.)