Minitab

< Alle onderwerpen

Minitab Algemeen

Minitab 17 statistische software
Bedrijfsvoering steunt vandaag meer dan ooit op concreet cijfermateriaal. Kwaliteitsprogramma’s (zoals onder andere Six Sigma) zijn bij het grote publiek héél populair omdat ze op een kwantitatieve manier de kosten van bedrijven in kaart brengen.
Door processen of producten en/of dienstverlening van een organisatie op een statistisch correcte manier te analyseren, komen de oorzaken van de problemen aan het licht, worden de juiste prioriteiten gesteld, reduceert men foutkosten en creëert men ook een grotere klantentevredenheid.
Het gebruik van statistische methoden en technieken hoeft trouwens niet beperkt te blijven tot bestaande processen en producten, maar kan tevens gebruikt worden om bvb. de robuustheid van nieuwe producten te verifiëren, o.a. door gebruik te maken van statistisch proefopzet.
Deze opleiding richt zich voornamelijk tot:
• Iedereen die in zijn organisatie bezig is met data-analyse.
• Iedereen die Six Sigma training volgt of gevolgd heeft; hetzij Green Belts of Black Belts.
• Managers en project sponsors van verbeterprojecten waarin data analyse technieken gebruikt worden.
• Laboranten, QA/QC medewerkers en verantwoordelijken,
• Productieverantwoordelijken, productie-ingenieurs, kwaliteitsverantwoordelijken en medewerkers die instaan voor continue verbetering binnen hun organisatie.
• R & D medewerkers, ontwerpingenieurs, …
Deelnemers die deze opleiding wensen te volgen dienen enige voorkennis te hebben van basisstatistiek en hypothesetesten.
Wat is Minitab?
Wat hebben American Express, General Electric, IBM, McDonald’s, Microsoft, Nike, Pepsi, Shell, Toyota en Ford met elkaar gemeen? Ze gebruiken allemaal Minitab.
Minitab helpt je om beslissingen te nemen op basis van data en de goede oorzaken aan te pakken om daarmee een concurrentievoordeel te behalen. Kenmerk van top-performing companies is dat ze de kracht van data gebruiken om goede besluiten te nemen en ontwikkelingen te zien voordat anderen die zien. Of het nu een trend is of een patroon, Minitab ondersteunt je daarbij.
Wat doet Minitab?
Minitab is een computerprogramma voor gewone en geavanceerde statistische functies. Het combineert de gebruiksvriendelijkheid van Excel en de mogelijkheid om ingewikkelde statistische analyses te maken. Kort gezegd kun je met Minitab:
• Diverse data visualiseren
• Diverse data analyseren
• Kwaliteit van processen beoordelen
• Optimalisatieproeven uitvoeren om het maximale uit het proces te halen

Agendapunten voor trainingen Minitab 17 (in opbouw, training momenteel niet beschikbaar.)
Minitab 17 is een zeer compleet statistisch programma en het is onmogelijke om alle deelaspecten ervan aan bod te laten komen in één opleidingsdag. U krijgt een introductie waarmee u aan de slag kunt en een aantal statistische standaardprocedures kunt toepassen. We zullen hierbij voornamelijk focussen op het gebruik van de Minitab 17 Assistant. De inhoud van de opleiding ziet er als volgt uit:
• Basisprincipes en opbouw
o Data genereren, invoeren en manipuleren
o Minitab vensters
o Standard toolbar
o Gebruik van het data venster
o Minitab projecten en werkbladen
o De Project Manager
o De Grafiek Manager
• De Minitab 17 Assistant
o Werking van de assistant
o Opbouw
o Data behandeling
• Grafische data-analyse met de assistant
o Data verdelingen tonen
o Variabelen plotten in de tijd
o Verbanden tussen variabelen grafisch weergeven
• Hypothese testen – statistisch vergelijken van grootheden
o Een sample vergelijken met een waarde
o Twee samples met elkaar vergelijken
o Meer dan twee samples met elkaar vergelijken
• Regressie analyse
o Enkelvoudige regressie
o Meervoudige regressie
• Tools voor process studie
o Proces capabiliteit (within/overall, expected/observed)
o Meetsysteem analyse: Continue & Attributieve data
o Regelkaarten
o Overzicht van andere mogelijkheden (introductie).
Deze opleiding wordt interactief opgebouwd :
1. De trainer geeft een korte uitleg over de achtergrond van een bepaalde statistische bewerking. Deze theoretische benadering wordt als een opfrissing gezien en wordt beperkt tot het uiterste minimum.
2. De trainer demonstreert de statistische bewerking met Minitab aan de deelnemers.
3. De deelnemers kunnen de statistische bewerking zelf inoefenen aan de hand van een oefening.
4. Groepsbespreking.
Om de opgedane technieken meteen te kunnen toepassen is het essentieel dat u een laptop meebrengt met de Minitab 17 software. Deze software kunt u gratis downloaden via Minitab en na installatie gratis gebruiken voor een proefperiode van 30 dagen.
Laatste wijziging: dinsdag, 17 december 2019, 22:53
Minitab Basis

Minitab is een softwarepakket dat gebruikt wordt voor de statistische analyses binnen Lean Six Sigma. Bij het uitvoeren van de cases ga je actief aan de slag met Minitab.
Je dient dus zelf over een laptop met Minitab te beschikken. In de bijeenkomsten 3, 4 en 5 gaan we in de les actief aan de slag met Minitab, dus neem de laptop dan ook mee.
Je kunt een Minitab licentie hier aanschaffen, maar het is een prijzig pakket ($1250). Je kunt ook gebruik maken van een trial versie op je laptop van de jongste versie nl Minitab 18, deze kan je hier downloaden. Let wel op, deze versie is gratis een maand beschikbaar na je eerste aanmelding. Daarna werkt het pas na aanschaffen van de licentie weer. Indien je toevallig over een tweede laptop of desktop beschikt kun je dus nog wel een extra maand verder werken. De docent kan jou adviseren wat een goed moment is om de gratis maand te starten.
Werk je met Apple? Dan kun je gebruik maken van Apple Bootcamp in combinatie met een windowsinstallatie. Lees hier hoe dat werkt. Het is raadzaam om, als je Lean Six Sigma projecten gaat starten in je bedrijf of organisatie, een volle licentie voor deze software aan te schaffen. Het hoort bij de standaard software voor een Lean Six Sigma Black Belt.
Het verhaal
Een online boekwinkel heeft drie regionale expeditie centra die zorgen voor de distributie van bestellingen naar consumenten. Elk expeditie centrum gebruikt een ander computersysteem om orderinformatie in te voeren en te verwerken.
Het bedrijf wil op al deze drie expeditie centra hetzelfde computersysteem gebruiken om alle orders te kunnen integreren en door het hele bedrijf de meest efficiënte manier te hanteren.
In de loop van deze training analyseert u gegevens van de expeditiecentra terwijl u leert werken met Minitab. U maakt grafieken en voert statistische analyses uit om te bepalen welk computersysteem het meest efficiënt is en tot de kortste levertijd leidt. Nadat u hebt bepaald welk computersysteem het efficiëntst is, richt u zich op de gegevens van dit centrum.
Om te beginnen maakt u controlediagrammen om te zien of het verzendproces van het centrum onder controle is. Vervolgens voert u een capaciteitsanalyse uit om te zien of het proces werkt binnen de specificatiegrenzen.
Ten slotte voert u een ontworpen experiment uit om de processen van het expeditiecentrum verder te verbeteren. Bovendien leert u meer over sessieopdrachten en leert u hoe u rapporten genereert, werkbladen voorbereidt en Minitab aanpast.

In Minitab kunt u drie typen gegevens invoeren: numerieke, alfanumerieke en datum-/tijdgegevens
Dit werkblad bevat gegevens van elk type. De gegevens bestaan uit:
Kolom met datum-/ tijdgegevens
Kolomnaam
Kolom met numerieke gegevens
Kolom met alfanumerieke gegevens
Rijnummer
■ Naam van het expeditiecentrum
■ Besteldatum
■ Afleverdatum
■ Aantal leveringsdagen
■ Leveringsstatus (“On time” geeft aan dat het boek op tijd is ontvangen; “Back order” geeft aan dat het boek momenteel niet in voorraad is; “Late” geeft aan dat het boek zes of meer dagen na bestelling is ontvangen)
■ Afstand van het expeditiecentrum tot de afleverlocatie

Gegevens in een grafiek uitzetten
Doelstellingen:
■ A. Een plot met individuele waarden maken en interpreteren
■ B. Een histogram met groepen maken
Een histogram bewerken
Meerdere histogrammen op dezelfde pagina rangschikken
Help-informatie weergeven
■ C. Een scatterplot maken en interpreteren
Een scatterplot bewerken
■ D. Meerdere grafieken op dezelfde pagina rangschikken
Grafieken afdrukken
Een project opslaan
Voor de gegevens van het expeditie centrum wilt u naast de gemiddelde levertijd van elk expeditie centrum ook weten hoe variabel de gegevens zijn binnen elk expeditie centrum. U wilt ook bepalen of de gegevens van het expeditie centrum normaal verdeeld zijn, zodat u standaard statistische methoden kunt gebruiken om de gelijkheid van gemiddelden te testen.
A. Een plot met individuele waarden maken
U vermoedt dat de levertijd verschilt voor de drie expeditie centra. Maak een plot met individuele waarden om de gegevens van de expeditie centra te vergelijken.
4 Kies Graph ➤ Individual Value Plot. Voor de meeste grafieken wordt in Minitab een afbeeldingengalerij weergegeven. De keuze die u maakt in de afbeeldingengalerie bepaalt welke opties u kunt kiezen om een grafiek te maken.
5 Kies onder One Y de optie With Groups en klik op OK.

6 Voer in het vak Graph variables de variabele Days in.

7 Voer in het vak Categorical variables for grouping (1-4, outermost first) de variabele Center in. Als u een grafiek wilt maken, hoeft u alleen de velden in het hoofddialoogvenster in te vullen. U kunt echter met behulp van de beschikbare knoppen vervolgdialoogvensters openen waarin u de grafiek verder kunt aanpassen.

In de keuzelijst links worden de variabelen uit het werkblad weergegeven die beschikbaar zijn voor de analyse. In de vakken rechts worden de variabelen weergegeven die u voor de analyse selecteert.
8 Klik op Data View. Schakel het selectievakje Mean connect line in.
9 Klik op OK in elk dialoogvenster.

De plots met individuele waarden laten zien dat elk centrum een andere gemiddelde levertijd heeft. Het centrum Western heeft een kortere levertijd dan de centra Central en Eastern. De variatie binnen elk expeditiecentrum lijkt ongeveer gelijk.
B. Een histogram met groepen maken
U kunt de drie expeditie centra ook met elkaar vergelijken door een gegroepeerd histogram te maken, waarbij de histogrammen voor elk centrum in dezelfde grafiek worden gemaakt. Het gegroepeerde histogram laat zien hoeveel de gegevens van elk expeditie centrum elkaar overlappen.
1 Kies Graph ➤ Histogram.
2 Kies With Fit And Groups en klik op OK.
3 Voer in het vak Graph variables de variabele Days in.
4 Voer in het vak Categorical variables for grouping (0-3) de variabele Center in.
5 Klik op OK.

Zoals u zag in de plot met individuele waarden zijn de gemiddelden voor elk centrum verschillend. De gemiddelde levertijden zijn: Central: 3,984 dagen Eastern: 4,452 dagen Western: 2,981 dagen Het gegroepeerde histogram laat zien dat de centra Central en Eastern vrijwel dezelfde gemiddelde levertijd en spreiding van levertijd hebben. Het centrum Western daarentegen heeft een kortere gemiddelde levertijd en heeft minder spreiding.
Als u wilt bepalen of de gegevens van het expeditiecentrum normaal verdeeld zijn, maakt u een histogram met meerdere deelvensters van de tijd die verstrijkt tussen de bestel- en afleverdatum.
1 Kies Graph ➤ Histogram.
2 Kies With Fit en klik op OK.
3 Voer in het vak Graph variables de variabele Days in.
Behalve aparte grafieken bewerken kunt u ook de standaardinstellingen wijzigen voor grafieken die u later maakt.
■ Wanneer u algemene grafiekinstellingen wilt wijzigen, zoals letterkenmerken, grootte van de grafiek en lijntypen, kiest u Tools ➤ Options ➤ Graphics.
■ Wanneer u grafiekspecifieke instellingen wilt wijzigen, zoals het schalingstype voor een histogram of de methode voor de berekening van de uitgezette punten op waarschijnlijkheidsplots, kiest u Tools ➤ Options ➤ Individual Graphs. De volgende keer dat u een dialoogvenster opent waarop de wijzigingen van toepassing zijn, zijn uw voorkeuren daarin verwerkt.
4 Klik op Multiple Graphs en klik op het tabblad By Variables.
5 Voer in het vak By variables with groups in separate panels de variabele Center in.
6 Klik op OK in elk dialoogvenster.
De levertijden voor elk centrum hebben een min of meer normale verdeling, zoals blijkt uit de distributiecurven, die hetzelfde patroon te zien geven.

Relaties tussen twee variabelen beoordelen Met grafieken kunt u makkelijker bepalen of er koppelingen zijn tussen variabelen en hoe sterk deze eventueel zijn. Wanneer u weet welke relatie er is tussen variabelen, kan dat u helpen bij verdere analyses en bij het bepalen van welke variabelen belangrijk zijn om te analyseren. Aangezien elk expeditie centrum een regionaal leveringsgebied bedient, vermoedt u dat de afstand tot de leveringslocatie geen groot effect heeft op de levertijd. Om dit vermoeden te controleren en om afstand als een potentieel belangrijke factor uit te schakelen, onderzoekt u de relatie tussen levertijd en leveringsafstand.

C. SCATTERPLOT
1 Kies Graph ➤ Scatterplot.
2 Kies With Regression en klik op OK.
3 Voer in het vak Y variables de variabele Days in. Voer in het vak X variables de variabele Distance in.
4 Klik op Multiple Graphs en klik op het tabblad By Variables.
5 Voer in het vak By variables with groups in separate panels de variabele Center in.
6 Klik op OK in elk dialoogvenster.

De punten op de scatterplot vertonen bij geen van de drie centra een duidelijk patroon. De regressielijn voor elk centrum is relatief vlak, wat suggereert dat de nabijheid van een leveringslocatie bij een expeditiecentrum geen invloed heeft op de levertijd.
D. Werken met grafieklay-outs en afdrukken
Gebruik de lay-outfunctie voor grafieken van Minitab om meer grafieken op één pagina te plaatsen. U kunt notities toevoegen aan de lay-out en de aparte grafieken binnen de lay-out bewerken. Aangezien u uw chef de voorlopige resultaten van de grafische analyse van de verzendgegevens wilt laten zien, geeft u alle vier grafieken weer op één pagina.
1 Maak de scatterplot actief en kies Editor ➤ Layout Tool. De actieve grafiek, de scatterplot, is al opgenomen in de lay-out
2 Klik op de scatterplot en sleep deze naar de hoek rechtsonder in de lay-out.
3 Klik op om de plot met individuele waarden in de hoek linksboven in de lay-out te plaatsen.
4 Klik op om het gegroepeerde histogram in de hoek rechtsboven te plaatsen.
5 Klik op om het histogram met meerdere deelvensters in de hoek linksonder te plaatsen.
6 Klik op Finish.

Als de gegevens van het werkblad veranderen nadat u de lay-out hebt gemaakt, worden de grafieken in de lay-out in Minitab niet automatisch bijgewerkt. U moet dan de lay-out opnieuw maken met de bijgewerkte aparte grafieken.
Wat is de volgende stap?
De grafische uitvoer geeft aan dat de drie expeditie centra verschillende levertijden hebben voor bestelde boeken. In de volgende info geeft u de beschrijvende statistische gegevens weer en voert u een variantieanalyse (ANOVA) uit om te testen of de verschillen tussen de expeditie centra statistisch significant zijn.
Gegevens analyseren
Doelstellingen Met deze info leert u het volgende:
■ Beschrijvende statistische gegevens weergeven en interpreteren. De statistieken die een populatie samenvatten worden aangeduid als beschrijvende statistiek.
■ Een eenzijdige ANOVA uitvoeren en interpreteren
■ Ingebouwde grafieken weergeven en interpreteren
■ De StatGuide openen
■ Werken met de Project Manager
Overzicht
De statistiek biedt principes en methoden waarmee gegevens kunnen worden verzameld, samengevat, geanalyseerd en geïnterpreteerd en conclusies kunnen worden getrokken uit analyseresultaten. De statistiek kan worden gebruikt om gegevens te beschrijven en om conclusies te trekken, en deze beschrijvingen en conclusies kunnen helpen bij het nemen van beslissingen en kunnen processen en producten verbeteren.
Minitab biedt:
■ Een groot aantal statistische methoden gerangschikt op categorie, zoals regressie, ANOVA, hulpmiddelen voor kwaliteit en tijdreeksen
■ Ingebouwde grafieken, die u helpen de gegevens te begrijpen en resultaten te valideren
■ De mogelijkheid om statistische gegevens en diagnostische metingen weer te geven en op te slaan In dit hoofdstuk maakt u kennis met de statistische opdrachten, ingebouwde grafieken, StatGuide en de Project Manager van Minitab.
U gaat het aantal te laat geleverde bestellingen en nabestellingen beoordelen en u test of het verschil in levertijd tussen de drie expeditiecentra statistisch significant is.
Beschrijvende statistische gegevens weergeven
In beschrijvende statistische gegevens worden de prominente kenmerken van gegevens samengevat en beschreven. Gebruik de functie Display Descriptive Statistics om voor elk expeditiecentrum uit te zoeken hoeveel boekbestellingen op tijd zijn geleverd, hoeveel er te laat zijn geleverd en hoeveel er aanvankelijk werden nabesteld.
Beschrijvende statistische gegevens weergeven
1 Als u zojuist de procedures van het vorige hoofdstuk hebt gevolgd, kiest u File ➤ New en kiest u vervolgens Minitab Project. Klik op OK. Start anders Minitab.
2 Kies File ➤ Open Worksheet.
3 Klik op Look in Minitab Sample Data folder, onder in het dialoogvenster.
4 Dubbelklik in de map Sample Data op Ontdek Minitab en kies vervolgens ShippingData.MTW. Klik op Open..
5 Kies Stat ➤ Basic Statistics ➤ Display Descriptive Statistics.
6 Voer in het vak Variables de variabele Days in.
7 Voer in het vak By variables (optional) de variabele Center Status in. Voor de meeste opdrachten in Minitab hoeft u alleen de velden in het hoofddialoogvenster in te vullen om de opdracht uit te voeren. Maar vaak kunt u in de vervolgdialoogvensters de analyse wijzigen of extra uitvoer, zoals grafieken, laten weergeven.
8 Klik op Statistics.
9 Schakel de selectievakjes First quartile, Median, Third quartile, N nonmissing en N missing uit.
10 Schakel N total in.

Binnen elk centrum kunt u het aantal nabestellingen, te laat geleverde bestellingen en op tijd geleverde bestellingen terugvinden in de kolom Total Count.
■ Het expeditiecentrum Eastern heeft de meeste nabestellingen (8) en te laat geleverde bestellingen (9).
■ Het expeditiecentrum Central heeft daarna de meeste nabestellingen (6) en te laat geleverde bestellingen (6).
■ Het expeditiecentrum Western heeft het kleinste aantal nabestellingen (3) en heeft geen te laat geleverde bestellingen.
In het venster Session wordt uitvoer in tekstvorm weergegeven, die u kunt bewerken, toevoegen aan het ReportPad en afdrukken.
U kunt in de uitvoer in het venster Session ook gemiddelden, standaardfouten van het gemiddelde, standaardafwijkingen en minima en maxima van de orderstatus voor elk centrum controleren. Deze statistische gegevens worden niet gegeven voor nabestellingen omdat er geen leveringsinformatie is voor deze bestellingen.

Een ANOVA uitvoeren (ANalysis Of VAriance)
Een van de meest algemeen gebruikte methoden bij statistische beslissingen is de hypothesetest* Minitab biedt een groot aantal opties voor hypothesetests, zoals t-tests en variantieanalyses.
In het algemeen wordt er bij een hypothesetest van uitgegaan dat een eerste bewering waar is en vervolgens wordt deze bewering getest met steekproefgegevens.
Hypothesetests bevatten twee hypothesen:
de nulhypothese (aangeduid met H0) en de alternatieve hypothese (aangeduid met Ha of H1).
De nulhypothese is de eerste bewering en wordt vaak bepaald op basis van eerder onderzoek of algemene kennis.
De alternatieve hypothese is de bewering waarvan u denkt dat die mogelijk waar is.
*hypothese (aanname)
Op basis van de grafische analyse die u hebt gedaan en de beschrijvende analyse hiervoor, vermoedt u dat het verschil in het gemiddelde aantal leveringsdagen (respons) verspreid over de expeditie centra statistisch significant (juist) is.
Significant: Volgens de Van Dale is de betekenis: “statistisch niet aan toeval toe te schrijven en dus betekenisvol”. Ook in onderzoek wordt het zo opgevat: significant betekent het onderscheiden van toeval. Als er gevraagd wordt of iets significant verschilt, dan wordt er dus gevraagd: “Is er meer aan de hand dan toeval?“.
Om dit te controleren, voert u een eenzijdige ANOVA uit, waarbij de gelijkheid wordt getest van twee of meer gemiddelden die op één factor zijn gecategoriseerd. Voer ook een Tukey-test voor een meervoudige vergelijking uit om te zien welke expeditiecentrum-gemiddelden afwijken.

1 Kies Stat ➤ ANOVA ➤ One-Way.
2 Voer in het vak Response de variabele Days in. Voer in het vak Factor de variabele Center in. In een groot aantal dialoogvensters voor statistische opdrachten kunt u veelgebruikte opties of opties die vaak nodig zijn kiezen. Klik op de knoppen van de vervolgdialoogvensters als u andere opties wilt kiezen.
3 Klik op Comparisons.
4 Schakel het selectievakje Tukey’s, family error rate in en klik op OK.
5 Klik op Graphs.
6 Schakel de selectievakjes Individual value plot en Boxplots of data in.
7 Kies onder Residual Plots de optie Four in one.
8 Klik op OK in elk dialoogvenster.

One-way ANOVA: Days versus Center
Method
Null hypothesis All means are equal
Alternative hypothesis At least one mean is different
Significance level α = 0,05
Rows unused 17
Equal variances were assumed for the analysis.
Factor Information
Factor Levels Values
Center 3 Central; Eastern; Western
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Center 2 114,6 57,317 39,19 0,000
Error 299 437,3 1,462
Total 301 551,9
Model Summary
S R-sq R-sq(adj) R-sq(pred)
1,20933 20,77% 20,24% 19,17%
Means
Center N Mean StDev 95% CI
Central 99 3,984 1,280 (3,745; 4,223)
Eastern 101 4,452 1,252 (4,215; 4,689)
Western 102 2,981 1,090 (2,746; 3,217)
Pooled StDev = 1,20933
Tukey Pairwise Comparisons
Grouping Information Using the Tukey Method and 95% Confidence
Center N Mean Grouping
Eastern 101 4,452 A
Central 99 3,984 B
Western 102 2,981 C
Means that do not share a letter are significantly different.

Het beslissingsproces voor een hypothesetest kan worden gebaseerd op de waarschijnlijkheidswaarde (p-waarde) voor de gegeven test.
■ Als de p-waarde kleiner is dan of gelijk is aan een vooraf bepaald niveau van significantie (alpha-niveau), verwerpt u de nulhypothese en claimt u steun voor de alternatieve hypothese.
■ Als de p-waarde groter is dan het alpha-niveau, slaagt u er niet in de nulhypothese af te wijzen en kunt u geen steun claimen voor de alternatieve hypothese.
In de ANOVA-tabel biedt de p-waarde (0,000) voldoende bewijs dat de gemiddelde levertijd voor minimaal een van de expeditiecentra afwijkt van de andere wanneer a 0,05 is. In de tabel van individuele betrouwbaarheidsintervallen van 95% ziet u datgeen van de intervallen elkaar overlappen, wat de theorie ondersteunt dat de gemiddelden statistisch verschillend zijn. U moet echter de resultaten van de meervoudige vergelijking interpreteren om te zien waar de verschillen tussen de gemiddelden van de expeditiecentra zitten. De Tukey-test levert groeperingsinformatie en twee sets intervallen van meervoudige vergelijkingen. In de groeperingstabel zijn factorniveaus binnen dezelfde groep niet significant verschillend van elkaar. Elk expeditiecentrum zit in een andere groep. Derhalve hebben de gemiddelden op alle niveaus significant andere gemiddelde levertijden.
De Tukey-betrouwbaarheidsintervallen laten het volgende zien:
■ Het gemiddelde van het expeditie centrum Central afgetrokken van de gemiddelden van de expeditie centra Eastern en Western
■ Het gemiddelde van het expeditie centrum Eastern afgetrokken van het gemiddelde van het centrum Western Het eerste interval in de eerste set van de Tukey-uitvoer is 0,068 tot 0,868. Dat wil zeggen, de gemiddelde levertijd van het centrum Eastern min het gemiddelde van het centrum Central ligt ergens tussen 0,068 en 0,868 dagen.
De leveringen van het centrum Eastern duren langer dan de leveringen van het centrum Central. U interpreteert op dezelfde manier de andere resultaten van de Tukey-test. De gemiddelden voor alle expeditiecentra verschillen significant omdat alle betrouwbaarheidsintervallen nul uitsluiten. Dus alle expeditiecentra hebben significant andere gemiddelde levertijden. Het expeditiecentrum Western heeft de snelste gemiddelde levertijd (2,981 dagen).

■ Normale waarschijnlijkheidsplot: om niet-normaliteit te detecteren. Een min of meer rechte lijn wijst erop dat de residuen een normale verdeling hebben.
• Residu-analyse is het analyseren van verschillen in modelwaarden en geobserveerde waarden. Dit verschil wordt in de statistiek residu (geleend van de chemie) genoemd.
• Met een residu-analyse kun je de kwaliteit van een statistisch model beoordelen.
De plots met individuele waarden en de boxplots geven aan dat de levertijd per expeditiecentrum verschilt, wat consistent is met de voorgaande grafieken. De boxplot voor het expeditiecentrum Eastern wijst op de aanwezigheid van één uitschieter (aangegeven met *), een bestelling met een ongebruikelijk lange levertijd. Gebruik residuplots, die u kunt kiezen bij veel statistische opdrachten, om statistische aannamen te controleren:
■ Normale waarschijnlijkheidsplot: om niet-normaliteit te detecteren. Een min of meer rechte lijn wijst erop dat de residuen een normale verdeling hebben.
■ Histogram van de residuen: om meerdere pieken, uitschieters en niet-normaliteit te detecteren. Het histogram moet min of meer symmetrisch en klokvormig zijn.
■ Residuen ten opzichte van de voorspelde waarden: om niet-constante variantie, ontbrekende hogere-ordetermen en uitschieters te detecteren. De residuen moeten in een willekeurig patroon rond de nul zijn verdeeld.
■ Residuen ten opzichte van volgorde: om de tijdsafhankelijkheid van residuen te detecteren. De residuen moeten geen duidelijk patroon te zien geven. Voor de verzendgegevens wijzen de vier-in-één residuplots niet op schendingen van statistische aannamen. Het model van de eenzijdige ANOVA past redelijk goed bij de gegevens.
Laatste wijziging: dinsdag, 17 december 2019, 23:10
Probabiliteit (waarschijnlijkheid)
Probability Plot (normaliteitsplot)
Veel statistische technieken zijn gebaseerd op de veronderstelling dat de populatie bij benadering normaal verdeeld is. Daarom is het belangrijk eerst te bepalen of de steekproefgegevens uit een normaal verdeelde populatie komen, voordat je deze technieken kan toepassen.
Een beoordeling aan de hand van een frequentieverdeling (histogram, dot plot) biedt niet altijd voldoende zekerheid. De Probability Plot (normaliteitsplot) heeft een zodanige schaalverdeling dat de grafiek van een theoretisch zuivere normale verdeling een rechte lijn wordt. Hoe beter data in een normaliteitsplot op een rechte lijn liggen des te beter de data een normale verdeling benaderen. Ter vergelijking kun je de ideale lijn laten tekenen.

Bij een Probability Plot worden de waarnemingen in een gegevensverzameling van klein naar groot geordend en vervolgens in een grafiek uitgezet tegen de bijbehorende verwachte z-waarden als de waarnemingen uit een normale verdeling komen. Eigenlijk is een Probability Plot een spreidingsdiagram met de gesorteerde gegevenswaarden op de ene as, en de bijbehorende verwachte z-waarden van een standaardnormale verdeling op de andere as. Het berekenen van de verwachte standaardnormale z-scores is niet iets wat je handmatig doet, maar over kunt laten aan een statistisch programma, zoals Minitab.
Als de gegevens inderdaad uit een normale verdeling komen, zullen de gevonden punten op een rechte lijn liggen. Als de z-waarden niet bij benadering op een rechte lijn liggen, is dat een duidelijke aanwijzing dat er geen sprake is van een normale verdeling. In het bovenstaande voorbeeld zijn op basis van een betrouwbaarheidsinterval van 95%, twee ‘limietlijnen’ getekend, waarbinnen het merendeel van de punten moet liggen om van een rechte lijn te kunnen spreken.

Call Now Button

X