Normale verdeling

< Alle onderwerpen

De normale verdeling in praktijk. Voor een normale verdeling van data is de relatie tussen het gemiddelde, de mediaan en de modus allemaal gelijk.
In praktijk betekent dit het volgende.

Stel, we pakken 100 bananen van de oogst. Het blijkt dat deze normaal verdeeld zijn. Het gemiddelde is 50 gram (dat is dus tevens de modus en mediaan!), het minimum is 25 gram en het maximum is 75 gram. We nemen even aan dat de standaarddeviatie hier 7,5 gram is.

Tussen de blauw lijnen zit 68,27% van de meetwaarden – oftewel 68,27% van 100 betekent 68,27 bananen. Die 68,27 bananen wegen dus tussen de 50 – 7,5 gram en 50 + 7,5 gram; tussen de 42,5 en 57,5 gram.

Tussen de oranje lijnen zit 95,45% van de meetwaarden – oftewel 95,45 bananen. Deze wegen tussen de 50 – 2 x 7,5 gram en 50 + 2 x 7,5 gram; oftewel tussen de 35 en 65 gram.

Tot slot zitten er tussen de groene lijnen 99,73% – 99,73 bananen. Deze zitten tussen 50 – 3 x 7,5 gram en 50 + 3 x 7,5 gram; oftewel tussen de 27,5 en 72,5 gram.

Best belangrijk om te weten wat je koopt als inkoper van en groot groentebedrijf. Maar als het gaat om verschillen in producten kan dit ook gaan om klachten die klanten doorgeven. Het materiaal was te dun of te dik. Zelfs in een ziekenhuis kan het belangrijk zijn.

Volgende voorbeeld:
Voorbeeld: de lengte van de man in Nederland gedraagt zich volgens een normale verdeling. De gemiddelde bedraagt 1,84m. De kans dat een man langer is dan 1,84m is net zo groot als de kans dat een man kleiner is dan 1,84m.
De grenzen waartussen zich 68,27% van alle mannen rondom het gemiddelde bevindt, heet de standaardafwijking σ.
In totaal hebben 99,73% van de mannen een lengte van het gemiddelde (1,84m) plus of min 3 keer de standaardafwijking σ.
In totaal 99,9997% van de mannen hebben een lengte van het gemiddelde (1,84m) plus of min 6 keer de standaardafwijking σ (6σ).

De betekenis van 6σ
Bij de Six Sigma-techniek kwam men er in de praktijk achter dat zelfs een perfect proces altijd een beetje inslijt. Op empirische wijze is bepaald dat dit inslijten het best kan worden vertaald door de normale verdeling met een afstand van 1,5σ horizontaal te verschuiven. Dit leidt tot onderstaande kwaliteitspercentages voor de 6σ-methodiek.

Het Griekse symbool voor ? (sigma) wordt in de statistiek gebruikt als maat voor spreiding en wordt veelal de standaardafwijking (standaarddeviatie) genoemd. Veel kwaliteitsproblemen zijn gerelateerd aan de spreiding in kwaliteitskenmerken. Als immers een kenmerk veel variatie heeft rond zijn streefwaarde, zal dit kenmerk regelmatig tot buiten de toleratie- of specificatiegrenzen variëren.

De variatie van veel kwaliteitskarakteristieken kan beschreven worden met de zogenaamde normale verdeling. De normaalkromme geeft de relatieve frequentie weer waarmee een zekere kwaliteitsmetriek een bepaalde waarde aanneemt.
De waarde die het vaakst wordt aangenomen is tevens de gemiddelde waarde µ (mu). In de bovenstaande figuur zijn de streefwaarde en de specificatiegrenzen voor het kenmerk aangegeven. In eerste instantie gaan we ervan uit dat de gemiddelde waarde van het kenmerk samenvalt met zijn streefwaarde.

We zien dat het kwaliteitskenmerk zo nu en dan een waarde zal aannemen die buiten de specificatiegrenzen (LSL, USL) ligt. Indien deze grenzen op een afstand van drie keer de standaardafwijking (3sigma) vanaf de streefwaarde liggen, gebeurt dit met een frequentie van ongeveeer 0,27%. Indien de spreiding van dit kenmerk kleiner wordt, zal de standaardafwijking misschien wel vier keer tussen de specificatiegrenzen en de streefwaarde passen (4sigma). Het percentage buiten specificatie wordt dan 0,0063%. Met andere woorden: hoe groter de afstand tussen de streefwaarde en de specificatiegrenzen (in veelvouden van sigma), des te beter presteert het proces. Een ‘3sigma’-proces produceert meer uitval dan een ‘4?’-proces. We zien dat het Sigma-niveau een maat is voor het aantal gebrekkige producten die een proces produceert (hoe hoger het Sigma-niveau, des te beter presteert het proces).

Het is een gegeven dat een kenmerk gemiddeld niet precies op de streefwaarde zit. Over een langere periode van productie zal het gemiddelde fluctueren rond de streefwaarde. Om hiervoor te corrigeren wordt er vaak vanuit gegaan dat het gemiddelde tot maximaal 1,5 x sigma afwijkt van de streefwaarde.
Het aantal defecte producten dat een 3sigma-proces dan produceert, is fors groter, namelijk 6,7%. Deze berekening – die corrigeert voor een verschuiving van het gemiddelde ten opzichte van de streefwaarde van 1,5? – wordt het lange-termijn-Sigma-niveau genoemd.
De tabel geeft voor een aantal Sigma-niveaus het corresponderende uitvalspercentage en de opbrengst weer.
Door de relatie te gebruiken tussen Sigma-niveaus en uitvalspercentages (zoals weergegeven in de tabel) kunnen we het Sigma-niveau algemener toepassen en ook gebruiken als een maat (of ‘metriek’) voor processen die zich niet gedragen volgens de normale verdeling.

Nog een voorbeeld:
In een melkfabriek staat een machine die melkpakjes van een 500 mL vult. Hij staat precies ingesteld op 500 mL. Eén van de werknemers kijkt van 150 pakken na wat de precieze netto inhoud is. Hij stelt vast dat de gemiddelde netto inhoud μ van de pakken inderdaad 500 mL is. Verder rekent hij uit dat de standaardafwijking σ van de machine 12 mL is.Bereken hoeveel pakken…a …minder inhouden dan 500 mL.b …meer inhouden dan 512 mL.c …een inhoud hebben van tussen de 488 en 512 mL.

a 50% van 150 = 75 pakken
b 13,5% + 2,5% = 16% 16% van 150 = 24 pakken
c 34% + 34% = 68% 68% van 150 = 102 pakken

Call Now Button

X