1. ఎడ్యుకేషన్ మాథ్స్టాటిస్టిక్స్స్టాటిస్టిక్స్ మరియు హిస్టోగ్రామ్స్
ఆన్‌లైన్ ప్రాక్టీస్‌తో డమ్మీస్ కోసం స్టాటిస్టిక్స్ వర్క్‌బుక్, 2 వ ఎడిషన్

రచన డెబోరా జె. రమ్సే

హిస్టోగ్రాం అనేది పరిమాణాత్మక డేటా కోసం తయారు చేసిన బార్ గ్రాఫ్. డేటా సంఖ్యాపరంగా ఉన్నందున, మీరు మధ్యలో ఎటువంటి అంతరాలను వదలకుండా సమూహాలుగా విభజిస్తారు (కాబట్టి బార్లు కనెక్ట్ చేయబడతాయి). Y- అక్షం ప్రతి సమూహంలోకి వచ్చే డేటా యొక్క పౌన encies పున్యాలు (గణనలు) లేదా సాపేక్ష పౌన encies పున్యాలు (శాతాలు) చూపిస్తుంది.

హిస్టోగ్రాం ఎలా సృష్టించాలి

హిస్టోగ్రాం చేయడానికి, మీరు మొదట మీ డేటాను సమాన పొడవు గల సమూహాల సంఖ్యగా విభజించారు. ప్రతి సమూహంలోకి వచ్చే డేటా సెట్‌లోని విలువల సంఖ్యను లెక్కించండి (మరో మాటలో చెప్పాలంటే, ఫ్రీక్వెన్సీ టేబుల్‌ను తయారు చేయండి). ఒక డేటా పాయింట్ సరిహద్దులో పడితే, దాన్ని ఏ సమూహంలో ఉంచాలో ఒక నిర్ణయం తీసుకోండి, మీరు స్థిరంగా ఉండాలని నిర్ధారించుకోండి (ఎల్లప్పుడూ రెండింటిలో ఎక్కువ ఎత్తులో ఉంచండి లేదా ఎల్లప్పుడూ రెండింటి దిగువ భాగంలో ఉంచండి). సమూహాలు మరియు వాటి పౌన encies పున్యాలను ఉపయోగించి బార్ గ్రాఫ్ చేయండి - ఫ్రీక్వెన్సీ హిస్టోగ్రాం.

మీరు మొత్తం నమూనా పరిమాణంతో పౌన encies పున్యాలను విభజిస్తే, ప్రతి సమూహంలో వచ్చే శాతాన్ని మీరు పొందుతారు. సమూహాలను మరియు వాటి శాతాన్ని చూపించే పట్టిక సాపేక్ష పౌన frequency పున్య పట్టిక. సంబంధిత హిస్టోగ్రాం సాపేక్ష పౌన frequency పున్య హిస్టోగ్రాం.

హిస్టోగ్రామ్‌లను రూపొందించడానికి మీరు మినిటాబ్ లేదా వేరే సాఫ్ట్‌వేర్ ప్యాకేజీని ఉపయోగించవచ్చు లేదా మీరు మీ హిస్టోగ్రామ్‌లను చేతితో తయారు చేయవచ్చు. ఎలాగైనా, మీ విరామం వెడల్పుల ఎంపిక (కంప్యూటర్ ప్యాకేజీల ద్వారా డబ్బాలు అని పిలుస్తారు) బొమ్మలలో కనిపించే వాటికి భిన్నంగా ఉండవచ్చు, ఇది మీదే కనిపించేంతవరకు మంచిది. మరియు మీరు అసాధారణంగా తక్కువ లేదా అధిక సంఖ్యలో బార్లను ఉపయోగించనంత కాలం మరియు మీ బార్లు సమాన వెడల్పుతో ఉంటాయి.

ప్రతి విరామానికి మీరు వేర్వేరు ప్రారంభ / ముగింపు పాయింట్లను కూడా ఎంచుకోవచ్చు మరియు ఇది కూడా మంచిది. ప్రతిదీ స్పష్టంగా లేబుల్ చేయడాన్ని నిర్ధారించుకోండి, తద్వారా మీరు ఏమి చేయాలనుకుంటున్నారో మీ బోధకుడు చూడగలరు. మరియు సరిహద్దులో ముగుస్తున్న విలువల గురించి స్థిరంగా ఉండండి; ఎల్లప్పుడూ వాటిని తక్కువ సమూహంలో ఉంచండి లేదా ఎల్లప్పుడూ ఎగువ సమూహంలో ఉంచండి. మీకు ఎంపిక ఉంటే, మినిటాబ్ వంటి కంప్యూటర్ ప్యాకేజీని ఉపయోగించి మీ హిస్టోగ్రామ్‌లను తయారు చేయండి. ఇది మీ పనిని చాలా సులభం చేస్తుంది.

రెండు రకాల హిస్టోగ్రామ్‌లను తయారుచేసే ఉదాహరణ కోసం ఈ క్రింది వాటిని చూడండి.

30 మంది విద్యార్థుల తరగతికి పరీక్ష స్కోర్లు క్రింది పట్టికలో చూపించబడ్డాయి.

ఫ్రీక్వెన్సీ హిస్టోగ్రాములు మరియు సాపేక్ష ఫ్రీక్వెన్సీ హిస్టోగ్రాములు ఒకే విధంగా కనిపిస్తాయి; అవి Y- అక్షంలో వేర్వేరు ప్రమాణాలను ఉపయోగించి పూర్తయ్యాయి.

స్కోర్‌ల డేటా కోసం ఫ్రీక్వెన్సీ హిస్టోగ్రాం క్రింది చిత్రంలో చూపబడింది.

ఫ్రీక్వెన్సీ హిస్టోగ్రామ్

ప్రతి పౌన frequency పున్యాన్ని తీసుకొని 30 (మొత్తం నమూనా పరిమాణం) ద్వారా విభజించడం ద్వారా మీరు సాపేక్ష పౌన encies పున్యాలను కనుగొంటారు. ఈ మూడు సమూహాలకు సాపేక్ష పౌన encies పున్యాలు 8/30 = 0.27 లేదా 27%; 16/30 = 0.53 లేదా 53%; మరియు 6/30 = 0.20 లేదా 20%.

సాపేక్ష పౌన encies పున్యాల ఆధారంగా హిస్టోగ్రాం హిస్టోగ్రాం (అదే డేటా) వలె కనిపిస్తుంది. Y- అక్షంపై ఉన్న లేబుల్ మాత్రమే తేడా.

హిస్టోగ్రామ్‌లను అర్ధం చేసుకోవడం

మీ పరిమాణాత్మక (సంఖ్యా) డేటా యొక్క మూడు ప్రధాన లక్షణాల గురించి హిస్టోగ్రాం మీకు సాధారణ సమాచారాన్ని ఇస్తుంది: ఆకారం, కేంద్రం మరియు వ్యాప్తి.

హిస్టోగ్రాం యొక్క ఆకారం దాని సాధారణ నమూనా ద్వారా చూపబడుతుంది. అనేక నమూనాలు సాధ్యమే, మరియు కొన్ని సాధారణమైనవి, ఈ క్రింది వాటితో సహా:

  • బెల్ ఆకారంలో: గంటలాగా కనిపిస్తుంది - మధ్యలో ఒక పెద్ద ముద్ద మరియు తోకలు ప్రతి వైపు ఒకే రేటుతో క్రిందికి వెళ్తాయి. (మూర్తి a) కుడివైపు వక్రీకృతమైంది: డేటాలో పెద్ద భాగం ఎడమ వైపుకు సెట్ చేయబడింది, కొన్ని పెద్ద పరిశీలనలు కుడి వైపుకు వెళతాయి. (మూర్తి బి) ఎడమవైపు వక్రీకృతమైంది: డేటాలో పెద్ద భాగం కుడి వైపున సెట్ చేయబడింది, కొన్ని చిన్న పరిశీలనలు ఎడమ వైపుకు వెళతాయి. (మూర్తి సి) యూనిఫాం: అన్ని బార్‌లు ఒకే ఎత్తు కలిగి ఉంటాయి. (మూర్తి డి) బిమోడల్: రెండు శిఖరాలు, లేదా (మూర్తి ఇ) U- ఆకారంలో: తక్కువ మరియు ఎత్తైన రెండు శిఖరాలతో బిమోడల్, మధ్యలో తక్కువ డేటా ఉంటుంది. (మూర్తి 4-1 చూడండి (మూర్తి ఎఫ్) సిమెట్రిక్: మీరు మధ్యలో విభజించినప్పుడు ప్రతి వైపు ఒకేలా కనిపిస్తుంది; బెల్-ఆకారపు, ఏకరీతి మరియు U- ఆకారపు హిస్టోగ్రాములు అన్నీ సుష్ట డేటాకు ఉదాహరణలు. (గణాంకాలు a, d, మరియు f)
సాధారణ హిస్టోగ్రాం నమూనాలు

మీరు హిస్టోగ్రాం యొక్క కేంద్రాన్ని రెండు విధాలుగా చూడవచ్చు. డేటా యొక్క వాస్తవ విలువలను పరిగణనలోకి తీసుకొని గ్రాఫ్ బ్యాలెన్స్ చేసే x- అక్షం మీద ఉన్న పాయింట్ ఒకటి. ఈ పాయింట్‌ను సగటు అని పిలుస్తారు మరియు బ్యాలెన్సింగ్ పాయింట్‌ను గుర్తించడం ద్వారా మీరు దాన్ని కనుగొనవచ్చు (డేటా టీటర్-టోటర్‌లో ఉందని imagine హించుకోండి). కేంద్రాన్ని చూడటానికి మరొక మార్గం హిస్టోగ్రామ్‌లోని పంక్తిని గుర్తించడం, ఇక్కడ 50 శాతం డేటా ఇరువైపులా ఉంటుంది. పంక్తిని మధ్యస్థం అని పిలుస్తారు మరియు ఇది డేటా సమితి యొక్క భౌతిక మధ్యభాగాన్ని సూచిస్తుంది. హిస్టోగ్రాంను సగానికి తగ్గించుకోండి, తద్వారా సగం ప్రాంతం రేఖకు ఇరువైపులా ఉంటుంది.

స్ప్రెడ్ అనేది డేటా మధ్య దూరాన్ని సూచిస్తుంది, ఒకదానికొకటి సాపేక్షంగా లేదా కొన్ని కేంద్ర బిందువుకు సంబంధించి. స్ప్రెడ్‌ను కొలవడానికి ఒక ముడి మార్గం, పరిధిని కనుగొనడం లేదా అతిపెద్ద విలువ మరియు చిన్న విలువ మధ్య దూరం. మరొక మార్గం మధ్య నుండి సగటు దూరం కోసం చూడటం, లేకపోతే ప్రామాణిక విచలనం అని పిలుస్తారు. హిస్టోగ్రాం చూడటం ద్వారా ప్రామాణిక విచలనం రావడం చాలా కష్టం, కానీ మీరు 6 ను విభజించిన పరిధిని తీసుకుంటే మీకు కఠినమైన ఆలోచన వస్తుంది. మధ్యకు దగ్గరగా ఉన్న బార్ల ఎత్తులు చాలా పొడవుగా అనిపిస్తే, అంటే చాలా వరకు విలువలు సగటుకు దగ్గరగా ఉంటాయి, ఇది చిన్న ప్రామాణిక విచలనాన్ని సూచిస్తుంది. బార్లు చిన్నగా కనిపిస్తే, మీకు పెద్ద ప్రామాణిక విచలనం ఉండవచ్చు.

పరిమాణాత్మక డేటాను లెక్కించడానికి మీరు వాస్తవ సారాంశ గణాంకాలను చేయవచ్చు, కానీ హిస్టోగ్రాం ఈ మైలురాళ్లను కనుగొనటానికి మీకు సాధారణ దిశను ఇస్తుంది. పై చార్ట్‌లు మరియు బార్ గ్రాఫ్‌ల మాదిరిగా, అన్ని హిస్టోగ్రామ్‌లు సరసమైనవి, పూర్తి మరియు ఖచ్చితమైనవి కావు. వాటిని అంచనా వేయడానికి మీరు ఏమి చూడాలో తెలుసుకోవాలి.

హిస్టోగ్రామ్‌లతో వక్రీకృత డేటాను ఎలా నిఠారుగా ఉంచాలి

వక్రీకృత డేటా సెట్ల కోసం మీరు ప్రత్యేక పరిశీలనలు చేయాలి, ఏ గణాంకాలు ఉపయోగించటానికి చాలా సరైనవి మరియు ఎప్పుడు. తప్పు గణాంకాలను ఉపయోగించడం తప్పుదోవ పట్టించే సమాధానాలను ఎలా అందిస్తుందో కూడా మీరు తెలుసుకోవాలి.

మీ డేటా ఆకారం గురించి తెలుసుకోవడానికి మీరు సగటు మరియు మధ్యస్థంతో సంబంధం కలిగి ఉంటారు. సమాన మరియు సగటు మధ్యస్థంగా ఉండటం సుమారుగా సుష్ట ఆకారాన్ని సృష్టిస్తుంది

డేటాలోని అవుట్‌లెర్స్ ద్వారా సగటు ప్రభావితమవుతుంది, కాని మధ్యస్థం కాదు. సగటు మరియు మధ్యస్థం ఒకదానికొకటి దగ్గరగా ఉంటే, డేటా వక్రంగా ఉండదు మరియు ఒక వైపు లేదా మరొక వైపు li ట్‌లియర్‌లను కలిగి ఉండకపోవచ్చు. అంటే డేటా మధ్యలో ప్రతి వైపు ఒకే విధంగా కనిపిస్తుంది, ఇది సుష్ట డేటా యొక్క నిర్వచనం (మునుపటి చిత్రంలో a, d, లేదా f చూడండి).

సగటు మరియు మధ్యస్థం దగ్గరగా ఉండటం వలన డేటా సుమారుగా సుష్ట అని మీకు చెబుతుంది, వేరే రకం పరీక్ష ప్రశ్నలో ఉపయోగించవచ్చు. డేటా సుష్టమా అని ఎవరైనా మిమ్మల్ని అడుగుతారని అనుకుందాం, మీకు హిస్టోగ్రాం లేదు, కానీ మీకు సగటు మరియు మధ్యస్థం ఉంది. సగటు మరియు మధ్యస్థం యొక్క రెండు విలువలను సరిపోల్చండి మరియు అవి దగ్గరగా ఉంటే, డేటా సుష్ట. అవి లేకపోతే, డేటా సుష్ట కాదు.

తప్పుదోవ పట్టించే హిస్టోగ్రాంను ఎలా గుర్తించాలి

బార్ గ్రాఫ్‌తో సాధ్యం కాని విధంగా హిస్టోగ్రాం ద్వారా పాఠకులను తప్పుదారి పట్టించవచ్చు. హిస్టోగ్రాం సంఖ్యా డేటాతో వ్యవహరిస్తుందని గుర్తుంచుకోండి, వర్గీకృత డేటా కాదు, అంటే సంఖ్యా డేటాను సమూహాలుగా విభజించి క్షితిజ సమాంతర అక్షంలో ఎలా ప్రదర్శించాలో మీరు నిర్ణయించుకోవాలి. మరియు మీరు ఆ సమూహాలను ఎలా నిర్ణయిస్తారో గ్రాఫ్ చాలా భిన్నంగా కనిపిస్తుంది. పాఠకులను తప్పుదారి పట్టించడానికి స్కేల్ ఉపయోగించే హిస్టోగ్రామ్‌ల కోసం చూడండి. బార్ గ్రాఫ్‌ల మాదిరిగానే, మీరు హిస్టోగ్రాం యొక్క నిలువు అక్షంపై చిన్న స్కేల్‌ను ఉపయోగించడం ద్వారా తేడాలను అతిశయోక్తి చేయవచ్చు మరియు మీరు పెద్ద ఎత్తున ఉపయోగించడం ద్వారా తేడాలను తగ్గించవచ్చు.