Шығаруды қалай есептеу керек

Автор: Janice Evans
Жасалған Күн: 23 Шілде 2021
Жаңарту Күні: 1 Шілде 2024
Anonim
КІРІС ПЕН ШЫҒЫНДЫ ЕСЕПТЕП, ТАЗА ПАЙДАНЫ ШЫҒАРУ ТӘСІЛІ
Вызшақ: КІРІС ПЕН ШЫҒЫНДЫ ЕСЕПТЕП, ТАЗА ПАЙДАНЫ ШЫҒАРУ ТӘСІЛІ

Мазмұны

Статистика бойынша, сыртқа шығарылатындар - бұл жинақталған деректер қорындағы басқа мәндерден күрт ерекшеленетін мәндер. Шетелдік деректерді таратудағы ауытқуларды немесе өлшеу қателіктерін көрсете алады, сондықтан ауытқулар көбінесе деректер жиынынан шығарылады. Деректер жиынтығынан шығуды жою арқылы сіз күтпеген немесе дәлірек қорытынды жасауға болады. Сондықтан, статистиканы дұрыс түсінуді қамтамасыз ету үшін шектен тыс көрсеткіштерді есептеп, бағалай білу қажет.

Қадамдар

  1. 1 Мүмкін болатын ауытқуларды тануды үйреніңіз. Деректер жиынтығынан шеттетулерді шығармас бұрын ықтимал ауытқуларды анықтау керек. Сыртқы көрсеткіштер - бұл деректер жиынтығындағы мәндердің көпшілігінен айтарлықтай ерекшеленетін мәндер; басқаша айтқанда, сыртқа шығулар көптеген құндылықтар тенденциясынан тыс. Мұны мәндер кестесінен немесе (әсіресе) графиктерден табу оңай. Егер деректер жиынтығындағы мәндер графикалық түрде шығарылса, онда басқа мәндер басқа мәндерден алшақ болады. Егер, мысалы, мәндердің көпшілігі түзу сызыққа түссе, онда сыртқа шығарғыштар осындай түзудің екі жағында жатады.
    • Мысалы, бөлмедегі 12 түрлі объектінің температурасын көрсететін деректер жиынтығын қарастырыңыз. Егер 11 объект шамамен 70 градус болса, бірақ он екінші объект (мүмкін пеш) 300 градус болса, онда мәндерге жылдам қарау пештің ықтимал жарылыс екенін көрсетуі мүмкін.
  2. 2 Деректерді өсу ретімен сұрыптаңыз. Шығындарды анықтаудың бірінші қадамы - бұл деректер жиынтығының медианасын есептеу. Егер деректер жиынындағы мәндер өсу ретімен орналасса (кішіден үлкенге дейін), бұл тапсырма айтарлықтай жеңілдетілген.
    • Жоғарыдағы мысалды жалғастыра отырып, бірнеше объектілердің температурасын көрсететін келесі деректер жиынтығын қарастырыңыз: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Бұл жинаққа келесі ретпен тапсырыс беру керек: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Деректердің медианасын есептеңіз. Деректердің медианасы - бұл деректер жиынтығының ортасындағы мән. Егер деректер жиынында мәндердің тақ саны болса, медиана - бұл деректер жиынтығында мәндердің саны бірдей болғанға дейінгі және одан кейінгі мән. Бірақ егер деректер жиынында мәндердің жұп саны болса, онда екі құралдың арифметикалық ортасын табу керек. Назар аударыңыз, ауытқуларды есептеу кезінде медиананы әдетте Q2 деп атайды, себебі ол Q1 мен Q3 арасында, төменгі және жоғарғы квартилдер арасында орналасқан, біз оларды кейінірек анықтаймыз.
    • Мәндердің жұп саны бар деректер жиынтығымен жұмыс жасаудан қорықпаңыз- екі құралдың арифметикалық орташа мәні деректер жиынында жоқ сан болады; бұл қалыпты жағдай. Бірақ егер екі орташа мән бір сан болса, онда арифметикалық орта осы санға тең болады; бұл да тәртіп бойынша.
    • Жоғарыдағы мысалда орташа 2 мәні 70 және 71, сондықтан медиана ((70 + 71) / 2) = 70,5.
  4. 4 Төменгі квартилді есептеңіз. Q1 деп аталатын бұл мән деректер жиынының 25% мәнінен төмен. Басқаша айтқанда, бұл медианаға дейінгі мәндердің жартысы. Егер медианадан бұрын деректер жиынынан жұп сан болса, онда бірінші тоқсанды есептеу үшін екі құралдың арифметикалық ортасын табу керек (бұл медиананы есептеуге ұқсас).
    • Біздің мысалда 6 мән медианадан кейін және 6 мән- оның алдында орналасқан. Бұл төменгі квартилді есептеу үшін медианадан бұрын жатқан алты мәннің екі құралының арифметикалық ортасын табу керек дегенді білдіреді. Мұнда орташа мәндер 70 және 70. Осылайша, Q1 = ((70 + 70) / 2) = 70.
  5. 5 Жоғарғы квартилді есептеңіз. Q3 деп аталатын бұл мән деректер жиыны мәндерінің 25% құрайды. Q3 есептеу процесі Q1 есептеуге ұқсас, бірақ мұнда медианадан кейінгі мәндер қарастырылады.
    • Жоғарыдағы мысалда, медианадан кейінгі алтаудың екі орташа мәні 71 және 72. Сонымен Q3 = ((71 + 72) / 2) = 71.5.
  6. 6 Кварталаралық диапазонды есептеңіз. Q1 және Q3 есептеулерін жүргізе отырып, осы шамалар арасындағы қашықтықты табу қажет. Ол үшін Q3 -тен Q1 -ді алып тастаңыз. Төртаралық диапазонның мәні асып кетпейтін мәндердің шекарасын анықтау үшін өте маңызды.
    • Біздің мысалда Q1 = 70 және Q3 = 71.5. Тоқсанаралық диапазон 71,5 - 70 = 1,5.
    • Бұл Q1 және Q3 теріс мәндеріне де қатысты екенін ескеріңіз. Мысалы, егер Q1 = -70 болса, онда тоқсанаралық диапазон 71,5 -(-70) = 141,5 құрайды.
  7. 7 Мәліметтер жиынтығындағы мәндердің «ішкі шекарасын» табыңыз. Айналымдар мәндерді талдау арқылы анықталады- олар «ішкі шекаралар» мен «сыртқы шекаралар» деп аталатын шеңберге кіреді ме, жоқ па. «Ішкі шекарадан» тыс мән «кішігірім сыртқы» ретінде жіктеледі, ал «сыртқы шекарадан» тыс мән «елеулі тысқары» ретінде жіктеледі. Ішкі шекараларды табу үшін төрттік аралықты 1,5 -ке көбейту керек; нәтижені Q3 -ке қосу керек және Q1 -ден алып тастау керек. Табылған екі сан деректер жиынының ішкі шекаралары болып табылады.
    • Біздің мысалда тоқсанаралық диапазон (71.5 - 70) = 1.5. Әрі қарай: 1,5 * 1,5 = 2,25. Ішкі шекараларды табу үшін бұл санды Q3 -ке қосу және Q1 -ден шегеру керек:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Осылайша, ішкі шекаралар 67,75 және 73,75 құрайды.
    • Біздің мысалда тек пештің температурасы - 300 градус - бұл шектерден тыс орналасқан және шамалы шығарынды деп санауға болады. Бірақ қорытынды жасауға асықпаңыз - біз бұл температураның айтарлықтай жоғары екенін анықтауымыз керек.
  8. 8 Деректердің «сыртқы шекараларын» табыңыз. Бұл ішкі шекаралардағыдай орындалады, тек тоқсанаралық диапазон 1,5 орнына 3 -ке көбейтіледі. Нәтижені Q3 -ке қосу керек және Q1 -ден алып тастау керек. Табылған екі сан деректер жиынының сыртқы шекаралары болып табылады.
    • Біздің мысалда тоқсанаралық диапазонды 3: 1,5 * 3 = 4,5 көбейтіңіз. Сыртқы шекараны есептеңіз:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Сыртқы шекарасы 65,5 және 76.
    • Сыртқы шекарадан тыс кез келген мән маңызды эмиссия болып саналады. Біздің мысалда пештің температурасы 300 градус маңызды жарылыс болып саналады.
  9. 9 Деректер жиынтығынан шеттетулерді алып тастау керектігін анықтау үшін сапалы бағалауды қолданыңыз. Жоғарыда сипатталған әдіс кейбір мәндердің сыртқа шығатынын (шамалы немесе маңызды) анықтауға мүмкіндік береді. Қателік жасамаңыз - сыртқа шығарылатын ретінде жіктелетін мән тек ерекшелікке «үміткер» болып табылады, яғни оны алып тастаудың қажеті жоқ. Сыртқы көріністің себебі - бұл аутричтен шығару туралы шешімге әсер ететін негізгі фактор. Әдетте, қателіктерге байланысты (шолу кезінде, жазбаларда және т.б.) пайда болатын ауытқулар алынып тасталады. Екінші жағынан, қателермен емес, жаңа ақпараттармен немесе трендтермен байланысты көрсеткіштер әдетте деректер жиынында қалады.
    • Деректер жиынтығының медианасына (олар оны бұрмалайды ма, жоқ па) әсерін бағалау да маңызды. Бұл деректер жиынтығының медианасынан қорытынды жасаған кезде өте маңызды.
    • Біздің мысалда пештің 300 градусқа дейін қызуы екіталай (егер біз табиғи ауытқуларды ескермесек). Сондықтан (жоғары дәрежеде сенімділікпен) мұндай температура деректер қатасынан шығаруды қажет ететін өлшеу қателігі деп қорытынды жасауға болады. Сонымен қатар, егер сіз өзгешелікті жоққа шығармасаңыз, деректер жиынтығының медианасы (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 градус болады, бірақ егер сіз шеткеріні алып тастасаңыз, онда медиана (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 градус болады.
      • Сыртқы көрсеткіштер әдетте адамның қателіктерінің нәтижесі болып табылады, сондықтан да деректерді жиынтықтан алып тастау қажет.
  10. 10 Деректер қорында қалған (кейде) сыртқа шығудың маңыздылығын түсіну. Кейбір қателіктер мен техникалық ақауларға байланысты болғандықтан, деректер жиынынан шығарылуы керек; Деректер қорында басқа да шеттетулер қалдыру керек. Егер, мысалы, аутриент қатенің нәтижесі болмаса және / немесе тексерілетін құбылыстың жаңа түсінігін қамтамасыз етсе, онда оны деректер жиынында қалдыру керек. Ғылыми эксперименттер айрықша сезімталдыққа ие - қатені жою арқылы сіз жаңа тенденцияны немесе жаңалықты жіберіп алуыңыз мүмкін.
    • Мысалы, біз балық шаруашылығындағы балықтардың көлемін ұлғайту үшін жаңа препарат әзірлеп жатырмыз. Біз ескі деректер жиынтығын қолданамыз ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69), бірақ бұл жолы әрбір мән балықтың салмағын көрсетеді (грамммен) тәжірибелік препаратты қабылдағаннан кейін. Басқаша айтқанда, бірінші препарат балық салмағының 71 г дейін өсуіне әкеледі, екінші препарат - 70 г дейін және т.б. Бұл жағдайда 300 елеулі ерекшелік болып табылады, бірақ біз оны жоққа шығармауымыз керек; егер біз өлшеу қателіктері болмады деп есептесек, онда мұндай сыртқы көрсеткіш - бұл эксперименттегі маңызды жетістік. Балықтың салмағын 300 граммға жеткізген препарат басқа дәрілерге қарағанда әлдеқайда жақсы әсер етеді; осылайша 300 - деректер жиынтығындағы ең маңызды мән.

Кеңестер

  • Қашықтықтар табылғанда, оларды деректер жиынынан шығармас бұрын олардың болуын түсіндіруге тырысыңыз. Олар өлшеу қателіктерін немесе таралу ауытқуларын көрсете алады.

Саған не қажет

  • Калькулятор