Užitočné tipy

SPRACOVANIE ŠTATISTICKÝCH ÚDAJOV S POUŽITÍM SPSS FUNKCIÍ

Informačné technológie sa v poslednom čase rozšírili vo vzdelávacom systéme. Používajú sa na výcvik, kontrolu, vykonávanie konečnej certifikácie absolventov, samoštúdium, sebakontrola atď. Najdôležitejšou podmienkou zlepšovania kvality vzdelávania je systematická analýza objektívnych údajov nezávislého monitorovania akademických výsledkov, monitorovanie a diagnostika pripravenosti študentov na získanie výsledkov, ktoré zodpovedajú ich schopnostiam a potrebám. Zvyšujúca sa pozornosť výskumných pracovníkov pri riešení rôznych problémov vzdelávania a samosprávy vzdelávacích aktivít priťahuje schopnosti technológií hromadného testovania.

Dôležitú úlohu pri rozvoji monitorovania výsledkov vzdelávania by malo zohrávať systematické a nepretržité hodnotenie, ktoré poskytuje úsudok o pripravenosti študenta pokračovať v odbornej príprave a jeho účasti na spoločenských a výrobných činnostiach. Obtiažnosť spočíva v tom, že je potrebný nielen kvalitný výcvik, ale aj kvalitné hodnotenie, kvalitné hodnotiace nástroje a postupy, ako aj motivácia pri vykonávaní testov s cieľom maximalizovať latentné charakteristiky predmetov. Posúdenie by sa preto malo vykonať ako špecificky zameraný a usporiadaný proces určovania stanovenej a dosiahnutej úrovne pripravenosti a kvantifikovať výsledky bez ohľadu na to, aké jednoduché alebo ťažké sú posúdiť.

Na získanie kvantitatívnych ukazovateľov kvality pripravenosti subjektov je potrebné spracovanie veľkých objemov údajov hromadného testovania. Na tento účel sa používajú rôzne softvérové ​​prostredia, z ktorých osobitné miesto je obsadené programom Štatistika SPSS („Štatistický balík pre spoločenské vedy“) - je to „štatistický balík pre spoločenské vedy“. Je lídrom na trhu v oblasti komerčných štatistických produktov určených pre aplikovaný výskum v spoločenských a pedagogických vedách. SPSS je univerzálny systém štatistickej analýzy a správy údajov. Táto skratka pôvodne znamenala Štatistický balík pre spoločenské vedy. Pôvodná skratka sa potom interpretovala znovu: Softvérový systém Superior Performance Software System.

Na začiatku 70. rokov Norman Nie, Dale Bent a Hadlai Hull zaregistrovali štatistický softvér SPSSR. Spoločnosť s rovnakým názvom bola založená nimi v roku 1968. V roku 1975 sa spoločnosť zmenila na spoločnosť so sídlom v Chicagu (Chicago, IL USA). V priebehu rokov spoločnosť vyvinula mnoho softvérových produktov vrátane SPSS / PC + TM, ktorej prvá verzia sa objavila v roku 1984. V roku 2009 sa tento balík stal známy ako PASW Statistics (Predictive Analytics SoftWare - Intelligent Analytical Software). Od júla 2009 tento balík spravuje spoločnosť IBM (International Business Machines) pod názvom IBM SPSS Statisics. V roku 2013 bola vydaná ďalšia verzia balíka - IBM SPSS Statistics 22, ktorá beží na rôznych operačných systémoch Windows, MacOsX, Linux.

SPSS je vo všetkých ohľadoch komplexný a výkonný štatistický balík. Pomocou balíka SPSS je možné vykonať takmer akúkoľvek analýzu údajov a najnovšie verzie programu sa používajú v rôznych vedných odboroch vrátane pedagogických vied. Dnes je SPSS softvérový produkt a zároveň chránená ochranná známka svetoznámej americkej spoločnosti SPSS Inc., ktorej predstavenstvo zostáva v Chicagu. Tento balík má vedúce postavenie medzi programami určenými na štatistické spracovanie informácií v spoločenských a pedagogických vedách. Spolu so všetkým softvérom určeného profilu prešlo dlhou cestou vývoja: najprv od prvých verzií SPSS pre veľké počítače, po verzie zamerané na PC-DOS / MS-DOS a potom na verzie bežiace v prostredí Windows. SPSS predstavuje užívateľsky prívetivé rozhranie, vďaka ktorému je vstup a štatistická analýza prístupná pre začiatočníkov a pohodlná pre skúseného používateľa. Editor dát balíka umožňuje pohodlne (tabuľkovým spôsobom) zadávať a opravovať vstupné údaje. SPSS vám dáva možnosť získať veľa kvalitných grafov a rôznych diagramov. Pomocou balíka, tabuliek, jednoduchých ponúk a dialógov môžete vykonať jednak analýzu obrovských dátových súborov s tisíckami premenných, a jednak to všetko bez písania malých písmen v programovacom jazyku. Pomocou programu SPSS môžete: spravovať údaje, organizovať údaje, transformovať údaje, vytvárať nové premenné, analyzovať údaje.

Možné aplikácie SPSS sú: ukladanie a analýza údajov prieskumu, marketingový prieskum a predaj, finančná analýza, atď. V rámci sociológie a pedagogiky vám balík umožňuje automatizovať proces vytvárania databáz rôznych informácií, ich ukladanie a spracovanie. Etapy analytického procesu implementovaného v SPSS: plánovanie, zber údajov, poskytovanie prístupu k údajom, príprava údajov na analýzu, vykonávanie analýz, generovanie správ, prezentácia a šírenie výsledkov. V pedagogike vám tento balíček umožňuje automatizovať spracovanie a interpretáciu výsledkov testov.

Prvou verziou SPSS pre Windows bolo sériové číslo 5.0. Nasledovali verzie 6.0, 6.1, 7.0, 7.5, 8.0, 9.0 a nakoniec 10.0 a 11.5 a vyššie. Počnúc SPSS verzie 7.0 je minimálny shell Windows95 (NT).

Balík SPSS môže spolu s použitím vlastného typu údajov čítať údaje z takmer akéhokoľvek typu súboru a používať ho na vytváranie zostáv vo forme tabuliek, grafov a grafov, ako aj na výpočet opisnej štatistiky a vykonávanie zložitých štatistických analýz a modelovania.

Balenie má modulárnu štruktúru. Moduly balíka sú integrovanou sadou softvérových produktov, ktoré poskytujú komplexný výskum - od plánovania cez správu údajov, analýzu a prezentáciu výsledkov.

Základné moduly SPSS: Štatistická základňa IBM SPSS, Rozhodovacie stromy IBM SPSS, Pokročilá štatistika IBM SPSS, Priamy marketing IBM SPSS, Zavádzanie IBM SPSS, Presné testy IBM SPSS, Kategórie IBM SPSS, Prognóza IBM SPSS, Komplexné vzorky IBM, SPSS Chýbajúce hodnoty , IBM SPSS Conjoint, IBM SPSS Neural Networks, vlastné tabuľky IBM SPSS, regresia IBM SPSS, príprava dát IBM SPSS. Zloženie modulov závisí od možnosti dodania.

Hlavné bloky SPSS:

Editor údajov - flexibilný systém, ktorý vyzerá ako tabuľka na definovanie, zadávanie, úpravu a prezeranie údajov.

Prehliadač - zjednodušuje výsledky prezerania, umožňuje vám zobraziť a skryť jednotlivé výstupné prvky, zmeniť poradie, v ktorom sa výsledky zobrazujú, presúvať tabuľky a diagramy pripravené na prezentáciu do iných aplikácií a získavať ich z aplikácií.

Viacrozmerné mobilné tabuľky - slúžia na zobrazenie výsledkov analýzy. Tabuľky môžete preskúmať presunutím riadkov, stĺpcov a vrstiev, a tak identifikovať dôležité body, ktoré by sa mohli v štandardných prehľadoch stratiť. Skupiny môžete tiež porovnávať rozdelením tabuliek tak, aby sa zakaždým zobrazila iba jedna skupina.

Kvalitná grafika - prostriedok na vytváranie plnofarebných diagramov s vysokým rozlíšením: koláčové a stĺpcové diagramy, histogramy, bodové diagramy, objemové diagramy a mnoho ďalších.

Prístup k databázam je konštruktor čítačky databáz, ktorý vám umožní načítať údaje z ľubovoľného zdroja pomocou niekoľkých kliknutí na tlačidlo myši.

Transformácia dát - nástroj na konverziu údajov, ktorý pomáha pripraviť údaje na analýzu. Môžete ľahko vybrať podmnožiny v údajoch, kombinovať kategórie, pridať, agregovať, zlúčiť, rozdeliť a transponovať súbory a vykonávať ďalšie transformácie.

- elektronická učebnica poskytujúca podrobný prehľad,

- kontextová pomoc v dialógových oknách pomáha pochopiť konkrétne úlohy,

- definície pop-up v mobilných tabuľkách vysvetľujú štatistické výrazy,

- inštruktor štatistiky pomáha pri hľadaní potrebného postupu, - príklady analýzy pomáhajú pri interpretácii výsledkov.

Príkazový jazyk. Napriek tomu, že s myšou a dialógovými oknami je možné vykonať veľa úloh, SPSS má aj výkonný príkazový jazyk, ktorý umožňuje ukladať a automatizovať mnoho opakujúcich sa úloh. Príkazový jazyk vám tiež umožňuje používať niektoré funkcie, ktoré nie sú dostupné prostredníctvom ponúk a dialógových okien. Úplná dokumentácia o príkazovom jazyku je integrovaná do systému pomoci a je k dispozícii ako samostatný Sprievodca syntaxou dokumentu PDF, ktorý je možné vyvolať v ponuke Pomocník.

Štruktúra balíka obsahuje príkazy na určovanie údajov, transformáciu údajov, príkazy na výber objektov. Zavádza tieto metódy štatistického spracovania informácií:

  • súhrnná štatistika pre jednotlivé premenné,
  • frekvencie, súhrnné štatistiky a grafy pre ľubovoľný počet premenných,
  • zostavenie N-rozmerových pohotovostných tabuliek a získanie komunikačných opatrení, prostriedkov, štandardných odchýlok a súm podľa skupín,
  • analýza rozptylu a viacnásobných porovnaní,
  • korelačná analýza, diskriminačná analýza, jednosmerná analýza rozptylu,
  • všeobecný model lineárnej disperznej analýzy (GLM),
  • faktorová analýza
  • klastrová analýza
  • hierarchická klastrová analýza,
  • hierarchická log-lineárna analýza,
  • viacrozmerná analýza rozptylu, neparametrické testy, viacnásobná regresia,
  • optimálne metódy škálovania atď.

Balík vám okrem toho umožňuje získať rôzne grafy - stĺpcový a koláčový, škatuľové diagramy, polia rozptylu a histogramy atď.

Až donedávna sa školenie a kontrola kvality v oblasti vzdelávania uskutočňovali tradičnými metódami najmä tými, ktorí vykonávajú vzdelávací proces, čo z hľadiska teórie riadenia neprispieva k jeho zlepšovaniu. Doteraz sa spracovanie údajov hromadného testovania vykonáva automaticky pomocou mnohých počítačových programov. Jeden z takýchto programov SPSS vám umožňuje efektívne, presne a šetriť čas kvantitatívne spracovanie výsledkov hromadného testovania u každého subjektu.

Frekvenčná analýza vám umožňuje určiť: frekvenciu každej z možností na zodpovedanie otázky z testu, percentuálnu frekvenciu odpovede na celkový počet respondentov (percento správnych odpovedí na túto otázku, vyjadrené ako percento z celkového počtu odpovedí), povolenú percentuálnu hodnotu (chýbajúce hodnoty sú vylúčené), akumulované percento hodnoty (je to súčet percent akceptovateľných hodnôt).

SPSS má širokú škálu postupov, ktoré sa môžu použiť na analýzu vzťahu medzi dvoma premennými. Vzťah medzi premennými súvisiacimi s menovitou stupnicou alebo s poradovou stupnicou s príliš veľkým počtom kategórií je najlepšie reprezentovaný vo forme kontingenčných tabuliek. Na tento účel SPSS vykonáva test chí-kvadrát, ktorý kontroluje, či existuje významný rozdiel medzi pozorovanými a očakávanými frekvenciami. Okrem toho je možné vypočítať rôzne miery konektivity.

Výhoda neparametrických metód je najzreteľnejšia, ak sú v údajoch prítomné odľahlé hodnoty (extrémne veľké alebo malé hodnoty). SPSS poskytuje používateľom značný počet neparametrických testov.

Najbežnejšie používané testy sú testy na porovnanie dvoch alebo viacerých nezávislých alebo závislých vzoriek. Sú to Mann-Whitneyov U-test, Kruskal-Wallisov N-test, Wilcoxonov test a Friedmanov test. Dôležitú úlohu hrá aj Kolmogorov-Smirnovov test pre jednu vzorku, ktorý sa môže použiť na overenie prítomnosti normálneho rozdelenia. Neparametrické testy sa môžu samozrejme použiť v prípade normálneho rozdelenia hodnôt. Ale v tomto prípade budú mať iba 95% účinnosť v porovnaní s parametrickými testami. Ak chcete napríklad vykonať viacnásobné porovnanie priemerných hodnôt dvoch nezávislých vzoriek a vzorky čiastočne dodržiavajú normálne rozdelenie a čiastočne nie, odporúča sa vždy použiť U-test Mann a Whitney.

Faktorová analýza je postup, ktorým sa veľké množstvo premenných týkajúcich sa dostupných pozorovaní redukuje na menší počet nezávislých ovplyvňujúcich veličín nazývaných faktory. Zároveň sa premenné, ktoré silne korelujú, kombinujú do jedného faktora. Premenné od rôznych faktorov spolu navzájom slabo korelujú. Cieľom faktorovej analýzy je teda nájsť také zložité faktory, ktoré čo najviac vysvetľujú pozorované vzťahy medzi dostupnými premennými.

Faktorová analýza je možná, ak sú splnené viaceré kritériá. Údaje o kvalite nemôžete zohľadniť. Premenné by mali byť nezávislé a ich distribúcia by sa mala blížiť k normálu. Vzťahy medzi premennými by mali byť približne lineárne a v pôvodnej korelačnej matici niekoľko korelačných modulov vyšších ako 0,3 by mala byť vzorka subjektov pomerne veľká.

Analýza vhodnosti (rovnako ako: analýza otázok alebo analýza úloh) pomáha pri výbere otázok (úloh) na testy. Pomocou rôznych kritérií sa stanovuje, ktoré úlohy sú vhodné pre konkrétny test a ktoré nie.

Na tento účel niektoré agregáty (vzorky) respondentov ponúkajú predbežnú verziu testu so všetkými očakávanými úlohami a tieto úlohy analyzujú. Použitím tejto analýzy sú eliminované nevhodné úlohy a ostatné sú zahrnuté do výsledného formulára testu. Testy sú rozdelené podľa typu študovanej osobnostnej črty. Rozlišuje sa test úrovne vzdelania, test schopností a test osobnosti. Testovacia úloha pozostáva hlavne z dvoch častí: problému alebo otázky a riešenia problému alebo odpovede.

S príchodom hromadného centralizovaného testovania v našej krajine sa objavili formy nezávislej certifikácie študentov: formulárové a počítačové testovanie, diaľkové testovanie, jediná štátna skúška. Charakteristickým znakom takejto kontroly nad úrovňou odbornej prípravy študentov je postup, ktorý je založený na pedagogickom teste ako meracej pomôcke s určitými metrickými vlastnosťami: presnosť, spoľahlivosť, schopnosť rozlišovania, platnosť atď.

Metódy moderného testovania už teraz umožňujú na pomerne vysokej úrovni vykonávať konečnú certifikáciu absolventov v celej krajine súčasne s rovnakou úrovňou náročnosti pedagogických meradiel alebo kontrolných a meracích materiálov (CIM), testov novej generácie so širokou využívajúce informačné technológie.

Okrem toho moderné hardvérové ​​a softvérové ​​produkty na automatizované overovanie výsledkov testov významne zvyšujú objektivitu a spoľahlivosť vzdelávacích štatistík, zjednodušujú prácu testerov, poskytujú možnosť porovnávať a porovnávať priemerné certifikačné body na akomkoľvek území a pre akúkoľvek vzorku testovaných, čo umožňuje analyzovať úroveň odbornej prípravy a dôvody, ktoré poskytujú. ono. Pomocou počítačového programu SPSS je možné presné a rýchle spracovanie výsledkov testov.

Spoľahlivosť údajov sa zabezpečuje výpočtom významných rozdielov podľa Studentovho T-kritéria pomocou počítačového programu „SPSS 17 pre Windows“.

Záver. Program SPSS je efektívny nástroj pre praktickú prácu v oblasti sociologickej a pedagogickej analýzy, poskytuje rýchle a presné spracovanie údajov. Hlavnou črtou tohto programu je, že výsledky analýzy je možné vizualizovať vo forme tabuliek a diagramov rôznych typov, distribuovať ich používateľom siete a začleniť do výsledkov získaných v iných softvérových systémoch.

Frekvenčná analýza údajov v balíku SPSS

Prvým krokom v štatistickej analýze údajov je zvyčajne frekvenčná analýza. procedúra frekvencia (Frekvencie) vám umožňuje implementovať zoskupenie a analýzu vzájomných závislostí sociálnych charakteristík. Minimálne požiadavky, ktoré sa na ne vzťahujú, sú, že premenné musia byť kvantitatívne. Po vykonaní potrebných operácií zostaví SPSS štandardné tabuľky frekvencií, ktoré sa zobrazia v okne na zobrazenie výsledkov.

Uvádzame stručné definície pojmov, ktoré sa budú diskutovať v tejto časti.

  • ? Frekvenciu. Príkaz Frequencies je jedným z najjednoduchších a najčastejšie používaných príkazov SPSS. Činnosť príkazu je obmedzená na jednoduchý výpočet rozdelenia frekvencií medzi kategóriami premennej: určenie počtu objektov v každej kategórii premennej. Например, если анализируется переменная «пол», то программа подсчитает распределение численности девушек и юношей среди учащихся, если используется переменная «класс», то получим распределение численности учащихся по классам. Выводимый результат для каждой категории включает метку значений переменной, само значение переменной, частоту, процент и накопленный процент от общей частоты.
  • ? Процентиль показывает, какой процент распределения лежит ниже заданной величины. Например, если процентиль значения 111 равен 75, то это означает, что 75% всех значений переменной меньше, чем 111, а 25% - больше, чем 111. Наиболее часто процентили применяются в педагогических и психологических исследованиях.

Для осуществления частотной процедуры необходимо выбрать из пункта основного меню Statistics следующие команды: Summarize- Frequencies. Zobrazí sa dialógové okno so zoznamom dostupných premenných. Vyberie sa jedna alebo viac premenných.

Urobme analýzu frekvencie pomocou vzorového súboru studium.savobsahujúci výsledky prieskumu študentov o ich psychickom stave a sociálnom stave. Prieskum sa zaoberal témami ako sociálne postavenie, psychologická situácia a akademický výkon.

• Stiahnuť súbor studium.sav a vykonávať príkazy ponuky analyzovať (Analýza) - Opisná štatistika (Opisná štatistika) - Frekvencia (frekvencie). Otvorí sa dialógové okno Frekvencia (frekvencia) .

Obr. 32. Dialógové okno Frekvencia (frekvencia)

Dialógové okno Frequncies typické pre väčšinu štatistických údajov (operácie SPSS. Zoznam všetkých dostupných premenných sa nachádza na ľavej strane okna. V tomto zozname musíte vybrať tie premenné, pre ktoré potrebujete vypočítať rozdelenie frekvencie.

• Na prenos premennej použite tlačidlo trojuholníka duše do zoznamu výstupných premenných a operáciu potvrďte pomocou OK. Potom program SPSS vytvorí výstupné okno s výsledkami príkazu. Frekvenčná tabuľka sa objaví v okne na prezeranie výsledkov (Obr. 33).

Obr. 33. Okno na zobrazenie výsledkov výpočtov frekvenčných ukazovateľov

Každý riadok frekvenčnej tabuľky popisuje jednu možnú hodnotu. Riadok označený „žiadne údaje“ predstavuje pozorovania, pri ktorých nebola poskytnutá žiadna odpoveď. Celkovo existuje 107 platných odpovedí a jedno pozorovanie, pri ktorom duševný stav nie je známy (údaje chýbajú alebo sa strácajú).

Prvý stĺpec obsahuje označenia jednotlivých hodnôt („Mimoriadne nestabilný“, „Nestabilný“, „Udržateľný“.).

Druhý stĺpec pod nadpisom „Frekvencia“ zobrazuje frekvenciu každej z možností odpovede na otázku z testu. Napríklad 20 ľudí odpovedalo na otázku o ich duševnom stave: „mimoriadne nestabilná“ a 40 ľudí - „nestabilná“.

Tretí stĺpec ukazuje percentuálnu frekvenciu každej reakcie. Percentuálna frekvencia zodpovedá pomeru každej odpovede k celkovému počtu respondentov vrátane stratených hodnôt.

Štvrtý stĺpec udáva platnú percentuálnu hodnotu. Pri určovaní tejto hodnoty sú stratené údaje vylúčené.

Posledný stĺpec obsahuje kumulované percentuálne hodnoty. Akumulovaný úrok je súčet percentuálnej frekvencie platných odpovedí. Napríklad percento respondentov, ktorí odpovedali „extrémne nestabilní“ alebo „nestabilní“, je 56,1%. Toto číslo je určené výrazom: 18,7% + 37,4% = 56,1%. Posledný riadok obsahuje súčet všetkých stĺpcov („Spolu“).

Ak chcete získať všeobecné štatistiky o premenných, je potrebné v okne Frekvencia (frekvencia) kliknite na tlačidlo Štatistika. Otvorí sa dialógové okno Frekvencie: Štatistika .

Obr. 34. Dialógové okno Frekvencie: Štatistika

V tomto okne sú zobrazené ukazovatele, ako sú percentily a popisné štatistiky. Stručne popíšeme pojmy popisnej štatistiky.