Software

racunaljka

Izbor programa za obradu podataka najpre zavisi od analitičkog iskustva i preferencija samog istraživača, ustaljenih praksi lokalne naučne zajednice, ali i od dostupnosti samog paketa, pratećih resursa i stepena razvijenosti korisničke podrške. Povećana dostupnost paketa stavlja pred istraživača novi izazov – koji statistički softver treba da odaberem? Odgovor, naravno, nije niti jedinstven niti jednostavan. Sa ciljem da ga unekoliko olakšamo, u nastavku teksta ćemo prikazati neke od najkorisnijih savremenih statističkih paketa.

Ako ste nekad pokušali da ovladate nekim statističkim programom, sigurno ste čuli za SPSS ili skupi SAS (famoznih $8700). Danas svi govore o R-u i Pythonu? Da li je neko čuo za besplatni SPSS zvani JASP. Čekaj, kakav sad JASP, ja sam mislio da je PASW. 

SPSS je dugo vremena bio najčešće korišćen statistički paket za obradu podataka, naročito u društvenim i medicinskim naukama, te primenjenim tržišnim istraživanjima. Poslednjih godina, otprilike u vreme basnoslovne prodaje IBM-u celog SPSS Inc.-a, dolazi do razvoja mnoštva alternativnih softverskih rešenja u oblasti analize podataka, nekih čak u potpunostosti besplatnih. Premda neiscrpan, ovaj članak pruža zadovoljavajuće širok pregled dostupnog statističkog softvera i njihovih opcija. Reprezentativni repozitorijumi statističkih paketa mogu se pronaći ovde i ovde.

Gubi li SPSS bitku?


IBM SPSS

IBM_SPSS_v23

Najpoznatiji statistički paket nastao je krajem 1960-ih na Stenfordu, kada se tada mladi Norman Naj (Norman H. Nie) suočio sa problemoma analiziranja mnoštva podataka koje je prikupio zadavanjem više hiljada upitnika na širokom uzorku ispitanika za potrebe svoje doktorske disertacije. Ne samo da je tokom studija uspeo da sa dvojicom programera, Teksom Hajlom i Dejlom Bentom, napravi prvu verziju programa koji su imenovali Statistical Package for the Social Sciences (SPSS), Nil je 1969. i doktorirao na političkim naukama. Ubrzo potom, trojica prijatelja se sele u Čikago gde osnivaju kompaniju (SPSS Inc.) kojom upravljaju sve do 2009. godine kada je IBM preuzima za 1.2 milijarde dolara isplaćenih u kešu (!). Tokom prve tri godine nakon prodaje SPSS je primenio ime u PASW, ali je potom vratio stari prepoznatljivi naziv.

U međuvremenu, SPSS se razvijao i od programa koji kao ulazne podatke koristi bušene kartice postao veoma sofisticiran softver za organizovanje, dokumentovanje i obradu podataka. Prepoznatljivo intuitivno grafičko okruženje umnogome olakšava njegovo korišćenje, posebno početnicima u ovoj oblasti. Ostale prednosti SPSS-a se ogledaju u širokom rasponu funkcija koje se mogu jednostavno razumeti i pokrenuti, relativno jednostavnom sintaksnom kodu i ugrađenim preliminarnim testovima (npr. Leveneov test homoscedasciteta). Sa druge strane, grafičko predstavljanje rezultata veoma je ograničenih kapaciteta, te je potrebno koristiti druge alatke (Excel ili pak Tableau), manipulacija bazama podataka je vremenski zahtevna, a program ima i sklonost da odbija poslušnost kada je suočen sa većom količinom podataka, naročito izlaznih (suštinski, mator kod).

Konačno, da li ste znali da osnovni SPSS paket aktuelne verzije 24.0 uz godinu dana tehničke podrške košta $1140?


JASP

jasp

Ako vam je SPSS bio dobar, sva je prilika da ćete voleti JASP, njegovog mlađeg siblinga. JASP je prvi evropski softver u razvoju za obradu podataka. Nastao je sa idejom da se pruži besplatna i open-source alternativa SPSS-u. Kao i svaki mlađi sibling, tako je i JASP i lepši i zgodniji od SPSS-a.  Iznenađujuće prijatna karakteristika programa je i ta što ispisuje rezultate statističkih analiza u realnom vremenu, što će znati da cene svi oni koji su dane svojih života izgubili na čekanje da tabele, a naročito grafikoni zamene Processing… u SPSS output prozoru. Kao i svaki mlađi sibling u određenom periodu razvoja (JASP je za sad tek na o.8 verziji), i ovaj zna manje. Za sada, JASP pokriva deskriptivne analize i bazične statističke testove (t-test, ANOVA, ANCOVA, hi-kvadrat, korelaciona i linearno-regresiona analiza). Sa dobre strane, i tu kuraž treba pohvaliti, sve ove analize mogu se bejzijanski misliti, pa potom i analizirati korišćenjem JASP-a. Pa ponovo misliti. Sa loše strane, podaci se za sada ne mogu direktno unositi (niti uređivati i transformisati) unutar programa, već samo učitati kao .csv fajlovi. Sa dobre strane, program čuva fajl koji uključuje i bazu i ceo analitički proces primenjen nad njom.

Iako u totalu zna manje, JASP deluje kao nasmisleniji pokret otpora IBM-u.  U krajnjem slučaju, ne košta vas ama baš ništa da ga isprobate.


R

logo-R

Na-slovo-na-slovo moderne statistike. Besplatan i otvoreni R je programski jezik i softversko okruženje namenjeno statističkoj analizi i grafičkom prikazu. U početku su ga razvijali Ros Ihaka i Rober Džentlmen na Univerzitetu u Oklandu (New Zealand), a danas ga razvijaju svi odasvud, pa možete i vi. Naravno, velika zajednica istraživača je u prethodnim godinama napravila većinu paketa koja jednom korisniku mogu ikada zatrebati. U R-u se analize po pravilu pokreću iz komandne linije (terminala), predma postoje i GUI rešenja (kao što je R Commander).

Za one koji žele da znaju više – John Hopkins University nudi bespaltan online kurs!


SAS

SAS_Institute_logo

Još jedan dinosaur industrije statističkih softvera napuniće uskoro 50 godina. Uz finansijsku podršku američkog zdravstvenog instituta, Entoni Bar (Antony Barr) i Džejms Gudnajt su 1966. na univerzitetu u Severnoj Karolini počeli da prave softver koji može da izvede analizu varijanse i regresionu analizu na IBM-360 računarima. Cilj je bio analizirati poljoprivredne podatke kako bi se povećao prinos kukuruza. Prva verzija softvera ugledala je svetlost privilegovanih laboratorija 1971 (SAS71).  Osnovni paket savremene verzije softvera (SAS 9.4) pokriva gotovo manje-više sve zamislive vrste metoda statističke analize.

Biznis sektor obrađuje na SAS-u. Cena van torrenta prava sitnica –  $8700. Samo bahato.


Stata

stata_logo_blue

Kao SPSS i SAS, samo za NGO.


Statistica

StatSoft _STATISTICA

Još jedan matori program. Nedavno su se prodali Dell-u.


Excel

Microsoft_Excel_2013_logo.svg

Da, da, može čak i eksel za jednostavnije analize (JASP nivo, bez bejzijanstva i sve lepote instant grafike).

Iako imate ilegalan Office, ako biste se malo poigrali – instalirajte besplatno ovaj add-in .


HLM

hlm7

Čuli ste za HLM? Profe koje znaju su vam napravile softver koji možete jeftino da kupite, ali ne i da besplatno skinete. Može puno što mogu i drugi. Može i specifičnije, a opet nije fleksibilan.


RDS

300px-Defenseplot5

Posebno simpatičan program koriguje rezultate istraživanja u populacijama do kojih je teško doći, a unutar kojih se žele sprovesti analize na reprezentativnom uzorku. Autor je sociolog i ujedno najpoznatiji Heherton (Douglas D. Heckathorn) današnjice. Sa Konetikata (Conneticut) je avanzovao na Kornel (Cornell) izmislivši ispitanicima vođeno uzorkovanje. Rabiti ga odavde.


AMOS

spss-amos_14

Kao dnevnikov dodatak, samo što je dnevnik SPSS. Služi za SEM (modelovanje strukturnim jednačinama). Ima preružan grafičkih interfejs, ali jedini ga ima (cf. LISREL, EQS, SEPATH).


sometics

sometics-logo

Nešto staro – sociometrijski metod Džejkoba Morena (Jacob Moreno), i nešto novo – savremena, funkcionalna i lepo dizajnirana web aplikacija za istraživanje grupne strukture i odnosa u grupi . Sometics radi sve što treba da radi – od postavljanja sociometrijskog istraživanja, pozivanja ispitanika, do analize i prikaza rezultata. Ima čak i probnu veriju, koja nažalost staje na sociometrijskoj matrici. Ukoliko želite da dobijete i superiorne grafičke prikaze grupnih odnosa (tzv. sociograme) treba da platite –  $9.05 za analizu jedne grupe, $21.80 za analizu do devet grupa.


tableau

ZOs2Z71B

Prikaz podataka u budućnosti koja je sada i ovde.