Imam potrebu da izgenerišem neki izveštaj iz vrlo jednostavnih podataka.
EventID, TimeStamp
O čemu se radi, imam nekih 100k slogova (ne moram da koristim sve, mogu i da radim sa 10% toga ako je problem količina ali generalno veća količina uvek bolja, mogu da imam i više slogova, ovih 100k je nekih 24h) koji čuvaju kada se neki događaj desio. U proseku se svaki događaj, po mojoj pretpostavci, desi oko 10 puta u ovih 100k slogova iliti imam oko 10k jedinstvenih događaja. Zanima me razna statistika koju mogu da iščupam iz ovih podataka:
- koliko se istih a koliko različitih i koliko ukupno događaja desi u vremenskoj jedinici (prosečno i kakva je raspodela broja događaja)
- koliko se isti događaj razuđeno dešava (da li postoji grupisanje istih događaja, u koliko grupa, ako definišem širinu grupisanja u vremenskoj jedinici zanima me koliko prosečno grupa ima po događaju, koliko su grupe velike i naravno sve to osim proseka i sa raspodelom)
Znanja iz statistike imam malo, učilo se to pre 30 godina, imam neki SPSS v21 koji nikad nisam startovao, tamo negde krajem osamdesetih pocetkom devedesetih sam malo koristio SPSS za neke analize ali davno je to bilo no verovatno ću se snaći, nisam glup, valjda.
Ima li neko ideju koji je najbolji način, da li SPSS ili možda nešto drugo? Ovo je posao koji treba da odradim jednom i verovatno nikad više tako da mi demo verzije raznih programa od 30 dana savršeno rade posao.
hvala unapred