Habang ang larangan ng analytics ng data ay nagiging mas popular sa lahat ng mga channel, ang mga tao ay lalong nagiging kamalayan ng kahalagahan ng wastong mga resulta. Kung nagpo-post ka ng isang friendly na poll sa Facebook o nagsasagawa ng isang malawakang pag-aaral sa merkado para sa iyong tagapag-empleyo, kailangan mong makakuha ng tumpak na data mula sa mga resulta ng survey. Ang ibig sabihin nito ay gamit ang isa sa maraming mga tool na magagamit ngayon.
Pag-unawa sa Data na Nakolektang
Bago ka makapagpasya kung aling istatistikang tool na gagamitin, kailangan mo munang maunawaan ang data na nakolekta. Ang mga survey ay madalas na nasa form ng pagtukoy, na may mga sagot na nagbabago mula sa maramihang pagpili upang buksan. Ang mga istatistika ay maaari ring gumamit ng sampling, na nagpapahintulot sa kanila na kumuha ng isang subset ng isang mas malaking populasyon, pagpili na ipalagay na ang sample ay kumakatawan sa buo. Dapat ding isaalang-alang ng mga tagatala ng data ang mga resulta, dahil ang mga resulta ay maaaring mapigilan sa pamamagitan ng pagpili ng mga kalahok na mayroon nang mga partikular na tampok sa karaniwan. Kung sinusubukan mong tukuyin ang isang link sa pagitan ng ilang mga rehiyon at ang pagkalat ng kanser sa baga, halimbawa, nais mong maging kadahilanan sa mga tampok tulad ng mga gawi sa paninigarilyo.
Mayroon ding dalawang pangunahing uri ng istatistika: mapaglarawang at inferens. Ang mga mapaglarawang istatistika ay naghahanap ng mga pagkakatulad sa pagitan ng lahat ng mga miyembro ng isang populasyon, habang ang mga istatistika ng inferential ay gumagawa ng mga pagpapalagay tungkol sa isang populasyon batay sa mga uso na makikita sa data. Sa mga inferential statistics, kadalasan ang pagsisiyasat ay nagsisimula sa isang teorya. Halimbawa, "Ang depresyon ay mas karaniwan sa mga matatanda na namumuhay nang mag-isa kaysa sa mga matatanda na nagbabahagi ng tahanan." Ang teorya na iyon ay ipapataw sa mga sagot mula sa sample na nakolekta at ginagamit upang matukoy kung ang teorya na ito ay totoo o hindi.
Pag-unawa sa Mga Tool
Sa sandaling ang lahat ng mga sagot mula sa isang survey ay nakolekta, ang mga statisticians ay dapat makahanap ng isang paraan upang maisaayos ito sa isang paraan na maaari itong pag-aralan. Ang mga simpleng pag-aaral ay maaaring collated sa isang spreadsheet ng Excel, na may mga hanay na naka-set up upang kumatawan sa bawat sagot. Subalit ang pangunahing mga spreadsheet ay may mga limitasyon, kaya ang mas maraming mga advanced na istatistika ay bumabaling sa mga statistical tool na tiyak sa pagkolekta at pag-aaral ng data.
Kadalasan ang software na ginagamit upang mangolekta ng data ng survey ay maaari ding gamitin upang pamahalaan ito. Ang mga tool tulad ng SurveyMonkey ay magpapakita ng mga resulta bilang mga porsyento at numero, na nagpapahintulot din sa iyo na tumugon sa cross-reference batay sa mga uri ng mga taong tumutugon. Kung ang isang survey ay umaabot sa isang sampling ng mga kalalakihan at kababaihan, halimbawa, ang data ay maaaring hatiin sa pamamagitan ng edad, kasarian at heyograpikong lokasyon, hangga't nakolekta mo ang data na ito sa oras na iyong sinuri ang mga kalahok.
Ang pag-aaral upang lumikha at gamitin ang mga pangunahing survey ay mas madali kaysa kailanman, salamat sa teknolohiya. Gayunpaman, ang mga advanced na analytics ng data ay madalas na nakolekta ng mga propesyonal na espesyalista sa statistical work, at gumagamit sila ng mga intensive na tool tulad ng MATLAB at SAS Business Intelligence. Ang mga tool na ito ay maaaring maging costly at dumating sa isang malubhang curve sa pag-aaral, madalas na nangangailangan ng espesyal na pagsasanay upang magamit ang mga ito.