Praktikum 2 Probabilitas dan Statistika
Senin, 12 Desember 2022
Nama : Kalyana Putri Al Kanza
NRP : 5025211137
Kelas : A
Seorang peneliti melakukan penelitian mengenai pengaruh aktivitas 𝐴 terhadap kadar saturasi oksigen pada manusia. Peneliti tersebut mengambil sampel sebanyak 9 responden. Pertama, sebelum melakukan aktivitas 𝐴, peneliti mencatat kadar saturasi oksigen dari 9 responden tersebut. Kemudian, 9 responden tersebut diminta melakukan aktivitas 𝐴. Setelah 15 menit, peneliti tersebut mencatat kembali kadar saturasi oksigen dari 9 responden tersebut. Berikut data dari 9 responden mengenai kadar saturasi oksigen sebelum dan sesudah melakukan aktivitas 𝐴
x <- c(78, 75, 67, 77, 70, 72, 78, 74, 77)
y <- c(100, 95, 70, 90, 90, 90, 89, 90, 100)
Berdasarkan data pada tabel diatas, diketahui kadar saturasi oksigen dari responden ke-3 ketika belum melakukan aktivitas 𝐴 sebanyak 67, dan setelah melakukan aktivitas 𝐴 sebanyak 70.
Carilah Standar Deviasi dari data selisih pasangan pengamatan tabel diatas
# 1a
selisih = y - x
stdev = sd(selisih)
Didapatkan standar deviasi sama dengan 6.3595947
Carilah nilai t (p-value)
t = 2 * pt(-abs(( (mean(selisih) - 0) / (stdev / sqrt(9)))), df=8)
Didapatkan nilai t (p-value) sama dengan 6.0031793e-05
Tentukanlah apakah terdapat pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴 jika diketahui tingkat signifikansi 𝛼 = 5% serta H0 : “tidak ada pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴”
var.test(x, y)
t.test(x, y, mu = 0, alternative = "two.sided", var.equal = TRUE, conf.level = 0.95)
Didapatkan p-value lebih kecil dari significant level (0.05) sehingga hipotesis nol ditolak dan hipotesis alternatif diterima. Hal ini menunjukkan bahwa aktivitas A memberikan pengaruh signifikan dalam kadar saturasi oksigen.
Diketahui bahwa mobil dikemudikan rata-rata lebih dari 20.000 kilometer per tahun. Untuk menguji klaim ini, 100 pemilik mobil yang dipilih secara acak diminta untuk mencatat jarak yang mereka tempuh. Jika sampel acak menunjukkan rata-rata 23.500 kilometer dan standar deviasi 3900 kilometer.
Step 1 : Menentukan H0 dan H1
H0: mean <= 20000
H1: mean > 20000
Step 2 : Menentukan variabel
mean <- 20000
n <- 100
meanSample <- 23500
sdSample <- 3900
Step 3 : Menentukan uji statistik Karena n > 30, maka menggunakan tabel Z.
Step 4 : Menentukan interval confidence dan nilai kritis Dianggap alfa = 0.05 karena tidak disebutkan di soal, maka nilai kritis:
nilaiKritis <- qnorm(p=.05, lower.tail = FALSE)
Didapatkan nilai kritis 1.64485. Maka, jika didapatkan hasil nilai statistik antara -1.64485 dan 1.64485, H0 diterima. Jika diluar jangkauan tersebuat, H0 ditolak.
Step 5 : Menentukan nilai statistik
z <- (meanSample - mean) / (sdSample / sqrt(n))
Didapatkan nilai statistik 8.97436
Step 6 : Menentukan p-value
install.packages("BSDA")
library(BSDA)
zsum.test(mean.x=23500, sigma.x = 3900, n.x = 100,
alternative = "greater", mu = 20000,
conf.level = 0.95)
Didapatkan nilai p-value sama dengan 2.2e-16
Step 7 : Membuat keputusan dan kesimpulan Nilai statistik (8.97436) berada di luar rentang -1.64485 hingga 1.64485, sehingga H0 ditolak. Maka, tidak ada bukti yang cukup bahwa mobil dikemudikan rata-rata kurang dari sama dengan 20000 kilometer per tahun. Klaim bahwa mobil dikemudikan rata-rata lebih dari 20000 kilometer per tahun diterima.
Apakah Anda setuju dengan klaim tersebut?
Setuju.
Jelaskan maksud dari output yang dihasilkan!
Didapatkan nilai kritis 1.64485. Maka, jika didapatkan hasil nilai statistik antara -1.64485 dan 1.64485, H0 diterima. Jika diluar jangkauan tersebuat, H0 ditolak. Didapatkan nilai statistik 8.97436. Nilai statistik berada di luar rentang -1.64485 hingga 1.64485, sehingga H0 ditolak.
Buatlah kesimpulan berdasarkan P-Value yang dihasilkan!
Nilai p-value adalah 2.2e-16. Nilai ini lebih kecil dari alfa, sehingga H0 diterima. Maka, tidak ada bukti yang cukup bahwa mobil dikemudikan rata-rata kurang dari sama dengan 20000 kilometer per tahun. Klaim bahwa mobil dikemudikan rata-rata lebih dari 20000 kilometer per tahun diterima.
Diketahui perusahaan memiliki seorang data analyst ingin memecahkan permasalahan pengambilan keputusan dalam perusahaan tersebut. Selanjutnya didapatkanlah data berikut dari perusahaan saham tersebut.
Dari data diatas berilah keputusan serta kesimpulan yang didapatkan dari hasil diatas. Asumsikan nilai variancenya sama, apakah ada perbedaan pada rata-ratanya (α= 0.05)?
H0 dan H1
H0 : meanBandung = meanBali
H1 : meanBandung != meanBali
H0 : rata-rata saham bandung sama dengan rata-rata saham Bali H1 : rata-rata saham bandung tidak sama dengan rata-rata saham Bali
Hitung Sampel Statistik
alfa <- 0.05
confLevel <- 0.95
nBandung = 19
meanBandung = 3.64
sigmaBandung = 1.67
nBali = 27
meanBali = 2.79
sigmaBali = 1.32
df <- 2
sp <- (((nBandung - 1)*(sigmaBandung^2) + (nBali - 1)*(sigmaBali^2)) / (nBandung + nBali - 2))^(0.5)
Didapatkan nilai spool adalah 1.473266.
Lakukan Uji Statistik
Karena kedua n kurang dari 30, menggunakan tabel t.
tsum.test(mean.x = meanBandung, s.x = sigmaBandung, n.x = nBandung,
mean.y = meanBali, s.y = sigmaBali, n.y = nBali,
alternative = "two.sided", mu = 0, var.equal = TRUE,
conf.level = confLevel)
Didapatkan nilai t sama dengan 1.9267 dan p-value sama dengan 0.06049.
Nilai Kritikal
nilaiKritis2 <- qt(p = alfa/2, df, lower.tail = FALSE)
Menggunakan df = 2 sesuai permintaan soal, didapatkan nilai kritikal sama dengan 4.30265.
Keputusan
Karena p-value (0.06049) lebih besar dari alfa, maka H0 diterima.
Kesimpulan
Tidak ada bukti yang cukup bahwa rata-rata saham Bandung tidak sama dengan rata-rata saham Bali. Klaim bahwa rata-rata saham Bandung sama dengan rata-rata saham Bali diterima.
Seorang Peneliti sedang meneliti spesies dari kucing di ITS . Dalam penelitiannya ia mengumpulkan data tiga spesies kucing yaitu kucing oren, kucing hitam dan kucing putih dengan panjangnya masing-masing. Jika :
Diketahui dataset https://intip.in/datasetprobstat1
H0 : Tidak ada perbedaan panjang antara ketiga spesies atau rata-rata panjangnya sama
Buatlah masing masing jenis spesies menjadi 3 subjek "Grup" (grup 1,grup 2,grup 3). Lalu Gambarkan plot kuantil normal untuk setiap kelompok dan lihat apakah ada outlier utama dalam homogenitas varians.
kucingITS$Group <- as.factor(kucingITS$Group)
kucingITS$Group = factor(kucingITS$Group,labels = c("Kucing oren", "Kucing hitam", "Kucing putih"))
class(kucingITS$Group)
Group1 <- subset(kucingITS, Group == "Kucing oren")
Group2 <- subset(kucingITS, Group == "Kucing hitam")
Group3 <- subset(kucingITS, Group == "Kucing putih")
qqnorm(Group1$Length)
qqline(Group1$Length)
qqnorm(Group2$Length)
qqline(Group2$Length)
qqnorm(Group3$Length)
qqline(Group3$Length)
Plot kuantil setiap kelompok digambar menggunakan variabel independen, yaitu factor.qqnorm() dan qqline(). Berikut adalah gambar plot kuantil semua kelompok.
Carilah atau periksalah Homogeneity of variances nya ,berapa nilai p yang didapatkan? Apa hipotesis dan kesimpulan yang dapat diambil?
bartlett.test(Length ~ Group, data = kucingITS)
Homogeinity of Variances diperiksa dengan fungsi bartlett.test(). Dari pemeriksaan tersebut, didapatkan p-value sama dengan 0.08054, Bartlett's K-Squared sama dengan 0.43292, dan derajat kebebasan atau df sama dengan 2.
Untuk uji ANOVA, buatlah model linier dengan Panjang versus Grup dan beri nama model tersebut model 1.
model1 = lm(Length ~ Group, data = kucingITS)
anova(model1)
Dari hasil poin C, berapakah nilai-p? Apa yang dapat Anda simpulkan dari H0?
Didapatkan nilai p-value 0.0013. Nilai ini lebih kecil dari tingkat signifikansi, yaitu 0.5, sehingga H0 ditolak.
Verifikasilah jawaban model 1 dengan Post-hooc test TukeyHSD, dari nilai p yang didapatkan apakah satu jenis kucing lebih panjang dari yang lain? Jelaskan.
TukeyHSD(aov(model1))
Untuk Post-hoc test Tukey HSD, digunakan fungsi aov() dan TukeyHSD(). Hasil yang didapat adalah sebagai berikut.
Visualisasikan data dengan ggplot2
library("ggplot2")
ggplot(kucingITS, aes(x = Group, y = Length)) + geom_boxplot(fill = "grey80", colour = "black") + scale_x_discrete() + xlab("Treatment Group") + ylab("Length (cm)")
Library ggplot2 digunakan untuk memvisualisasi data. Dari fungsi tersebut, didapatkan grafik sebagai berikut.
Data yang digunakan merupakan hasil eksperimen yang dilakukan untuk mengetahui pengaruh suhu operasi (100˚C, 125˚C dan 150˚C) dan tiga jenis kaca pelat muka (A, B dan C) pada keluaran cahaya tabung osiloskop. Percobaan dilakukan sebanyak 27 kali dan didapat data sebagai berikut: Data Hasil Eksperimen. Dengan data tersebut :
Buatlah plot sederhana untuk visualisasi data
qplot(x = Temp, y = Light, geom = "point", data = GLASSTEMPLIGHT) + facet_grid(.~Glass, labeller = label_both)
Library ggplot2 digunakan untuk memvisualisasi data. Dari fungsi tersebut, didapatkan grafik sebagai berikut.
Lakukan uji ANOVA dua arah untuk 2 faktor
GLASSTEMPLIGHT$Glass <- as.factor(GLASSTEMPLIGHT$Glass)
GLASSTEMPLIGHT$Temp_Factor <- as.factor(GLASSTEMPLIGHT$Temp)
str(GLASSTEMPLIGHT)
anova <- aov(Light ~ Glass*Temp_Factor, data = GLASSTEMPLIGHT)
summary(anova)
Dibuat variabel independen, yaitu factor. Kemudian, anova dilakukan menggunakan fungsi aov(). Didapatkan hasil sebagai berikut.
Tampilkan tabel dengan mean dan standar deviasi keluaran cahaya untuk setiap perlakuan (kombinasi kaca pelat muka dan suhu operasi)
data_summary <- group_by(GLASSTEMPLIGHT, Glass, Temp) %>%
summarise(mean=mean(Light), sd=sd(Light)) %>%
arrange(desc(mean))
print(data_summary)
Cara diatur dalam urutan menurun untuk menambahkan huruf superskrip dari tes Tukey. Didapatkan hasil sebagai berikut.
Lakukan uji Tukey
tukey <- TukeyHSD(anova)
print(tukey)
Perbandingan rata-rata menggunakan uji Tukey dapat dilakukan pada objek yang dihasilkan anova. Uji Tukey dilakukan menggunakan fungsi TukeyHSD(), dan mendapatkan hasil berikut.
Gunakan compact letter display untuk menunjukkan perbedaan signifikan antara uji Anova dan uji Tukey
tukey.cld <- multcompLetters4(anova, tukey)
print(tukey.cld)
Penggunaan huruf dilakukan untuk menunjukan perbedaan dalam perbandingan berpasangan dan dapat menyederhanakan visualisasi serta pembahasan yang signifikan antar sarana. Hal ini dilakukan menggunakan fungsi multcompLetters4(), dan menunjukkan hasil sebagai berikut.