Bạn đang xem: Cách lọc dữ liệu trong spss
Bạn đang xem: bí quyết lọc dữ liệu trong spssÜ cần sử dụng Find nhằm tìm cùng sửa lỗi: Mở Data view, lựa chọn biến đề nghị sửa, trong Edit lựa chọn Find, nhập giá trị biến buộc phải sửa để tìm số liệu đang nhập sai cùng sửa (nên kiếm tìm ID để kiểm tra) cần sử dụng Frequencies: 1.Vào file dữ liệu trong Data Editor
+ Vào các folder:
* Analysis/Discreptive Statistics/Frequencies rà soát sóat giá trị của thay đổi theo Frequencies tuyệt Tables of Frequencies nhằm tìm số liệu nhầm lẫn hoàn toàn có thể dùng Find (Edit, Find, tên biến) nhằm tìm và sửa lỗi 3.Ü kiểm tra sóat giá trị của đổi mới theo Frequencies tuyệt Tables of frequencies để tìm số liệu lầm lẫn
Ü sử dụng Find (Edit, Find, thương hiệu biến) nhằm tìm cùng sửa lỗi
2.Số liệu phức tạp dùng Select cases nhằm tìm lỗi xúc tích : vào Data Editor Data, Select cases, lựa chọn biếnChọn If condition is satisfiedChọn If, chọn đổi thay và đk của đổi mới vào cột phảiContinue, OK Ở Data Editor, coi cột ngoại trừ cùng mặt trái: các phiếu gồm gạch chéo là không được cách xử lý Ü Muốn quay lại trạng thái ban đầu dùng All cases cần sử dụng Select cases nhằm tìm lỗi lô ghích : vào Data Editor 1. Data, Select cases, lựa chọn biến lựa chọn If condition is satisfied/ 3. If…. lấy ví dụ trong quá trình nhập gới: nam là 1; nàng là 2. Nhưng mà trong quá trình nhập hoàn toàn có thể nhâp lộn số là 3,4,8…. Để tìm tra xem bao gồm nhập lộn số hay không ta đặt đk cho trở nên số để phát hiện sai sót trong quá trình nhập: bằng cách ta nhập điều kiện của giới vào ô lựa chọn If, chọn điều kiện của đổi mới vào cột nên gioi > “0” và gioiLưu ý: so với biến định tính phải để trong ngoặc kép.
Xem thêm: Ngữ Văn 8 Trợ Từ Thán Từ, Thán Từ, Soạn Bài Trợ Từ, Thán Từ
H tuoi > 14 & tuoi Continue, OK Ở Data Editor, xem cột ko kể cùng bên trái: những phiếu bao gồm gạch chéo là những phiếu không thỏa mãn nhu cầu điều khiếu nại trên sẽ không còn được xử lý. Thiếu dữ liệu (thiếu chủng loại NC) Muốn trở về trạng thái ban đầu : dùng All cases 3. Dùng Crostab để tìm lỗi: Vào Data Editor, lựa chọn Crostab bằng: ÜAnalyze, Discreptive Statistics, Crostab
Ü Nhập thay đổi vào Row cùng Column (nên nhập thêm ID)
Ü Statistics, Continue, OK
Ü kiếm tìm theo ID để sửa lỗi
XÁC ĐỊNH SỐ LƯỢNG, TỶ LỆ BIẾN ĐỊNH TÍNH biến hóa đơn: khẳng định số lượng, tỷ lệ: Analyze- Discreptive Statistics- frequencies- chọn các loại biến: (giới)- chọn Chart chọn –none- chọn Continue- OK biến hóa kép : khẳng định số lượng, xác suất một trở nên số theo tính chất: ví dụ: tính từng nhóm thể lực theo giới tínhAnalyze- Discreptive Statistics-Crosstables- lựa chọn biến khẳng định vào ROW, lựa chọn biến đặc điểm vào Column – Vào CELL chọn những giá trị liên quan: Obcerved, row, column, total…
-Continue- OKXÁC ĐỊNH SỐ LƯỢNG, GIÁ TRỊ TRUNG BÌNH, ĐỘ LỆCH CHUẨN BIẾN ĐỊNH LƯỢNG xác minh giá trị trung bình và độ lệch chuẩn MỘT BIẾN ĐỊNH LƯỢNG LIÊN TỤC solo giản: 1.Vào Data view
2.Analyse/ Descriptive Statistics/ Descriptive
3.Chọn trở thành cần xác định
4.Trong Option lựa chọn giá trị phải tìm: mean, SD, SE,…
5. OK BIẾN SỐ ĐỊNH LƯỢNG XĐ SỐ TRUNG BÌNH và ĐỘ LỆCH CHUẨN theo đặc điểm 1.Analyse/Compare Means/Means
2.Chọn biến chuyển cần xác định vào ô Dependent (phụ thuộc) tuổi
3.Chọn biến xác minh tính hóa học vào ô Independent (độc lập) giới
4.Tùy lựa chọn Option:
+ chọn Means, SD,.. Qua ô Cell Statistics
+ Continue/OK
VẼ BIỂU ĐỒCHIA THÀNH NHIỀU NHÓM TÍNH TỶ LỆ THEO NHÓMTRANSFORM/Recode/Into defferent variablesNhập biến phải chia team vào ô: String variables/Output variables: ví dụ:tuổi Nhómt3 (Label: đội tuổi) chọn change: tuổi Nhómt3
Chọn Old and new value
vào new value nhập quý hiếm nhóm mới: nhom1/ vao Range nhập gia trị nhóm1: vd 1 thoguh 30 hoặc Range lowest trough 31
nhom2 31 thoguh 50/nhom3 Range highest trough 51
+ Continue/OK
Ví dụ: Nếu những nhóm xếp vào một nhóm thì xếp như sau: vd muốn xếp: Mù chữ, TH – học tập vấn thấp
THCS, trung học phổ thông -Học vấn tốt trung bình
Cđẳng, ĐH – học tập vấn cao ta làm cho như sau:Vào Old value chọn số 0 (mù chữ) vào New value chọn HV thap
1 (tiểu học) vào New value chọn HV thap
Vào Old value chọn số 2 (mù chữ) vào New value lựa chọn HVtb
3 (THCS) vào New value chọn HVtb
Vào Old value chọn số 4 (THPT) vào New value chọn HVcao
Vào Old value lựa chọn số 5 (CD,DH) vào New value chọn HVcao
+ Continue/OKTÍNH TỶ LỆ THEO NHÓM1. BiẾN ĐƠN: cần sử dụng Frequencies: Vào file dữ liệu trong Data Editor Analysis/Discreptive Statistics/Frequencies Chọn các giá trị trong bảng Frequencies:2. BIẾN KÉP: khẳng định số lượng, tỷ lệ một phát triển thành số theo tính chất: ví dụ: tính từng team thể lực theo giới tínhAnalyze- Discreptive Statistics-Crosstables- lựa chọn biến xác minh vào ROW, chọn biến đặc điểm vào Column – Vào CELL chọn các giá trị liên quan: Obcerved, row, column, total…
-Continue- OKLỆNH COMPUTEXây dựng 1 biến new trên cơ sở những biến đã có:
VD:

BMI tự chiều cao, khối lượng :BMI = cannang/(chieucao x chieu cao)Ngày khám chữa = C.TIME. DAY (Ngày ra viện – ngày vào viện) Tuổi khảo sát = C.TIME. DAY (Ngày mon năm khảo sát - tháng ngày năm sinh) X 365.25
Transform/Compute/Target Variable: Đặt tên trở thành mới: BMI/ vào Type và Label dán nhãn cho đổi mới mới/ dùng những phím tính năng (Function) để nhập phương pháp tính vào ô Mumeric Expression/OK
LỆNH COUNT: để đo lường (đếm) các giá trị của đổi mới số:Trước khi giám sát và đo lường phải đưa từ biến chuyển định tính sang biến hóa định lượngTransform/Counnt
Đặt thương hiệu biến cần tính cực hiếm vào ô Target Variable/ Đưa biến phải tổng hợp thống kê giám sát (đếm) vào ô Numeric Variable/Chọn Define Value, gửi giá trị cần khẳng định (cần đếm) vào Value (Vd: muốn đếm giá bán trị tất cả nghe đài số1/(không nghe đài số 2) thì ta nhập vào ô Value số 1) nhằm đếm toàn bộ số 1 trên những biến đề xuất đếm)
/chọn Add/+ Continue/OK
CHU Ý: Với đổi thay định tính (String) ước ao dùng lệnh COUNT phải thay đổi thành biến đổi định lượng (numeric) rồi new ĐẾM được: VD: nghe radio, phát âm báo, đổi mới trinhdo (String) trước ý muốn xếp nhóm buộc phải đổi thành biến hóa định lượng (numeric). Chia3nhomtuoiNhóm tuổi theo giới như thế nào có xác suất Nam cao nhất? Vào anlyz-Descriptive- crosstable

8nhomtuoi
Frequency | Percent | Valid Percent | Cumulative Percent | ||
Valid | nhom1 | 12 | 5.7 | 5.7 | 5.7 |
nhom2 | 10 | 4.8 | 4.8 | 10.5 | |
nhom3 | 39 | 18.6 | 18.6 | 29.0 | |
nhom5 | 33 | 15.7 | 15.7 | 44.8 | |
nhom6 | 35 | 16.7 | 16.7 | 61.4 | |
nhom7 | 30 | 14.3 | 14.3 | 75.7 | |
nhom8 | 51 | 24.3 | 24.3 | 100.0 | |
Total | 210 | 100.0 | 100.0 |

3 nhom trinh vày hoc van
Frequency | Percent | Valid Percent | Cumulative Percent | ||
Valid | hocvantb | 153 | 72.9 | 72.9 | 72.9 |
hocvanth | 38 | 18.1 | 18.1 | 91.0 | |
ocvancao | 19 | 9.0 | 9.0 | 100.0 | |
Total | 210 | 100.0 | 100.0 |

Case Processing Summary
Cases | ||||||
Valid | Missing | Total | ||||
N | Percent | N | Percent | N | Percent | |
3 nhom trinh vì chưng hoc van * GIOI | 210 | 100.0% | 0 | .0% | 210 | 100.0% |
GIOI | Total | ||||
nam | nu | ||||
3 nhom trinh bởi hoc van | hocvantb | Count | 88 | 65 | 153 |
% within 3 nhom trinh vày hoc van | 57.5% | 42.5% | 100.0% | ||
hocvanth | Count | 18 | 20 | 38 | |
% within 3 nhom trinh vì chưng hoc van | 47.4% | 52.6% | 100.0% | ||
ocvancao | Count | 8 | 11 | 19 | |
% within 3 nhom trinh vì hoc van | 42.1% | 57.9% | 100.0% | ||
Total | Count | 114 | 96 | 210 | |
% within 3 nhom trinh do hoc van | 54.3% | 45.7% | 100.0% |
Frequency | Percent | Valid Percent | Cumulative Percent | ||
Valid | nhom1 | 133 | 63.3 | 63.3 | 63.3 |
nhom2 | 27 | 12.9 | 12.9 | 76.2 | |
nhom3 | 50 | 23.8 | 23.8 | 100.0 | |
Total | 210 | 100.0 | 100.0 |
GIOI | Total | ||||
nam | nu | ||||
chia nhom3 | nhom1 | Count | 70 | 63 | 133 |
Expected Count | 72.2 | 60.8 | 133.0 | ||
% within phân chia nhom3 | 52.6% | 47.4% | 100.0% | ||
% within GIOI | 61.4% | 65.6% | 63.3% | ||
% of Total | 33.3% | 30.0% | 63.3% | ||
nhom2 | Count | 15 | 12 | 27 | |
Expected Count | 14.7 | 12.3 | 27.0 | ||
% within chia nhom3 | 55.6% | 44.4% | 100.0% | ||
% within GIOI | 13.2% | 12.5% | 12.9% | ||
% of Total | 7.1% | 5.7% | 12.9% | ||
nhom3 | Count | 29 | 21 | 50 | |
Expected Count | 27.1 | 22.9 | 50.0 | ||
% within phân chia nhom3 | 58.0% | 42.0% | 100.0% | ||
% within GIOI | 25.4% | 21.9% | 23.8% | ||
% of Total | 13.8% | 10.0% | 23.8% | ||
Total | Count | 114 | 96 | 210 | |
Expected Count | 114.0 | 96.0 | 210.0 | ||
% within chia nhom3 | 54.3% | 45.7% | 100.0% | ||
% within GIOI | 100.0% | 100.0% | 100.0% | ||
% of Total | 54.3% | 45.7% | 100.0% |

Uỏi
ứng dụng compute tinh tuổi
Snthongtina chia nhom3
Frequency | Percent | Valid Percent | Cumulative Percent | ||
Valid | nhom1 | 133 | 63.3 | 63.3 | 63.3 |
nhom2 | 27 | 12.9 | 12.9 | 76.2 | |
nhom3 | 50 | 23.8 | 23.8 | 100.0 | |
Total | 210 | 100.0 | 100.0 |
Count
Mở file dữ liệu-Analyse/Compare Means/One-Samples T-test (1TB triết lý và 1 TB NC)/Chọn biến buộc phải kiểm định
/ xác định giá trị bắt buộc kiểm định: demo value/xác định độ tin cẩn bằng Option chọn Confidence Interval 95% (mặc định)/chọn Exact/Continue/OKKết luận:
Dựa vào Bảng kiểm tra Value/cột Sig.(2-tailed) giá trị P=…
Nếu (Vì) p=….>0,05 nên không có sự biệt lập giữa ….trung bình của group N/cứu đối với TB kim chỉ nan với độ tin cậy….(95%)2.Kiểm định 2 trung bình
Mở file dữ liệu-Analyse/Compare Means/Independent--Samples T-test /Chọn biến yêu cầu kiểm định
/ kiểm tra variable: TUỔI (biến định lượng)/Grouping variable: GIỚI (biến định tính)/ Define group (1: nam; 2 nữ)/
/Continue/OK
Kết luận:Dựa vào Bảng Independent chạy thử /
Đọc dựa vào cột: Levene’s demo for Equality of Variances (dùng cho 2 test gồm 2 Phương không đúng tương đương):
* Nếu
Đọc Levene’s Test: do Sig = 0,626>0,05 buộc phải hai phương không đúng là tương đương- tiếp sau đọc tác dụng ở cột t-test for Equality sinh hoạt Dòng 1 Equal variances assumed ( đọc mang đến trường hòa hợp 2 giá trị trung bình có Phương sai/độ lệch chuẩn chỉnh tương đương),Dòng 1: (tại cột Sig.2-tailed) có Sig.2-tailed = 0,354>0,05 đề xuất trung bình tuổi của 2 nhóm nam và đàn bà là không khác biệt với độ tin tưởng 95% * trường hợp Đọc Levene’s Test: bởi vì Sig = …cột t-test for Equality sinh sống Dòng 2 Equal variances not assumed ( đọc mang đến trường hòa hợp 2 giá trị trung bình gồm Phương sai/độ lệch chuẩn không tương đương),3.Kiểm định >2 trung bình: Oneway ANOVAMở tệp tin dữ liệu-Analyse/Compare Means/one-way ANOVA/Chọn đổi mới định lượng cần kiểm định để lấy vào ô Dependent list (cân nặng)/ Chọn biến hóa phân loại cần kiểm định để lấy vào ô Factor (nơi ở)/
- chọn Option: để sở hữu giá trị trung bình những nhóm:
+ lựa chọn Descriptive;
+ lựa chọn Homogeneity of Variances/
2 sự chọn lựa này nhằm xác định loại thống kê biểu lộ và tính đồng hóa của phương không đúng giúp kiểm định sự ngang bởi về phương không nên giữa những nhóm (test những thống kê Leven quyết định đến sự lựa chọn phương thức kiểm định trong phần Post Hoc); Công cụ: Means Plot dùng nhằm hiển thị đồ gia dụng thị về cực hiếm trung bình của các nhóm; Công cụ:Missing Value dùng để kiểm soát điều hành giá trị khuyết: Exclude cases analysis by analysis: những ngôi trường hợp có mức giá trị khuyết sống trong biến nhờ vào và biến điều hành và kiểm soát sẽ không được gửi vào vào kiểm định. Dường như những ngôi trường hợp có mức giá trị quan tiếp giáp nằm phía bên ngoài chuỗi đã khẳng định cho biến kiểm soát điều hành cũng ko được sử dụng. Exclude cases listwise: số đông trường hợp có giá trị khuyết cases vào biến tinh chỉnh và điều khiển hoặc ngẫu nhiên biến dựa vào nào được giới thiệu hoặc không được đưa ra kiểm định đề bị loại bỏ trừ ra khỏi quy trình phân tích
( Trong tổng thể các phương sai của những mẫu tài liệu phải tương tự (sẽ được kiểm định bằng test những thống kê Levene’s Homogeneity of Variances) lựa chọn Post Hoc: để so sánh sự khác hoàn toàn từng cặp giữa các nhóm (nhóm nào khác biệt với đội nào): + lựa chọn LSD nếu những phương sai bởi nhau;+ lựa chọn Dunnett’ T3 nếu như phương không đúng không bởi nhau
/Continue/OK (không chọn Contracts)?Đọc kết quả: phụ thuộc vào 2 kiểm tra sau: kiểm tra thống kê Levene’s Homogeneity of Variances): Nếu: Sig. = p= >0,05 các phương sai tương đương – đọc công dụng bằng chạy thử LSD ;Nếu: Sig. = p= chạy thử ANOVA Kết luận phụ thuộc vào Sig = P=….>0,05 cần ta đồng ý giả thuyết Ho nghĩa là không tồn tại sự khác hoàn toàn (trung bình trọng lượng ở các vùng sinh sống) cùng với độ tin cẩn 95 %Lưu ý: + Nếu: Sig. = p= >0,05 các phương sai tương tự – đọc công dụng bằng thử nghiệm LSD ; + Nếu: Sig. = p= (Nếu nhầm phương sai: tương tự hoặc không tương đương thì thì kết luận có thể bị khác biệt nhau) KIỂM ĐỊNH CÁC TỶ LỆ vào SPSS chu chỉnh 1 tỷ lệ định hướng với 1 phần trăm nghiên cứu: Mở tệp tin dữ liệu-Analyse/Nonparametric Test/Chi-Quare/Chọn biến cần phân tích để mang vào ô thử nghiệm Variable danh mục (nếu là biến định tính cần chuyển thành biến định lượng mới đưa vào được) /Đưa các giá trị lần lượt vào ô Expected value:Po, 1-Po/OKKết luận:
Khi Cells0,05 (nên ta gật đầu đồng ý Ho) nghĩa là không tồn tại sự khác biệt (PMonte Carlo (mặc định) 99% (và có thể điều chỉnh 96%...98%)Lưu ý: khi Cells>0,25 thì mặc dù có Asymp.Sig. = P>0,05 thì cũng không tóm lại được mà phải dùng chạy thử khác để kiểm định kiểm tra 2 tỷ lệ Mở file dữ liệu-Analyse/Descriptive Statistics/Crosstabs/Chọn biến phụ thuộc vào (hậu quả) (ví dụ xem tivi) buộc phải Phân tích để mang vào ô Row/
Chọn phát triển thành Độc lập (Nguyên nhân) (ví dụ: Giới: nam, nữ) cần Phân tích để mang vào ô Column/ chọn Cells: chọn Observed, lựa chọn Row/Column/Total/Chọn Statistics: chọn Chi-Quare/Chọn Exact/OK (Asymtotic only: có mức giá trị 95%)Kết luận:
Chọn 2 biến bắt buộc xét đối sánh tương quan đưa vào ô Variable
Trong Option lựa chọn Mean & Std deviation với Exclude cases pairwise/OK. Đọc kết quả cường độ của các mối quan hệ tình dục (R=) là chỗ giao nhau giữa 2 biến đổi trong bảng
Chú thích: vào bảng Chi-Quare Tests:128 (b): b: Cell= tổng mặt hàng x tổng cột/giá trị Cells: - Continuity Correction (a): thử nghiệm này chỉ cần sử dụng cho bảng 2x2- Likelihood Ratio: kiểm tra này dùng để kiểm định xác suất có độ nhạy, độ quánh hiệu (XN)- Fisher’s Exact Test: thử nghiệm này dùng cho mẫu bé dại có hy vọng Cells >0,25
- Trong nghiên cứu không nhằm missing
- Trình bày quan hệ phơi nhiễm-bệnh theo bảng 2 x n cùng với qui cầu yếu tố phơi nhiễm trình bày theo hàng cùng yếu tố bệnh trình bày theo cột. Để hiệu quả kiểm định an toàn thì những số liệu trong bảng chéo cánh giữa 2 vươn lên là đang điều tra khảo sát phải thỏa mãn nhu cầu điều kiện sau:+ không tồn tại ngẫu nhiên ô giao nhau thân 2 biến có mức giá trị mong đợi Kiểm định >2 xác suất (các cách tiến hành giống như kiểm định 2 tỷ lệ) Mở file dữ liệu-Analyse/Descriptive Statistics/Crosstabs/
Chọn biến nhờ vào (hậu quả) (ví dụ coi tivi) phải Phân tích để đưa vào ô Row/
Chọn đổi mới Độc lập (Nguyên nhân) (ví dụ: Giới: nam, nữ) yêu cầu Phân tích để lấy vào ô Column/ Chọn Cells: chọn Observed, lựa chọn Row/Column/Total/Chọn Statistics: lựa chọn Chi-Quare/Chọn Exact/OK (Asymtotic only: có mức giá trị 95%)