Basic R Series 3- COMPUTE tạo biến mới trong R
Basic R Series 3- COMPUTE tạo biến mới
Khuongcb
1. Chúng ta sẽ sử dụng bộ số liệu shapiro
làm ví dụ, bộ số liệu này bao gồm một số biến số
MI
Nhồi máu cơ tim, OC
Sử dụng thuốc tránh thai, SMOKE
Hút thuốc, AGEGROUP
Nhóm tuổi, AGEMID
Tuổi
shapiro
## # A tibble: 1,976 × 5
## MI OC SMOKE AGEGROUP AGEMID
## <dbl+lbl> <dbl+lbl> <dbl+lbl> <dbl> <dbl+lbl>
## 1 0 [No] 0 [No] 0 [None] 1 27 [25-29]
## 2 0 [No] 0 [No] 0 [None] 5 47 [45-49]
## 3 0 [No] 0 [No] 0 [None] 3 37 [35-39]
## 4 0 [No] 0 [No] 0 [None] 2 32 [30-34]
## 5 0 [No] 1 [Yes] 0 [None] 4 42 [40-44]
## 6 0 [No] 0 [No] 0 [None] 3 37 [35-39]
## 7 0 [No] 0 [No] 0 [None] 1 27 [25-29]
## 8 0 [No] 0 [No] 0 [None] 2 32 [30-34]
## 9 1 [Yes] 0 [No] 0 [None] 5 47 [45-49]
## 10 0 [No] 0 [No] 0 [None] 2 32 [30-34]
## # … with 1,966 more rows
2. COMPUTE
tạo biến mới trong R
Trong bộ số liệu gốc, biến AGEMID
là biến về tuổi của đối tượng nghiên cứu.
Giờ chúng ta muốn tạo biến là biến năm sinh của đối tượng nghiên cứu (Ví dụ vậy). Ta sẽ lấy thời điểm thu thập số liệu (2023) trừ đi tuổi là chúng ta sẽ có năm sinh của từng đối tượng.
Thao tác thực hiện đơn giản như sau:
shapiro$birth <- 2023 - shapiro$AGEMID
Trong đoạn code trên shapiro
là tên bộ số liệu ta đang làm việc trên nó, và khi tạo ra biến mới birth
thì biến này cũng sẽ được bổ sung vào bộ số liệu shapiro
luôn. ### Hoặc chúng ta có một các khác để làm
shapiro$birth2 <- 2023 - AGEMID
Và cùng xem kết quả.
shapiro
## # A tibble: 1,976 × 7
## MI OC SMOKE AGEGROUP AGEMID birth birth2
## <dbl+lbl> <dbl+lbl> <dbl+lbl> <dbl> <dbl+lbl> <dbl> <dbl>
## 1 0 [No] 0 [No] 0 [None] 1 27 [25-29] 1996 1996
## 2 0 [No] 0 [No] 0 [None] 5 47 [45-49] 1976 1976
## 3 0 [No] 0 [No] 0 [None] 3 37 [35-39] 1986 1986
## 4 0 [No] 0 [No] 0 [None] 2 32 [30-34] 1991 1991
## 5 0 [No] 1 [Yes] 0 [None] 4 42 [40-44] 1981 1981
## 6 0 [No] 0 [No] 0 [None] 3 37 [35-39] 1986 1986
## 7 0 [No] 0 [No] 0 [None] 1 27 [25-29] 1996 1996
## 8 0 [No] 0 [No] 0 [None] 2 32 [30-34] 1991 1991
## 9 1 [Yes] 0 [No] 0 [None] 5 47 [45-49] 1976 1976
## 10 0 [No] 0 [No] 0 [None] 2 32 [30-34] 1991 1991
## # … with 1,966 more rows
Như vậy ta đã tạo 2 biến năm sinh của đối tượng nghiên cứu dựa trên biến tuổi AGEMID
của đối tượng.
Sau khi tạo biến mới thì chúng ta sẽ gán nhãn biến và nhãn giá trị cho biến số đó. Các bạn có thể tham khảo bài đăng trước đây của tôi theo đường link dưới đây: https://caobakhuong.blogspot.com/2023/01/huong-dan-gan-nhan-gia-tri-cua-bien.html
Nhận xét
Đăng nhận xét