Basic R Series 3- COMPUTE tạo biến mới trong R

 

1. Chúng ta sẽ sử dụng bộ số liệu shapiro làm ví dụ, bộ số liệu này bao gồm một số biến số

MI Nhồi máu cơ tim, OC Sử dụng thuốc tránh thai, SMOKE Hút thuốc, AGEGROUP Nhóm tuổi, AGEMID Tuổi

shapiro
## # A tibble: 1,976 × 5
##    MI        OC        SMOKE     AGEGROUP AGEMID    
##    <dbl+lbl> <dbl+lbl> <dbl+lbl>    <dbl> <dbl+lbl> 
##  1 0 [No]    0 [No]    0 [None]         1 27 [25-29]
##  2 0 [No]    0 [No]    0 [None]         5 47 [45-49]
##  3 0 [No]    0 [No]    0 [None]         3 37 [35-39]
##  4 0 [No]    0 [No]    0 [None]         2 32 [30-34]
##  5 0 [No]    1 [Yes]   0 [None]         4 42 [40-44]
##  6 0 [No]    0 [No]    0 [None]         3 37 [35-39]
##  7 0 [No]    0 [No]    0 [None]         1 27 [25-29]
##  8 0 [No]    0 [No]    0 [None]         2 32 [30-34]
##  9 1 [Yes]   0 [No]    0 [None]         5 47 [45-49]
## 10 0 [No]    0 [No]    0 [None]         2 32 [30-34]
## # … with 1,966 more rows

2. COMPUTE tạo biến mới trong R

Trong bộ số liệu gốc, biến AGEMID là biến về tuổi của đối tượng nghiên cứu.

Giờ chúng ta muốn tạo biến là biến năm sinh của đối tượng nghiên cứu (Ví dụ vậy). Ta sẽ lấy thời điểm thu thập số liệu (2023) trừ đi tuổi là chúng ta sẽ có năm sinh của từng đối tượng.

Thao tác thực hiện đơn giản như sau:

shapiro$birth <- 2023 - shapiro$AGEMID

Trong đoạn code trên shapiro là tên bộ số liệu ta đang làm việc trên nó, và khi tạo ra biến mới birth thì biến này cũng sẽ được bổ sung vào bộ số liệu shapiro luôn. ### Hoặc chúng ta có một các khác để làm

shapiro$birth2 <- 2023 - AGEMID

Và cùng xem kết quả.

shapiro
## # A tibble: 1,976 × 7
##    MI        OC        SMOKE     AGEGROUP AGEMID     birth birth2
##    <dbl+lbl> <dbl+lbl> <dbl+lbl>    <dbl> <dbl+lbl>  <dbl>  <dbl>
##  1 0 [No]    0 [No]    0 [None]         1 27 [25-29]  1996   1996
##  2 0 [No]    0 [No]    0 [None]         5 47 [45-49]  1976   1976
##  3 0 [No]    0 [No]    0 [None]         3 37 [35-39]  1986   1986
##  4 0 [No]    0 [No]    0 [None]         2 32 [30-34]  1991   1991
##  5 0 [No]    1 [Yes]   0 [None]         4 42 [40-44]  1981   1981
##  6 0 [No]    0 [No]    0 [None]         3 37 [35-39]  1986   1986
##  7 0 [No]    0 [No]    0 [None]         1 27 [25-29]  1996   1996
##  8 0 [No]    0 [No]    0 [None]         2 32 [30-34]  1991   1991
##  9 1 [Yes]   0 [No]    0 [None]         5 47 [45-49]  1976   1976
## 10 0 [No]    0 [No]    0 [None]         2 32 [30-34]  1991   1991
## # … with 1,966 more rows

Như vậy ta đã tạo 2 biến năm sinh của đối tượng nghiên cứu dựa trên biến tuổi AGEMID của đối tượng.

Sau khi tạo biến mới thì chúng ta sẽ gán nhãn biến và nhãn giá trị cho biến số đó. Các bạn có thể tham khảo bài đăng trước đây của tôi theo đường link dưới đây: https://caobakhuong.blogspot.com/2023/01/huong-dan-gan-nhan-gia-tri-cua-bien.html

Nhận xét

Bài đăng phổ biến từ blog này

Basic R Series 2 - Hướng dẫn gán nhãn giá trị của biến trong R

Basic R Series 4 - Biến đổi số liệu (RECODE) tạo biến mới trong R