Trong nghiên cứu định lượng y học, đây là "bộ khung xương" quyết định sự thành bại của một đề tài. Một thiết kế sai lệch ở bước này sẽ dẫn đến việc thu thập dữ liệu vô ích (Garbage in, Garbage out).
1. Mối liên hệ logic: Từ câu hỏi đến biến số
Một nghiên cứu khoa học không phải là một tập hợp các câu hỏi rời rạc, mà là một chuỗi logic gắn kết chặt chẽ:
Câu hỏi nghiên cứu: Vấn đề lâm sàng bạn muốn giải quyết (Ví dụ: Tại sao bệnh nhân không tuân thủ điều trị?).
Giả thiết nghiên cứu: Câu trả lời dự đoán dựa trên y văn hoặc quan sát thực tế (Ví dụ: Thu nhập thấp là rào cản chính).
Mục tiêu nghiên cứu: Những gì bạn cam kết sẽ thực hiện để kiểm chứng giả thiết.
Biến số nghiên cứu: Những thông số cụ thể bạn cần đo lường trên thực địa để hoàn thành mục tiêu.
2. Mục tiêu nghiên cứu (Research Objectives)
Mục tiêu nghiên cứu phải trả lời được câu hỏi: "Nghiên cứu này thực hiện để làm gì?".
2.1. Nguyên tắc SMART trong viết mục tiêu
Mục tiêu không được viết chung chung mà phải tuân thủ 5 tiêu chí:
S (Specific): Cụ thể (Ví dụ: "Tuân thủ điều trị" thay vì "Kết quả điều trị").
M (Measurable): Đo lường được (Bằng thang đo Morisky, PDC...).
A (Achievable): Có thể đạt được (Phù hợp với nguồn lực bệnh viện).
R (Relevant): Thực tế và có giá trị cho khoa/phòng.
T (Time-bound): Có thời hạn (Trong năm 2026 tại BV Y).
2.2. Phân loại mục tiêu
Mục tiêu chung: Phát biểu khái quát về mục đích của đề tài.
Mục tiêu cụ thể: Chia nhỏ mục tiêu chung thành 2-3 phần thực thi:
Mục tiêu mô tả: Xác định tỷ lệ hiện mắc, đặc điểm mẫu.
Mục tiêu phân tích: Tìm mối liên quan giữa các yếu tố.
Mục tiêu chính để tính cỡ mẫu: Thông thường là mục tiêu mô tả tỷ lệ chính của nghiên cứu
.
3. Giả thiết nghiên cứu (Research Hypothesis)
Giả thiết là một phát biểu mang tính dự đoán về mối quan hệ giữa hai hay nhiều biến số
Giả thiết Không (H_0): Giả định không có sự khác biệt hoặc không có mối liên quan. Đây là đối tượng để các phép kiểm thống kê (p-value) bác bỏ.
Ví dụ: Không có sự khác biệt về tỷ lệ tuân thủ giữa nhóm thu nhập thấp và thu nhập cao.
Giả thiết Đối (H_1): Những gì nhà nghiên cứu kỳ vọng tìm thấy.
H1 hai phía: Có sự khác biệt (nhưng chưa biết bên nào tốt hơn).
H1 một phía: Nhóm thu nhập cao có tỷ lệ tuân thủ tốt hơn nhóm thu nhập thấp.
4. Biến số nghiên cứu (Research Variables)
Biến số là đặc tính của đối tượng có thể thay đổi và đo lường được.
4.1. Phân loại theo vai trò nghiên cứu
| Vai trò | Định nghĩa | Ví dụ (Đề tài tuân thủ điều trị) |
|---|---|---|
| Biến phụ thuộc | Kết cục (Outcome) bạn quan tâm. | Tình trạng tuân thủ (Tốt/Kém) |
| Biến độc lập | Các yếu tố nguy cơ hoặc nguyên nhân dự đoán. | Thu nhập, Học vấn, Khoảng cách từ nhà đến viện |
| Biến nhiễu | Yếu tố làm lệch mối quan hệ giữa biến độc lập và phụ thuộc. | Tuổi, Giới tính, Thời gian mắc bệnh |
4.2. Phân loại theo bản chất dữ liệu
Biến định lượng: Dữ liệu là con số thực (Tuổi, Chỉ số huyết áp, BMI)
. Biến định tính: Dữ liệu là các phân loại (Giới tính, Nhóm máu, Tình trạng hôn nhân).
Lưu ý: Để đưa vào các mô hình hồi quy như R hay SPSS, các biến định tính thường được mã hóa thành biến nhị phân (0 và 1)
.
5. Thực hành trên R: Kiểm định giả thiết và Quản lý biến số
Để tài liệu có tính thực tiễn cao, chúng ta áp dụng bộ dữ liệu mẫu 200 bệnh nhân tăng huyết áp.
5.1. Quy trình xử lý và định nghĩa vận hành biến số
Việc định nghĩa rõ ràng cách tính toán biến số trong R giúp nghiên cứu có tính lặp lại (reproducible).
{r
# Định nghĩa vận hành biến số tuân thủ dựa trên điểm MMAS-8
tuanhieu$tuanhieu <- ifelse(tuanhieu$MMAS_score >= 6, 1, 0) # 1: Tốt, 0: Kém
}
# Định nghĩa vận hành biến số tuân thủ dựa trên điểm MMAS-8
tuanhieu$tuanhieu <- ifelse(tuanhieu$MMAS_score >= 6, 1, 0) # 1: Tốt, 0: Kém
5.2. Kiểm định giả thiết bằng Chi-bình phương (Chi-square test)
Sử dụng R để bác bỏ giả thiết H_0:
{r
# Kiểm tra mối liên quan giữa thu nhập và tuân thủ
# H0: Thu nhập không liên quan đến tuân thủ
library(epitools)
result <- chisq.test(tuanhieu$tuanhieu, tuanhieu$thu_nhap_thap)
print(result)
# Tính Odds Ratio (OR) để thấy mức độ ảnh hưởng
oddsratio(tuanhieu$tuanhieu, tuanhieu$thu_nhap_thap)
}
# Kiểm tra mối liên quan giữa thu nhập và tuân thủ
# H0: Thu nhập không liên quan đến tuân thủ
library(epitools)
result <- chisq.test(tuanhieu$tuanhieu, tuanhieu$thu_nhap_thap)
print(result)
# Tính Odds Ratio (OR) để thấy mức độ ảnh hưởng
oddsratio(tuanhieu$tuanhieu, tuanhieu$thu_nhap_thap)
Biện luận kết quả: Nếu p < 0.05, chúng ta bác bỏ H_0 và kết luận thu nhập có liên quan đến tuân thủ với ý nghĩa thống kê. Khoảng tin cậy (CI) 95% của OR không chứa giá trị 1 khẳng định mối liên quan này là đáng tin cậy
5.3. Sử dụng Package AdhereR
Đây là công cụ chuyên sâu trong y học để tính toán tỷ lệ bao phủ thuốc (PDC) từ dữ liệu cấp phát thuốc thực tế, giúp khách quan hóa biến số "tuân thủ" thay vì chỉ dựa vào bảng hỏi.
library(AdhereR)
# CMA1 tính tỷ lệ số ngày được cấp thuốc trên tổng số ngày theo dõi
measure <- CMA1(data_ke_don)
summary(measure)
Tóm lại:
Mục tiêu: Phải SMART và đo lường được.
Giả thiết: Luôn có $H_0$ (không liên quan) để bác bỏ bằng p-value.
Biến số: Cần xác định rõ đâu là kết cục (phụ thuộc) và đâu là yếu tố tác động (độc lập).
Phân tích: R là công cụ mạnh mẽ để hiện thực hóa các kiểm định giả thiết này thông qua các package chuyên dụng như
epitoolsvàAdhereR.
- Đăng nhập để gửi ý kiến