🎯 MỤC TIÊU
Về kiến thức (Knowledge):
- Phân biệt được 3 loại dữ liệu: structured, semi-structured, unstructured
- Mô tả được ưu/nhược điểm của paper-based vs Electronic Data Capture (EDC)
- Hiểu được cấu trúc của một Case Report Form (CRF) chuẩn
- Nhận biết được các nguyên tắc thiết kế questionnaire tốt (Likert scales, validated tools)
Về kỹ năng (Skills): 5. Sử dụng được AI để tạo bộ câu hỏi (questionnaire) bằng tiếng Việt 6. Thiết kế được CRF cơ bản cho RCT đơn giản 7. Tạo được Google Form thu thập dữ liệu hoạt động được trên điện thoại 8. Đánh giá được questionnaire AI tạo ra trước khi sử dụng (face validity, content validity)
Về thái độ (Attitude): 9. Ưu tiên dùng questionnaire đã được validate (SF-36, EQ-5D) thay vì tự tạo mới khi có thể 10. Cẩn trọng với chất lượng câu hỏi — coi questionnaire xấu là "rễ cây mục" của nghiên cứu
📚 PHẦN 1: TẠI SAO KHÂU THU THẬP DỮ LIỆU LẠI QUAN TRỌNG?
1.1. Một câu chuyện về 2 phương pháp thu thập
Tình huống: Hai nhóm nghiên cứu cùng nghiên cứu chất lượng cuộc sống bệnh nhân ung thư tại 2 bệnh viện tỉnh.
Nhóm A dùng phiếu giấy: Phát phiếu, BN tự điền, điều dưỡng nhập lại vào Excel sau giờ làm. Sau 6 tháng: 500 phiếu, 15% phiếu lỗi (BN bỏ trống, đánh dấu sai, không đọc được chữ), nhập sai 8%, mất 200 giờ nhập liệu.
Nhóm B dùng Google Forms trên iPad: BN điền tại phòng khám với hỗ trợ của điều dưỡng, dữ liệu vào Excel tự động. Sau 6 tháng: 480 phiếu, <2% lỗi, không cần nhập lại.
Kết quả:
- Nhóm A: bài báo bị reject vì "data quality issues"
- Nhóm B: bài báo được đăng tạp chí Q2
💡 Bài học: Cùng câu hỏi nghiên cứu, cùng cỡ mẫu — nhưng cách thu thập quyết định chất lượng cuối cùng.
1.2. Thực trạng thu thập dữ liệu tại Việt Nam
Theo các khảo sát gần đây tại các BV Việt Nam:
┌────────────────────────────────────────────────────┐
│ Phương pháp thu thập │ Tỷ lệ sử dụng (~2024) │
├────────────────────────────────────────────────────┤
│ Paper-based │ ~70% │
│ Excel sau khi nhập │ ~20% │
│ Google Forms/Survey │ ~8% │
│ REDCap/EDC chuyên dụng │ ~2% │
└────────────────────────────────────────────────────┘
Xu hướng: Chuyển từ paper → digital đang diễn ra nhanh, nhưng đa số BV vẫn paper-based.
Vấn đề của paper-based:
| Vấn đề | Tỷ lệ |
|---|---|
| Missing data (ô trống) | 10-25% |
| Transcription errors (nhập sai) | 5-15% |
| Phiếu thất lạc | 2-5% |
| Chữ viết không đọc được | 5-10% |
| Mất thời gian nhập liệu | Lớn (gấp 2-3 lần thu thập) |
💡 Đây là lý do chuyển sang digital + dùng AI mang lại lợi ích lớn nhất ở khâu này.
1.3. AI có thể giúp gì ở khâu thu thập dữ liệu?
| Tác vụ | AI giỏi? | Lợi ích |
|---|---|---|
| Tạo câu hỏi survey | ⭐⭐⭐⭐⭐ | Tiết kiệm 70-80% thời gian draft |
| Dịch questionnaire (Anh→Việt) | ⭐⭐⭐⭐ | Tốt nhưng cần chuyên gia review |
| Tạo CRF cho RCT | ⭐⭐⭐⭐ | Cấu trúc chuẩn, đầy đủ phần |
| Validate câu hỏi (logic, clarity) | ⭐⭐⭐⭐ | "Reviewer ảo" trước khi pilot |
| Trích xuất dữ liệu từ bệnh án | ⭐⭐⭐ | Có ích nhưng cần verify |
| Tự động phân tích open-ended | ⭐⭐⭐⭐ | Code thematic analysis |
✅ CHECKPOINT 1: Tự kiểm tra kiến thức
Một bác sĩ nói: "Tôi sẽ thu thập dữ liệu trên giấy như mọi người vẫn làm — đỡ phức tạp hơn."
Câu nói này có vấn đề gì? Liệt kê 3 hậu quả có thể xảy ra.
Đáp án ở cuối bài.
🔬 PHẦN 2: PHÂN LOẠI DỮ LIỆU — BIẾT TRƯỚC KHI THIẾT KẾ
2.1. Ba loại dữ liệu trong nghiên cứu y khoa
┌─────────────────────────────────────────────────────┐
│ STRUCTURED (Có cấu trúc) │
│ - Demographics (tuổi, giới) │
│ - Lab values (HbA1c, creatinine) │
│ - Vital signs (HA, mạch) │
│ → Dễ phân tích nhất │
├─────────────────────────────────────────────────────┤
│ SEMI-STRUCTURED (Bán cấu trúc) │
│ - Questionnaires với Likert scale │
│ - Câu hỏi đóng + 1 câu hỏi mở cuối │
│ - Checklist with comments │
│ → Phân tích định lượng + định tính │
├─────────────────────────────────────────────────────┤
│ UNSTRUCTURED (Không cấu trúc) │
│ - Bệnh án viết tay │
│ - Phỏng vấn sâu (interview) │
│ - Free-text comments │
│ → Khó phân tích nhất, cần NLP/coding │
└─────────────────────────────────────────────────────┘
2.2. Khi nào dùng loại nào?
| Loại nghiên cứu | Loại dữ liệu chính |
|---|---|
| RCT đo HbA1c | Structured (số liệu lab) |
| Khảo sát chất lượng cuộc sống | Semi-structured (questionnaire) |
| Nghiên cứu định tính trải nghiệm bệnh nhân | Unstructured (interview transcripts) |
| Mixed-methods study | Cả 3 loại |
💡 Mẹo: Trong proposal, hãy nêu rõ loại dữ liệu của bạn. Reviewer sẽ đánh giá phương pháp thu thập có phù hợp không.
✅ CHECKPOINT 2: Phân loại
Cho 4 biến trong nghiên cứu, phân loại structured/semi-structured/unstructured:
- Câu hỏi: "Xếp mức độ đau của bạn từ 1-10"
- Câu hỏi: "Hãy mô tả cảm xúc của bạn khi nhận chẩn đoán ung thư"
- Kết quả xét nghiệm HbA1c
- Phỏng vấn 30 phút với bệnh nhân về trải nghiệm điều trị
Đáp án ở cuối bài.
🎯 PHẦN 3: NGUYÊN TẮC THIẾT KẾ QUESTIONNAIRE TỐT
3.1. Nguyên tắc số 1: ƯU TIÊN dùng tool đã validate
Đây là nguyên tắc quan trọng nhất.
Trước khi nghĩ đến tự tạo questionnaire, hãy kiểm tra: "Có thang đo nào đã được validate cho biến này chưa?"
Các thang đo phổ biến đã có bản tiếng Việt validated:
| Lĩnh vực | Thang đo | Số câu | Tình trạng VN |
|---|---|---|---|
| Chất lượng cuộc sống | SF-36 | 36 | ✅ Đã validate |
| Chất lượng cuộc sống | EQ-5D-5L | 5 | ✅ Đã validate |
| Stress | PSS-10 (Perceived Stress Scale) | 10 | ✅ Đã validate |
| Trầm cảm | PHQ-9 | 9 | ✅ Đã validate |
| Lo âu | GAD-7 | 7 | ✅ Đã validate |
| Burnout | MBI-22 (Maslach) | 22 | ✅ Có |
| Đau | VAS (Visual Analog) | 1 | ✅ Phổ biến |
| Đau | Brief Pain Inventory | 9 | ✅ Có |
| Tuân thủ thuốc | Morisky-8 | 8 | ✅ Đã validate |
| Giấc ngủ | PSQI (Pittsburgh) | 19 | ✅ Đã validate |
💡 Lý do: Thang đo đã validate có:
- Độ tin cậy (reliability) đã được kiểm chứng
- Tính giá trị (validity) đã được xác lập
- Có thể so sánh kết quả với nghiên cứu khác
- Reviewer chấp nhận dễ hơn
⚠️ Cảnh báo: Tự dịch tool tiếng Anh sang tiếng Việt KHÔNG được phép — phải dùng bản đã được forward-backward translation và validation.
3.2. Khi PHẢI tự tạo questionnaire — 7 nguyên tắc vàng
Nếu thực sự không có tool validated phù hợp, hãy tuân thủ:
1. Một câu — một ý
❌ "Bạn có hài lòng với chất lượng và tốc độ phục vụ của bệnh viện không?"
(Đây là 2 câu hỏi gộp — gọi là "double-barreled question")
✅ "Bạn có hài lòng với chất lượng phục vụ của bệnh viện không?"
✅ "Bạn có hài lòng với tốc độ phục vụ của bệnh viện không?"
2. Tránh câu hỏi dẫn dắt (leading questions)
❌ "Phương pháp điều trị mới hiệu quả hơn, đúng không?"
✅ "Bạn đánh giá phương pháp điều trị mới như thế nào so với phương pháp cũ?"
3. Ngôn ngữ đơn giản, không dùng thuật ngữ y khoa
❌ "Bạn có triệu chứng dyspnea khi gắng sức không?"
✅ "Bạn có cảm thấy khó thở khi đi bộ hoặc lên cầu thang không?"
4. Likert scale — số lẻ hay chẵn?
| 5 điểm (lẻ) | 4 điểm (chẵn) |
|---|---|
| Rất không đồng ý / Không đồng ý / Trung lập / Đồng ý / Rất đồng ý | Rất không đồng ý / Không đồng ý / Đồng ý / Rất đồng ý |
| ✅ Cho phép trung lập | ✅ Buộc người trả lời chọn hướng |
| ⚠️ Có thể nhiều người chọn "trung lập" để né | ⚠️ Có thể gây bias nếu thực sự không có ý kiến |
💡 Khuyến nghị: Dùng 5 điểm hoặc 7 điểm — phổ biến và phù hợp với người Việt Nam.
5. Tránh câu hỏi phủ định kép
❌ "Bạn không thấy phương pháp này không hiệu quả?"
✅ "Bạn thấy phương pháp này có hiệu quả không?"
6. Dùng khoảng thời gian rõ ràng
❌ "Bạn có hay đau đầu không?"
✅ "Trong 7 ngày qua, bạn có đau đầu không? Nếu có, mấy lần?"
7. Tránh câu hỏi nhạy cảm ở đầu
Sắp xếp questionnaire:
- Đầu: Câu dễ trả lời (demographics, sự kiện chung)
- Giữa: Câu chính
- Cuối: Câu nhạy cảm (thu nhập, tình dục, hành vi rủi ro)
3.3. Cấu trúc questionnaire chuẩn
┌─────────────────────────────────────────┐
│ PHẦN 1: GIỚI THIỆU │
│ - Mục đích nghiên cứu │
│ - Bảo mật, ẩn danh │
│ - Thời gian dự kiến (5/10/15 phút) │
│ - Đồng ý tham gia (consent) │
├─────────────────────────────────────────┤
│ PHẦN 2: THÔNG TIN NHÂN KHẨU │
│ - Tuổi, giới, nghề nghiệp │
│ - Trình độ học vấn │
├─────────────────────────────────────────┤
│ PHẦN 3: CÂU HỎI CHÍNH │
│ - Validated tools (SF-36, PHQ-9...) │
│ - Câu hỏi tự tạo (nếu cần) │
├─────────────────────────────────────────┤
│ PHẦN 4: CÂU HỎI NHẠY CẢM (nếu có) │
│ - Thu nhập, hành vi cá nhân │
├─────────────────────────────────────────┤
│ PHẦN 5: CÂU MỞ + CẢM ƠN │
│ - "Bạn còn muốn chia sẻ điều gì?" │
│ - Lời cảm ơn │
└─────────────────────────────────────────┘
✅ CHECKPOINT 3: Phát hiện lỗi
Đọc câu hỏi sau và phát hiện 2 lỗi:
"Bạn có thường xuyên không tuân thủ điều trị thuốc và tập thể dục đều đặn không?"
Lỗi gì? Sửa thế nào?
Đáp án ở cuối bài.
🤖 PHẦN 4: SỬ DỤNG AI ĐỂ TẠO QUESTIONNAIRE VÀ CRF
4.1. Quy trình 4 bước với AI
BƯỚC 1: Mô tả cụ thể nhu cầu (lĩnh vực, đối tượng, ngữ cảnh)
↓
BƯỚC 2: Yêu cầu AI tạo draft - bao gồm cả scoring
↓
BƯỚC 3: Đánh giá: face validity + content validity
↓
BƯỚC 4: Pilot test (5-10 người) → tinh chỉnh → final version
4.2. Prompt mẫu chuẩn (sao chép, dùng được ngay)
Prompt 1: Tạo Questionnaire mới
Tôi cần tạo bộ câu hỏi (questionnaire) tiếng Việt để đánh giá [chủ đề]
ở [đối tượng] tại [bối cảnh].
Bối cảnh:
- Đối tượng: [VD: bệnh nhân sau đột quỵ, 50-80 tuổi]
- Trình độ học vấn: [đa số phổ thông trung học]
- Thời gian dự kiến điền: [10 phút]
- Cách thu thập: [tự điền/phỏng vấn]
Yêu cầu nội dung:
- Số câu: 15-20 câu
- Cover các domain: [VD: Physical, Mental, Social, Environment]
- Likert scale 5 điểm
- Ngôn ngữ ĐƠN GIẢN, dễ hiểu (tránh thuật ngữ y khoa)
- Phù hợp văn hóa Việt Nam
Hãy:
1. Tạo bộ câu hỏi đầy đủ (đánh số rõ ràng)
2. Mỗi câu, ghi rõ: thuộc domain nào
3. Đề xuất scoring system (cách tính điểm)
4. Cảnh báo các câu có nguy cơ "double-barreled" hoặc "leading"
5. Đề xuất câu hỏi mở ở cuối
Trình bày dạng bảng dễ đọc.
Prompt 2: Đánh giá questionnaire có sẵn
Tôi có bộ câu hỏi sau (do tôi/đồng nghiệp viết):
[paste questionnaire]
Hãy đóng vai "reviewer khắt khe" và đánh giá:
1. Có câu nào "double-barreled" (gộp 2 ý) không?
2. Có câu nào "leading" (dẫn dắt) không?
3. Có câu nào dùng thuật ngữ khó hiểu với BN bình thường không?
4. Có câu nào trùng ý không?
5. Likert scale có nhất quán không?
6. Cấu trúc tổng thể (thứ tự câu) có hợp lý không?
7. Đề xuất câu sửa cho từng vấn đề
Trình bày kết quả dạng bảng: STT câu | Vấn đề | Đề xuất sửa
Prompt 3: Thiết kế CRF cho RCT
Tôi cần thiết kế Case Report Form (CRF) cho một RCT.
Nghiên cứu:
- Title: [VD: So sánh 2 thuốc hạ đường huyết ở BN ĐTĐ type 2]
- Thiết kế: RCT 2 nhánh, phân ngẫu nhiên 1:1
- Đối tượng: [BN ĐTĐ type 2, HbA1c 7-10%]
- Cỡ mẫu: 200 (100 mỗi nhóm)
- Outcome chính: HbA1c sau 12 tuần
- Outcome phụ: HA, cân nặng, chất lượng cuộc sống, tác dụng phụ
- Visit schedule: Screening, Baseline, Week 4, Week 8, Week 12
Hãy thiết kế CRF đầy đủ gồm:
PHẦN A - SCREENING:
- Inclusion/exclusion criteria checklist
- Demographics
- Medical history
- Physical exam
- Lab tests at screening
PHẦN B - BASELINE (Visit 1):
- Confirmation of eligibility
- Randomization
- Baseline measurements
- Drug dispensing
PHẦN C - FOLLOW-UP VISITS (Week 4, 8, 12):
- Vital signs
- Outcomes
- Adverse events
- Compliance check
- Drug refill
PHẦN D - END OF STUDY:
- Final outcomes
- Reason for completion/discontinuation
- AE summary
Yêu cầu:
- Mỗi phần có rõ field bắt buộc / tùy chọn
- Định dạng phù hợp REDCap hoặc Google Forms
- Tiếng Việt + tiếng Anh (tên biến English, hỏi tiếng Việt)
- Comments tiếng Việt giải thích cho người thu thập
Prompt 4: Validate questionnaire bằng pilot
Tôi đã pilot questionnaire với 10 người và có các phản hồi:
[paste feedback]
Hãy giúp tôi:
1. Tổng hợp các vấn đề chính từ feedback
2. Xác định câu nào cần sửa
3. Đề xuất phiên bản sửa
4. Cảnh báo nếu cần làm pilot thêm
Trình bày: Câu gốc | Vấn đề | Câu sửa
4.3. ⚠️ 4 cảnh báo khi dùng AI tạo questionnaire
Cảnh báo 1: AI có thể "tạo lại" tool đã có bản quyền
AI có thể tạo ra câu hỏi giống SF-36 hoặc PHQ-9 — nhưng đây có thể vi phạm bản quyền và không có tính validity của bản gốc.
Phòng tránh: Khi cần dùng tool có sẵn (PHQ-9, SF-36), hãy lấy bản chính thức tiếng Việt từ tổ chức phát hành — đừng để AI "viết lại".
Cảnh báo 2: AI đôi khi viết quá "Tây"
AI có thể tạo câu hỏi như: "Trong tuần qua, bạn có cảm thấy 'down' hay không?" — câu này nghe rất Mỹ, không tự nhiên với người Việt Nam.
Phòng tránh: Trong prompt, nhấn mạnh: "Phù hợp văn hóa Việt Nam, ngôn ngữ tự nhiên người Việt."
Cảnh báo 3: AI bỏ qua tính tế nhị văn hóa
Câu hỏi về thu nhập, tình dục, tôn giáo cần được phrasing tế nhị tại VN.
Phòng tránh: Yêu cầu AI: "Sắp xếp các câu nhạy cảm về thu nhập/cá nhân ở phần cuối, dùng ngôn ngữ tế nhị."
Cảnh báo 4: AI có thể quên consent và disclosure
Phần đầu questionnaire phải có thông báo về mục đích, bảo mật, đồng ý tham gia — AI có thể bỏ sót.
Phòng tránh: Yêu cầu rõ trong prompt: "Bao gồm consent statement đầu phiếu."
4.4. PILOT TEST — bước KHÔNG THỂ bỏ qua
Quy tắc vàng: "Không có questionnaire nào hoàn hảo từ lần đầu — kể cả khi do AI tạo."
Quy trình pilot:
| Bước | Số người | Mục đích |
|---|---|---|
| Cognitive interview | 3-5 | Kiểm tra hiểu câu hỏi không (think-aloud) |
| Pilot test | 10-30 | Kiểm tra thời gian điền, lỗi logic |
| Pilot dữ liệu | 30-50 | Kiểm tra reliability (Cronbach's α) |
Câu hỏi cho pilot:
- Bạn có hiểu mọi câu hỏi không?
- Có câu nào khó trả lời? Vì sao?
- Có câu nào trùng ý không?
- Mất bao lâu để điền xong?
- Có muốn thêm/bớt câu nào không?
✅ CHECKPOINT 4
Bạn vừa dùng ChatGPT tạo bộ 20 câu hỏi về chất lượng cuộc sống bệnh nhân ung thư. ChatGPT trả về kết quả rất "đẹp", có vẻ chuyên nghiệp.
Bạn nên làm gì TIẾP THEO trước khi dùng cho 200 bệnh nhân?
a) Dùng ngay vì AI rất giỏi, tiết kiệm thời gian
b) Pilot với 10 người trước, thu phản hồi và sửa
c) So sánh với tool đã validate (như EORTC QLQ-C30) — nếu giống, dùng tool đã validate thay thế
d) Cả b và c
Đáp án ở cuối bài.
📋 PHẦN 5: ELECTRONIC DATA CAPTURE (EDC) — CHỌN CÔNG CỤ NÀO?
5.1. So sánh các công cụ phổ biến
| Công cụ | Giá | Ưu điểm | Nhược điểm | Phù hợp với |
|---|---|---|---|---|
| Google Forms | Miễn phí | Dễ dùng, tiếng Việt, mọi người biết | Tính năng cơ bản, không có validation phức tạp | Khảo sát đơn giản, < 200 BN |
| Microsoft Forms | Miễn phí (Office 365) | Tích hợp Excel | Tương tự Google Forms | BV có Office 365 |
| KoboToolbox | Miễn phí | Hoạt động OFFLINE, GPS, multimedia | Phức tạp hơn Google Forms | Nghiên cứu thực địa, nông thôn |
| REDCap | Miễn phí (cần subscription tổ chức) | Vàng tiêu chuẩn cho clinical research, audit trail | Cần được trường ĐH/BV cấp, phức tạp ban đầu | Clinical trials, RCT |
| OpenClinica | Miễn phí (open source) | Đầy đủ tính năng EDC | Cần IT support | RCT lớn |
| Castor EDC | Trả phí | UI đẹp, dễ dùng | Đắt | Nghiên cứu có funding |
5.2. Khi nào dùng cái nào?
┌────────────────────────────────────────────────────┐
│ Nghiên cứu mô tả/khảo sát đơn giản │
│ → Google Forms (đơn giản, đủ dùng) │
├────────────────────────────────────────────────────┤
│ Nghiên cứu thực địa (cộng đồng, miền núi) │
│ → KoboToolbox (hoạt động offline) │
├────────────────────────────────────────────────────┤
│ Clinical trial (RCT, observational lớn) │
│ → REDCap (nếu có) hoặc OpenClinica │
├────────────────────────────────────────────────────┤
│ Multi-center collaboration │
│ → REDCap (chuẩn quốc tế) │
└────────────────────────────────────────────────────┘
💡 Khuyến nghị cho học viên VN: Bắt đầu với Google Forms — đủ cho 80% nghiên cứu của BV. Nâng cấp lên REDCap khi nghiên cứu phức tạp hơn.
5.3. Tính năng QUAN TRỌNG cần có
Dù dùng công cụ nào, hãy đảm bảo có:
| Tính năng | Tại sao quan trọng |
|---|---|
| Required fields | Tránh missing data |
| Validation rules | Tránh nhập sai (VD: tuổi 0-120) |
| Skip logic | Câu hỏi tiếp theo phụ thuộc câu trước |
| Multi-language | Cho BN khác ngôn ngữ |
| Export to Excel/CSV | Để phân tích |
| Audit trail | Ai sửa gì, khi nào (cho RCT) |
| Mobile-friendly | BN dùng điện thoại điền được |
5.4. So sánh nhanh: Paper vs Google Forms
| Tiêu chí | Paper | Google Forms |
|---|---|---|
| Setup ban đầu | 30 phút (in) | 15 phút (tạo form) |
| BN trải nghiệm | Quen thuộc, chữ viết tay | Cần biết dùng smartphone |
| Missing data | 10-25% | 0% (nếu set required) |
| Transcription error | 5-15% | 0% (auto Excel) |
| Thời gian xử lý sau thu thập | 10-50 giờ (nhập liệu) | 0 giờ |
| Chi phí | Giấy + in + nhập liệu | 0 đ |
| Phù hợp BN > 70 tuổi | ✅ Tốt | ⚠️ Cần hỗ trợ |
| Phù hợp BN ICU/cấp cứu | ⚠️ Có thể | ✅ Trên iPad |
| Audit trail | Không có | Có |
| Bảo mật dữ liệu | Vấn đề (giấy thất lạc) | Tốt (mã hóa) |
✅ CHECKPOINT 5
Bạn nghiên cứu khảo sát kiến thức HIV ở 200 phụ nữ vùng cao Hà Giang (nhiều người không có smartphone, thu thập tại nhà).
Bạn dùng công cụ nào?
a) Google Forms — đơn giản nhất
b) Paper-based — vì BN không có smartphone
c) KoboToolbox — hoạt động offline trên tablet, người phỏng vấn dùng
d) REDCap — vì là chuẩn quốc tế
Đáp án ở cuối bài.
💻 PHẦN 6: THỰC HÀNH (50 phút)
6.1. Chuẩn bị (5 phút)
- [ ] Mở ChatGPT (hoặc Claude)
- [ ] Đăng nhập Google account để dùng Google Forms
- [ ] Có sẵn smartphone hoặc 2 thiết bị để test
6.2. Thực hành 1: Tạo Questionnaire với AI (15 phút)
Tình huống: Bạn nghiên cứu chất lượng cuộc sống của bệnh nhân sau đột quỵ tại BV của bạn. Cần tạo bộ câu hỏi 15-20 câu.
Bước 1 (3 phút): Trước khi viết prompt, hãy kiểm tra:
"Có thang đo nào đã validate cho QoL ở BN sau đột quỵ chưa?"
Thử search:
- "Stroke specific quality of life Vietnamese"
- "SS-QOL Vietnamese validation"
Câu hỏi: Tìm thấy gì? Có nên dùng tool đã có thay vì tự tạo?
Bước 2 (5 phút): Giả sử không tìm được tool phù hợp — sao chép Prompt 1 ở Phần 4.2, điền:
- Đối tượng: BN sau đột quỵ, 50-80 tuổi tại BV bạn
- Domains: Physical, Mental, Social, Environment
Bước 3 (5 phút): Đánh giá kết quả AI:
- Có câu nào "double-barreled" không?
- Có câu nào dùng thuật ngữ khó không?
- Likert scale nhất quán không?
- Có phần consent ở đầu không?
Bước 4 (2 phút): Yêu cầu AI sửa các vấn đề bạn phát hiện:
Trong bộ câu hỏi trên, tôi thấy các vấn đề: [liệt kê]
Hãy sửa và đưa phiên bản v2.
📋 Sản phẩm: Bộ câu hỏi v2 đã được tinh chỉnh.
6.3. Thực hành 2: AI làm "reviewer khắt khe" (10 phút)
Mục tiêu: Học cách dùng AI như một "reviewer ảo" trước khi pilot.
Bước 1 (3 phút): Lấy bộ câu hỏi v2 từ Thực hành 1.
Bước 2 (5 phút): Sao chép Prompt 2 ở Phần 4.2 — yêu cầu AI đóng vai reviewer khắt khe.
Bước 3 (2 phút): Đọc kết quả:
- AI tìm thêm vấn đề gì so với bạn tự đánh giá?
- Có gợi ý nào quan trọng không?
💡 Mẹo: Đôi khi AI tìm ra lỗi mà chính bạn đã viết — vì khi viết, ta "bị mù" với chính câu của mình.
6.4. Thực hành 3: Tạo Google Form (15 phút)
Mục tiêu: Convert questionnaire AI tạo sang công cụ thực sự dùng được.
Bước 1 (5 phút): Tạo Google Form mới
- Vào https://forms.google.com → Blank form
- Tiêu đề: "Nghiên cứu chất lượng cuộc sống sau đột quỵ"
- Mô tả: phần consent (lấy từ AI)
Bước 2 (8 phút): Nhập câu hỏi từ AI vào Google Forms
- Câu hỏi có Likert: dùng "Linear scale" (1-5)
- Demographics: dùng "Multiple choice" hoặc "Short answer"
- Câu mở: dùng "Paragraph"
- Đánh dấu Required cho câu bắt buộc
Bước 3 (2 phút): Settings quan trọng:
- ✅ Limit to 1 response (để tránh trả lời trùng)
- ✅ Show progress bar
- ✅ Shuffle question order (nếu phù hợp)
- ✅ Confirmation message: "Cảm ơn bạn đã tham gia"
📋 Sản phẩm: URL của Google Form hoạt động được.
6.5. Thực hành 4: Pilot test với partner (10 phút)
Mục tiêu: Thử nghiệm form thực sự với người thật.
Bước 1 (5 phút):
- Chia cặp với bạn cùng lớp
- Gửi link Google Form cho bạn
- Bạn điền form trên smartphone của họ
- Time it!
Bước 2 (5 phút): Hỏi phản hồi:
- Bạn mất bao lâu để điền?
- Có câu nào khó hiểu không?
- Câu nào khó trả lời nhất?
- Có muốn thêm/bớt câu gì?
- Trải nghiệm trên điện thoại có tốt không?
💡 Lưu ý: Đây là mini-pilot — không thay thế pilot thực sự (10-30 người) nhưng giúp bạn hiểu quy trình.
📋 PHẦN 7: CHECKLIST KIẾN THỨC SAU BÀI HỌC
Kiến thức cốt lõi
- [ ] Phân biệt được structured/semi-structured/unstructured data
- [ ] Biết các thang đo đã validate phổ biến (SF-36, PHQ-9, GAD-7...)
- [ ] Hiểu 7 nguyên tắc thiết kế questionnaire tốt
- [ ] Biết cấu trúc chuẩn của một questionnaire/CRF
- [ ] Hiểu ưu/nhược điểm của các công cụ EDC
Kỹ năng thực hành
- [ ] Đã viết được prompt hiệu quả cho AI tạo questionnaire
- [ ] Đã đánh giá được questionnaire (face validity)
- [ ] Đã tạo được Google Form hoạt động được trên điện thoại
- [ ] Đã pilot test với ít nhất 1 người
- [ ] Biết khi nào dùng công cụ EDC nào
Thái độ
- [ ] Ưu tiên dùng tool đã validate hơn tự tạo
- [ ] Luôn pilot test trước khi triển khai chính thức
- [ ] Coi questionnaire xấu = "rễ cây mục" của nghiên cứu
- [ ] Cẩn trọng với câu hỏi nhạy cảm (vị trí, phrasing)
📖 PHẦN 8: CÂU HỎI THẢO LUẬN
Câu hỏi cá nhân:
- Trong nghiên cứu của bạn, có thang đo đã validate phù hợp không? Nếu có, bạn dùng cái nào?
- BV của bạn có dùng REDCap không? Nếu không, vì sao?
- Bệnh nhân của bạn có dễ dùng smartphone không? Tỷ lệ bao nhiêu?
Câu hỏi nhóm:
- Tại VN, cản trở lớn nhất khi chuyển từ paper sang digital là gì? (Gợi ý: hạ tầng, văn hóa, đào tạo, kinh phí)
- Khi BN không có smartphone, làm sao thu thập digital? Ai điền form thay?
- Câu hỏi nhạy cảm tại VN nên tránh hay nên hỏi tế nhị? Ví dụ: thu nhập, tình dục, tôn giáo
Câu hỏi phản biện:
- Dùng AI tạo questionnaire có ảnh hưởng đến tính độc đáo của nghiên cứu không?
- Nếu AI tạo ra questionnaire giống PHQ-9 (do đã học từ data internet), việc dùng nó có vi phạm bản quyền không?
- Khi BV thiếu kinh phí, nên đầu tư vào EDC hay vào việc khác? Cost-benefit phân tích thế nào?
📚 TÀI LIỆU THAM KHẢO BÀI 9
Sách giáo khoa
- Streiner, D. L., Norman, G. R., & Cairney, J. (2015). Health Measurement Scales: A practical guide to their development and use (5th ed.). Oxford University Press.
- Fowler, F. J. (2014). Survey Research Methods (5th ed.). SAGE Publications.
- Đại học Y Hà Nội. (2020). Phương pháp NCKH Y học — Chương: Công cụ thu thập dữ liệu.
Bài báo khoa học chính
- Boateng, G. O., et al. (2018). Best practices for developing and validating scales for health, social, and behavioral research: A primer. Frontiers in Public Health, 6, 149.
- Harris, P. A., et al. (2009). Research electronic data capture (REDCap)—A metadata-driven methodology and workflow process for providing translational research informatics support. Journal of Biomedical Informatics, 42(2), 377-381. (Bài kinh điển về REDCap)
- Eysenbach, G. (2004). Improving the quality of Web surveys: the Checklist for Reporting Results of Internet E-Surveys (CHERRIES). JMIR, 6(3), e34.
Hướng dẫn quốc tế
- WHO. (2017). Data Quality Assurance: Module 1 — Framework and metrics.
- CONSORT 2025 — yêu cầu báo cáo phương pháp thu thập dữ liệu
Công cụ và phần mềm
- Google Forms: https://forms.google.com
- REDCap: https://www.project-redcap.org
- KoboToolbox: https://www.kobotoolbox.org
- OpenClinica: https://www.openclinica.com
- Castor EDC: https://www.castoredc.com
Validated Vietnamese Questionnaires
- SF-36 Vietnamese: Ngo-Metzger Q et al. (2008)
- EQ-5D-5L Vietnamese: Mai VQ et al. (2020)
- PHQ-9 Vietnamese: validated nhiều bài
- PSS-10 Vietnamese: Dao-Tran TH et al. (2017)
Khóa học online
- Coursera — "Survey Data Collection and Analytics" (University of Maryland)
- REDCap official tutorials: https://projectredcap.org/resources/videos
- KoboToolbox tutorials: https://help.kobotoolbox.org
Bối cảnh Việt Nam
- Bộ Y tế. (2023). Hướng dẫn quản lý dữ liệu nghiên cứu y tế.
- Hội Y học Dự phòng VN — Tài liệu về digital data collection.
✅ ĐÁP ÁN CÁC CHECKPOINT
Checkpoint 1:
3 hậu quả của paper-based:
- Missing data 10-25% — Nhiều ô trống, BN bỏ qua câu khó, chữ viết không đọc được. Phân tích thống kê bị ảnh hưởng nghiêm trọng.
- Transcription errors 5-15% — Khi nhân viên nhập từ giấy vào Excel, sai sót là không tránh khỏi (đọc sai số, đánh máy nhầm). Một sai số 8% trong dữ liệu = nghiên cứu không đáng tin.
- Thời gian + chi phí ẩn lớn — Paper trông "rẻ" ban đầu nhưng tốn 200+ giờ nhập liệu, in giấy, lưu trữ. Tổng chi phí thường CAO HƠN Google Forms (miễn phí) hoặc KoboToolbox.
Còn các hậu quả khác:
- Phiếu thất lạc → mất data vĩnh viễn
- Không có audit trail → không biết ai sửa gì
- Bảo mật kém → giấy có thể bị thấy/copy
- Không có validation real-time → BN có thể nhập "tuổi = 200" mà không ai phát hiện cho đến khi nhập liệu xong
Checkpoint 2:
- Semi-structured (Likert/numeric scale 1-10)
- Unstructured (open-ended free text)
- Structured (lab value, số cụ thể)
- Unstructured (interview transcript, free narrative)
Checkpoint 3:
Câu hỏi: "Bạn có thường xuyên không tuân thủ điều trị thuốc và tập thể dục đều đặn không?"
Lỗi 1: Double-barreled — Hỏi 2 thứ cùng lúc (tuân thủ thuốc VÀ tập thể dục). Nếu BN tuân thủ thuốc nhưng không tập thể dục, họ trả lời thế nào?
Lỗi 2: Phủ định kép — "không tuân thủ" + "không" — gây khó hiểu, BN dễ nhầm lẫn.
Sửa: Tách thành 2 câu, dùng từ khẳng định:
- "Trong 7 ngày qua, bạn có uống thuốc đúng theo chỉ định bác sĩ không? (Có/Không/Một phần)"
- "Trong 7 ngày qua, bạn có tập thể dục không? (Có/Không/Đôi khi)"
Checkpoint 4:
Đáp án đúng: d) Cả b và c
Lý do:
- (a) sai — không bao giờ dùng questionnaire mà chưa pilot, kể cả khi do AI/chuyên gia tạo
- (b) đúng — pilot là bắt buộc
- (c) đúng — nếu AI tạo ra cái gì đó giống tool đã validated, hãy dùng tool validated thay thế. EORTC QLQ-C30 là thang đo chuẩn vàng cho QoL ung thư đã có bản tiếng Việt
- (d) đúng nhất — kết hợp cả hai
Quy trình đúng:
- Search tool đã validate trước → nếu có, dùng tool đó (hoặc adapt)
- Nếu không có, dùng AI tạo draft
- Pilot 10-30 người
- Sửa và validate (Cronbach's α)
- Mới dùng cho nghiên cứu chính
Checkpoint 5:
Đáp án đúng: c) KoboToolbox
Lý do:
- (a) sai — Google Forms cần internet liên tục, vùng cao có thể không có
- (b) sai — paper sẽ có 15-25% lỗi như đã thảo luận
- (c) đúng — KoboToolbox cho phép người phỏng vấn dùng tablet đi đến nhà BN, làm việc OFFLINE, sau đó sync khi có internet. Đây là tool chuẩn cho field research
- (d) sai — REDCap cần internet và phức tạp, không phù hợp field research vùng cao
Lưu ý quan trọng: BN không cần có smartphone — người phỏng vấn (RA - Research Assistant) dùng tablet để hỏi và nhập liệu.
🎓 KẾT LUẬN BÀI 9
Chúc mừng bạn đã hoàn thành Bài 9 — bài học về kỹ năng "ít hào nhoáng nhưng quyết định". Hãy nhớ ba thông điệp cốt lõi:
💡 Thông điệp 1: Questionnaire là rễ cây của nghiên cứu. Rễ mục thì cây không thể sống. Một câu hỏi sai (double-barreled, leading) sẽ làm sai lệch tất cả phân tích sau đó. Đầu tư thời gian cho khâu này — không bao giờ là phí.
💡 Thông điệp 2: Ưu tiên dùng tool đã validate. SF-36, PHQ-9, GAD-7... đã có bản tiếng Việt — đừng phí công tự tạo. Tool đã validated giúp bạn so sánh kết quả với thế giới và được reviewer chấp nhận dễ hơn nhiều.
💡 Thông điệp 3: Chuyển từ paper sang digital là xu hướng không thể đảo ngược. Google Forms miễn phí và đủ cho 80% nghiên cứu của BV. KoboToolbox cho field research. REDCap cho clinical trials. Đầu tư học một công cụ — sẽ dùng cả sự nghiệp.
Chuẩn bị cho Bài 10
Bài tiếp theo: "Quản lý và Làm sạch Dữ liệu" — sau khi thu thập xong, làm gì với data raw?
Trước khi đến Bài 10, hãy:
- [ ] Hoàn thiện Google Form cho nghiên cứu của bạn
- [ ] Pilot test với ít nhất 5 người (đồng nghiệp, gia đình)
- [ ] Sửa form dựa trên phản hồi pilot
- [ ] Export thử dữ liệu sang Excel để xem format
- [ ] Suy nghĩ: dữ liệu của bạn sẽ có loại lỗi gì? (cho Bài 10)
Soạn giả: Jack
Phiên bản: 1.0 (2026)
Liên hệ: thaihoadoanbrvt@gmail
Phản hồi: Mọi góp ý xin gửi về mail
"If you torture the data long enough, it will confess to anything."
— Ronald Coase (Nobel Economics)("Tra tấn dữ liệu đủ lâu, nó sẽ thú nhận bất cứ điều gì.")
Đó là lý do bạn phải THU THẬP đúng từ đầu — vì sau đó không sửa lại được.
- Đăng nhập để gửi ý kiến