Bài 9: Thu thập dữ liệu với công nghệ | Quản lý chất lượng bệnh viện

Website CLBV.VN và các nền tảng trong hệ sinh thái QuanTriBenhVien.Vn được xây dựng bởi các thành viên có kinh nghiệm tại các bệnh viện, công ty. Web không có liên quan tới bất kỳ Vụ, Cục nào của BYT hay SYT --> chi tiết

Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập hoặc tài khoản đã hết hạn. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "CLBV Members" các nội dung bạn quan tâm.

Kính gửi Anh/Chị/Em đồng nghiệp,

Trong thời gian qua, CLBV nhận được sự ủng hộ rất lớn từ cộng đồng. Website đã nằm trong nhóm đầu kết quả tìm kiếm với nhiều từ khóa liên quan đến Quản lý chất lượng (QLCL) và An toàn người bệnh (ATNB) trong lĩnh vực y tế.

Tuy nhiên, khi lượng truy cập ngày càng tăng, Công ty M.I.U nhận thấy một số vấn đề cần được điều chỉnh để đảm bảo phù hợp với đặc thù chuyên môn:

1. Nội dung QLCL & ATNB có tính chuyên ngành cao

Nhiều nội dung mang tính học tập từ sự cố, cải tiến sau sai sót.
Nếu tiếp cận ngoài bối cảnh chuyên môn, có thể bị hiểu chưa đầy đủ hoặc sai lệch.

2. Một số tài liệu quản trị cần được sử dụng đúng đối tượng

Dù là văn bản công khai, việc áp dụng hiệu quả đòi hỏi hiểu đúng bối cảnh ngành.
Phù hợp hơn khi chia sẻ trong cộng đồng những người trực tiếp làm công tác y tế.

3. Hạn chế nguy cơ nhầm lẫn về nhận diện

Tên miền clbv.vn có thể gây hiểu nhầm với các hệ thống chính thức của Bộ Y tế.
Việc làm rõ và chuẩn hóa nhận diện là cần thiết.

Công ty M.I.U quyết định nâng cấp hệ thống phục vụ đúng đối tượng chuyên môn

Để đảm bảo chất lượng nội dung và phục vụ tốt hơn cho cộng đồng, chúng tôi thực hiện các điều chỉnh:

Giới hạn truy cập nội dung: Website dành cho thành viên đã đăng ký, là các đồng nghiệp đang công tác trong lĩnh vực y tế.
Chuyển đổi nhận diện sang tên miền mới: QLCL.NET để đồng bộ thương hiệu với các trang trong hệ sinh thái QuanTriBenhVien.Vn như KHTH.VN; CNTT.IT; KSNK.VN; VTTB.VN; HCQT.VN ... hướng đến chia sẻ kiến thức quản trị hiện đại, liên ngành trong bệnh viện không chỉ giới hạn ở QLCL & ATNB.

Chúng tôi tin rằng đây là bước điều chỉnh cần thiết nhằm:

Bảo vệ giá trị chuyên môn của nội dung.
Đảm bảo thông tin được sử dụng đúng đối tượng, đúng bối cảnh.
Xây dựng cộng đồng chia sẻ chất lượng, hiệu quả.

Rất mong tiếp tục nhận được sự đồng hành của Anh/Chị/Em đồng nghiệp.

Công ty M.I.U

🎯 MỤC TIÊU

Về kiến thức (Knowledge):

Phân biệt được 3 loại dữ liệu: structured, semi-structured, unstructured
Mô tả được ưu/nhược điểm của paper-based vs Electronic Data Capture (EDC)
Hiểu được cấu trúc của một Case Report Form (CRF) chuẩn
Nhận biết được các nguyên tắc thiết kế questionnaire tốt (Likert scales, validated tools)

Về kỹ năng (Skills): 5. Sử dụng được AI để tạo bộ câu hỏi (questionnaire) bằng tiếng Việt 6. Thiết kế được CRF cơ bản cho RCT đơn giản 7. Tạo được Google Form thu thập dữ liệu hoạt động được trên điện thoại 8. Đánh giá được questionnaire AI tạo ra trước khi sử dụng (face validity, content validity)

Về thái độ (Attitude): 9. Ưu tiên dùng questionnaire đã được validate (SF-36, EQ-5D) thay vì tự tạo mới khi có thể 10. Cẩn trọng với chất lượng câu hỏi — coi questionnaire xấu là "rễ cây mục" của nghiên cứu

📚 PHẦN 1: TẠI SAO KHÂU THU THẬP DỮ LIỆU LẠI QUAN TRỌNG?

1.1. Một câu chuyện về 2 phương pháp thu thập

Tình huống: Hai nhóm nghiên cứu cùng nghiên cứu chất lượng cuộc sống bệnh nhân ung thư tại 2 bệnh viện tỉnh.
Nhóm A dùng phiếu giấy: Phát phiếu, BN tự điền, điều dưỡng nhập lại vào Excel sau giờ làm. Sau 6 tháng: 500 phiếu, 15% phiếu lỗi (BN bỏ trống, đánh dấu sai, không đọc được chữ), nhập sai 8%, mất 200 giờ nhập liệu.
Nhóm B dùng Google Forms trên iPad: BN điền tại phòng khám với hỗ trợ của điều dưỡng, dữ liệu vào Excel tự động. Sau 6 tháng: 480 phiếu, <2% lỗi, không cần nhập lại.

Kết quả:

Nhóm A: bài báo bị reject vì "data quality issues"
Nhóm B: bài báo được đăng tạp chí Q2

💡 Bài học: Cùng câu hỏi nghiên cứu, cùng cỡ mẫu — nhưng cách thu thập quyết định chất lượng cuối cùng.

1.2. Thực trạng thu thập dữ liệu tại Việt Nam

Theo các khảo sát gần đây tại các BV Việt Nam:

┌────────────────────────────────────────────────────┐
│  Phương pháp thu thập   │  Tỷ lệ sử dụng  (~2024)  │
├────────────────────────────────────────────────────┤
│  Paper-based            │  ~70%                    │
│  Excel sau khi nhập     │  ~20%                    │
│  Google Forms/Survey    │  ~8%                     │
│  REDCap/EDC chuyên dụng │  ~2%                     │
└────────────────────────────────────────────────────┘

Xu hướng: Chuyển từ paper → digital đang diễn ra nhanh, nhưng đa số BV vẫn paper-based.

Vấn đề của paper-based:

Vấn đề	Tỷ lệ
Missing data (ô trống)	10-25%
Transcription errors (nhập sai)	5-15%
Phiếu thất lạc	2-5%
Chữ viết không đọc được	5-10%
Mất thời gian nhập liệu	Lớn (gấp 2-3 lần thu thập)

💡 Đây là lý do chuyển sang digital + dùng AI mang lại lợi ích lớn nhất ở khâu này.

1.3. AI có thể giúp gì ở khâu thu thập dữ liệu?

Tác vụ	AI giỏi?	Lợi ích
Tạo câu hỏi survey	⭐⭐⭐⭐⭐	Tiết kiệm 70-80% thời gian draft
Dịch questionnaire (Anh→Việt)	⭐⭐⭐⭐	Tốt nhưng cần chuyên gia review
Tạo CRF cho RCT	⭐⭐⭐⭐	Cấu trúc chuẩn, đầy đủ phần
Validate câu hỏi (logic, clarity)	⭐⭐⭐⭐	"Reviewer ảo" trước khi pilot
Trích xuất dữ liệu từ bệnh án	⭐⭐⭐	Có ích nhưng cần verify
Tự động phân tích open-ended	⭐⭐⭐⭐	Code thematic analysis

✅ CHECKPOINT 1: Tự kiểm tra kiến thức

Một bác sĩ nói: "Tôi sẽ thu thập dữ liệu trên giấy như mọi người vẫn làm — đỡ phức tạp hơn."

Câu nói này có vấn đề gì? Liệt kê 3 hậu quả có thể xảy ra.

Đáp án ở cuối bài.

🔬 PHẦN 2: PHÂN LOẠI DỮ LIỆU — BIẾT TRƯỚC KHI THIẾT KẾ

2.1. Ba loại dữ liệu trong nghiên cứu y khoa

┌─────────────────────────────────────────────────────┐
│  STRUCTURED (Có cấu trúc)                           │
│  - Demographics (tuổi, giới)                        │
│  - Lab values (HbA1c, creatinine)                   │
│  - Vital signs (HA, mạch)                           │
│  → Dễ phân tích nhất                                │
├─────────────────────────────────────────────────────┤
│  SEMI-STRUCTURED (Bán cấu trúc)                     │
│  - Questionnaires với Likert scale                  │
│  - Câu hỏi đóng + 1 câu hỏi mở cuối                 │
│  - Checklist with comments                          │
│  → Phân tích định lượng + định tính                 │
├─────────────────────────────────────────────────────┤
│  UNSTRUCTURED (Không cấu trúc)                      │
│  - Bệnh án viết tay                                 │
│  - Phỏng vấn sâu (interview)                        │
│  - Free-text comments                               │
│  → Khó phân tích nhất, cần NLP/coding              │
└─────────────────────────────────────────────────────┘

2.2. Khi nào dùng loại nào?

Loại nghiên cứu	Loại dữ liệu chính
RCT đo HbA1c	Structured (số liệu lab)
Khảo sát chất lượng cuộc sống	Semi-structured (questionnaire)
Nghiên cứu định tính trải nghiệm bệnh nhân	Unstructured (interview transcripts)
Mixed-methods study	Cả 3 loại

💡 Mẹo: Trong proposal, hãy nêu rõ loại dữ liệu của bạn. Reviewer sẽ đánh giá phương pháp thu thập có phù hợp không.

✅ CHECKPOINT 2: Phân loại

Cho 4 biến trong nghiên cứu, phân loại structured/semi-structured/unstructured:

Câu hỏi: "Xếp mức độ đau của bạn từ 1-10"
Câu hỏi: "Hãy mô tả cảm xúc của bạn khi nhận chẩn đoán ung thư"
Kết quả xét nghiệm HbA1c
Phỏng vấn 30 phút với bệnh nhân về trải nghiệm điều trị

Đáp án ở cuối bài.

🎯 PHẦN 3: NGUYÊN TẮC THIẾT KẾ QUESTIONNAIRE TỐT

3.1. Nguyên tắc số 1: ƯU TIÊN dùng tool đã validate

Đây là nguyên tắc quan trọng nhất.

Trước khi nghĩ đến tự tạo questionnaire, hãy kiểm tra: "Có thang đo nào đã được validate cho biến này chưa?"

Các thang đo phổ biến đã có bản tiếng Việt validated:

Lĩnh vực	Thang đo	Số câu	Tình trạng VN
Chất lượng cuộc sống	SF-36	36	✅ Đã validate
Chất lượng cuộc sống	EQ-5D-5L	5	✅ Đã validate
Stress	PSS-10 (Perceived Stress Scale)	10	✅ Đã validate
Trầm cảm	PHQ-9	9	✅ Đã validate
Lo âu	GAD-7	7	✅ Đã validate
Burnout	MBI-22 (Maslach)	22	✅ Có
Đau	VAS (Visual Analog)	1	✅ Phổ biến
Đau	Brief Pain Inventory	9	✅ Có
Tuân thủ thuốc	Morisky-8	8	✅ Đã validate
Giấc ngủ	PSQI (Pittsburgh)	19	✅ Đã validate

💡 Lý do: Thang đo đã validate có:
Độ tin cậy (reliability) đã được kiểm chứng
Tính giá trị (validity) đã được xác lập
Có thể so sánh kết quả với nghiên cứu khác
Reviewer chấp nhận dễ hơn

⚠️ Cảnh báo: Tự dịch tool tiếng Anh sang tiếng Việt KHÔNG được phép — phải dùng bản đã được forward-backward translation và validation.

3.2. Khi PHẢI tự tạo questionnaire — 7 nguyên tắc vàng

Nếu thực sự không có tool validated phù hợp, hãy tuân thủ:

1. Một câu — một ý

❌ "Bạn có hài lòng với chất lượng và tốc độ phục vụ của bệnh viện không?"
(Đây là 2 câu hỏi gộp — gọi là "double-barreled question")

✅ "Bạn có hài lòng với chất lượng phục vụ của bệnh viện không?"
✅ "Bạn có hài lòng với tốc độ phục vụ của bệnh viện không?"

2. Tránh câu hỏi dẫn dắt (leading questions)

❌ "Phương pháp điều trị mới hiệu quả hơn, đúng không?"

✅ "Bạn đánh giá phương pháp điều trị mới như thế nào so với phương pháp cũ?"

3. Ngôn ngữ đơn giản, không dùng thuật ngữ y khoa

❌ "Bạn có triệu chứng dyspnea khi gắng sức không?"

✅ "Bạn có cảm thấy khó thở khi đi bộ hoặc lên cầu thang không?"

4. Likert scale — số lẻ hay chẵn?

5 điểm (lẻ)	4 điểm (chẵn)
Rất không đồng ý / Không đồng ý / Trung lập / Đồng ý / Rất đồng ý	Rất không đồng ý / Không đồng ý / Đồng ý / Rất đồng ý
✅ Cho phép trung lập	✅ Buộc người trả lời chọn hướng
⚠️ Có thể nhiều người chọn "trung lập" để né	⚠️ Có thể gây bias nếu thực sự không có ý kiến

💡 Khuyến nghị: Dùng 5 điểm hoặc 7 điểm — phổ biến và phù hợp với người Việt Nam.

5. Tránh câu hỏi phủ định kép

❌ "Bạn không thấy phương pháp này không hiệu quả?"

✅ "Bạn thấy phương pháp này có hiệu quả không?"

6. Dùng khoảng thời gian rõ ràng

❌ "Bạn có hay đau đầu không?"

✅ "Trong 7 ngày qua, bạn có đau đầu không? Nếu có, mấy lần?"

7. Tránh câu hỏi nhạy cảm ở đầu

Sắp xếp questionnaire:

Đầu: Câu dễ trả lời (demographics, sự kiện chung)
Giữa: Câu chính
Cuối: Câu nhạy cảm (thu nhập, tình dục, hành vi rủi ro)

3.3. Cấu trúc questionnaire chuẩn

┌─────────────────────────────────────────┐
│  PHẦN 1: GIỚI THIỆU                     │
│  - Mục đích nghiên cứu                  │
│  - Bảo mật, ẩn danh                     │
│  - Thời gian dự kiến (5/10/15 phút)     │
│  - Đồng ý tham gia (consent)            │
├─────────────────────────────────────────┤
│  PHẦN 2: THÔNG TIN NHÂN KHẨU            │
│  - Tuổi, giới, nghề nghiệp              │
│  - Trình độ học vấn                     │
├─────────────────────────────────────────┤
│  PHẦN 3: CÂU HỎI CHÍNH                  │
│  - Validated tools (SF-36, PHQ-9...)    │
│  - Câu hỏi tự tạo (nếu cần)             │
├─────────────────────────────────────────┤
│  PHẦN 4: CÂU HỎI NHẠY CẢM (nếu có)      │
│  - Thu nhập, hành vi cá nhân            │
├─────────────────────────────────────────┤
│  PHẦN 5: CÂU MỞ + CẢM ƠN                │
│  - "Bạn còn muốn chia sẻ điều gì?"      │
│  - Lời cảm ơn                           │
└─────────────────────────────────────────┘

✅ CHECKPOINT 3: Phát hiện lỗi

Đọc câu hỏi sau và phát hiện 2 lỗi:

"Bạn có thường xuyên không tuân thủ điều trị thuốc và tập thể dục đều đặn không?"

Lỗi gì? Sửa thế nào?

Đáp án ở cuối bài.

🤖 PHẦN 4: SỬ DỤNG AI ĐỂ TẠO QUESTIONNAIRE VÀ CRF

4.1. Quy trình 4 bước với AI

BƯỚC 1: Mô tả cụ thể nhu cầu (lĩnh vực, đối tượng, ngữ cảnh)
        ↓
BƯỚC 2: Yêu cầu AI tạo draft - bao gồm cả scoring
        ↓
BƯỚC 3: Đánh giá: face validity + content validity
        ↓
BƯỚC 4: Pilot test (5-10 người) → tinh chỉnh → final version

4.2. Prompt mẫu chuẩn (sao chép, dùng được ngay)

Prompt 1: Tạo Questionnaire mới

Tôi cần tạo bộ câu hỏi (questionnaire) tiếng Việt để đánh giá [chủ đề]
ở [đối tượng] tại [bối cảnh].

Bối cảnh:
- Đối tượng: [VD: bệnh nhân sau đột quỵ, 50-80 tuổi]
- Trình độ học vấn: [đa số phổ thông trung học]
- Thời gian dự kiến điền: [10 phút]
- Cách thu thập: [tự điền/phỏng vấn]

Yêu cầu nội dung:
- Số câu: 15-20 câu
- Cover các domain: [VD: Physical, Mental, Social, Environment]
- Likert scale 5 điểm
- Ngôn ngữ ĐƠN GIẢN, dễ hiểu (tránh thuật ngữ y khoa)
- Phù hợp văn hóa Việt Nam

Hãy:
1. Tạo bộ câu hỏi đầy đủ (đánh số rõ ràng)
2. Mỗi câu, ghi rõ: thuộc domain nào
3. Đề xuất scoring system (cách tính điểm)
4. Cảnh báo các câu có nguy cơ "double-barreled" hoặc "leading"
5. Đề xuất câu hỏi mở ở cuối

Trình bày dạng bảng dễ đọc.

Prompt 2: Đánh giá questionnaire có sẵn

Tôi có bộ câu hỏi sau (do tôi/đồng nghiệp viết):

[paste questionnaire]

Hãy đóng vai "reviewer khắt khe" và đánh giá:
1. Có câu nào "double-barreled" (gộp 2 ý) không?
2. Có câu nào "leading" (dẫn dắt) không?
3. Có câu nào dùng thuật ngữ khó hiểu với BN bình thường không?
4. Có câu nào trùng ý không?
5. Likert scale có nhất quán không?
6. Cấu trúc tổng thể (thứ tự câu) có hợp lý không?
7. Đề xuất câu sửa cho từng vấn đề

Trình bày kết quả dạng bảng: STT câu | Vấn đề | Đề xuất sửa

Prompt 3: Thiết kế CRF cho RCT

Tôi cần thiết kế Case Report Form (CRF) cho một RCT.

Nghiên cứu:
- Title: [VD: So sánh 2 thuốc hạ đường huyết ở BN ĐTĐ type 2]
- Thiết kế: RCT 2 nhánh, phân ngẫu nhiên 1:1
- Đối tượng: [BN ĐTĐ type 2, HbA1c 7-10%]
- Cỡ mẫu: 200 (100 mỗi nhóm)
- Outcome chính: HbA1c sau 12 tuần
- Outcome phụ: HA, cân nặng, chất lượng cuộc sống, tác dụng phụ
- Visit schedule: Screening, Baseline, Week 4, Week 8, Week 12

Hãy thiết kế CRF đầy đủ gồm:

PHẦN A - SCREENING:
- Inclusion/exclusion criteria checklist
- Demographics
- Medical history
- Physical exam
- Lab tests at screening

PHẦN B - BASELINE (Visit 1):
- Confirmation of eligibility
- Randomization
- Baseline measurements
- Drug dispensing

PHẦN C - FOLLOW-UP VISITS (Week 4, 8, 12):
- Vital signs
- Outcomes
- Adverse events
- Compliance check
- Drug refill

PHẦN D - END OF STUDY:
- Final outcomes
- Reason for completion/discontinuation
- AE summary

Yêu cầu:
- Mỗi phần có rõ field bắt buộc / tùy chọn
- Định dạng phù hợp REDCap hoặc Google Forms
- Tiếng Việt + tiếng Anh (tên biến English, hỏi tiếng Việt)
- Comments tiếng Việt giải thích cho người thu thập

Prompt 4: Validate questionnaire bằng pilot

Tôi đã pilot questionnaire với 10 người và có các phản hồi:

[paste feedback]

Hãy giúp tôi:
1. Tổng hợp các vấn đề chính từ feedback
2. Xác định câu nào cần sửa
3. Đề xuất phiên bản sửa
4. Cảnh báo nếu cần làm pilot thêm

Trình bày: Câu gốc | Vấn đề | Câu sửa

4.3. ⚠️ 4 cảnh báo khi dùng AI tạo questionnaire

Cảnh báo 1: AI có thể "tạo lại" tool đã có bản quyền

AI có thể tạo ra câu hỏi giống SF-36 hoặc PHQ-9 — nhưng đây có thể vi phạm bản quyền và không có tính validity của bản gốc.

Phòng tránh: Khi cần dùng tool có sẵn (PHQ-9, SF-36), hãy lấy bản chính thức tiếng Việt từ tổ chức phát hành — đừng để AI "viết lại".

Cảnh báo 2: AI đôi khi viết quá "Tây"

AI có thể tạo câu hỏi như: "Trong tuần qua, bạn có cảm thấy 'down' hay không?" — câu này nghe rất Mỹ, không tự nhiên với người Việt Nam.

Phòng tránh: Trong prompt, nhấn mạnh: "Phù hợp văn hóa Việt Nam, ngôn ngữ tự nhiên người Việt."

Cảnh báo 3: AI bỏ qua tính tế nhị văn hóa

Câu hỏi về thu nhập, tình dục, tôn giáo cần được phrasing tế nhị tại VN.

Phòng tránh: Yêu cầu AI: "Sắp xếp các câu nhạy cảm về thu nhập/cá nhân ở phần cuối, dùng ngôn ngữ tế nhị."

Cảnh báo 4: AI có thể quên consent và disclosure

Phần đầu questionnaire phải có thông báo về mục đích, bảo mật, đồng ý tham gia — AI có thể bỏ sót.

Phòng tránh: Yêu cầu rõ trong prompt: "Bao gồm consent statement đầu phiếu."

4.4. PILOT TEST — bước KHÔNG THỂ bỏ qua

Quy tắc vàng: "Không có questionnaire nào hoàn hảo từ lần đầu — kể cả khi do AI tạo."

Quy trình pilot:

Bước	Số người	Mục đích
Cognitive interview	3-5	Kiểm tra hiểu câu hỏi không (think-aloud)
Pilot test	10-30	Kiểm tra thời gian điền, lỗi logic
Pilot dữ liệu	30-50	Kiểm tra reliability (Cronbach's α)

Câu hỏi cho pilot:

Bạn có hiểu mọi câu hỏi không?
Có câu nào khó trả lời? Vì sao?
Có câu nào trùng ý không?
Mất bao lâu để điền xong?
Có muốn thêm/bớt câu nào không?

✅ CHECKPOINT 4

Bạn vừa dùng ChatGPT tạo bộ 20 câu hỏi về chất lượng cuộc sống bệnh nhân ung thư. ChatGPT trả về kết quả rất "đẹp", có vẻ chuyên nghiệp.

Bạn nên làm gì TIẾP THEO trước khi dùng cho 200 bệnh nhân?

a) Dùng ngay vì AI rất giỏi, tiết kiệm thời gian
b) Pilot với 10 người trước, thu phản hồi và sửa
c) So sánh với tool đã validate (như EORTC QLQ-C30) — nếu giống, dùng tool đã validate thay thế
d) Cả b và c

Đáp án ở cuối bài.

📋 PHẦN 5: ELECTRONIC DATA CAPTURE (EDC) — CHỌN CÔNG CỤ NÀO?

5.1. So sánh các công cụ phổ biến

Công cụ	Giá	Ưu điểm	Nhược điểm	Phù hợp với
Google Forms	Miễn phí	Dễ dùng, tiếng Việt, mọi người biết	Tính năng cơ bản, không có validation phức tạp	Khảo sát đơn giản, < 200 BN
Microsoft Forms	Miễn phí (Office 365)	Tích hợp Excel	Tương tự Google Forms	BV có Office 365
KoboToolbox	Miễn phí	Hoạt động OFFLINE, GPS, multimedia	Phức tạp hơn Google Forms	Nghiên cứu thực địa, nông thôn
REDCap	Miễn phí (cần subscription tổ chức)	Vàng tiêu chuẩn cho clinical research, audit trail	Cần được trường ĐH/BV cấp, phức tạp ban đầu	Clinical trials, RCT
OpenClinica	Miễn phí (open source)	Đầy đủ tính năng EDC	Cần IT support	RCT lớn
Castor EDC	Trả phí	UI đẹp, dễ dùng	Đắt	Nghiên cứu có funding

5.2. Khi nào dùng cái nào?

┌────────────────────────────────────────────────────┐
│  Nghiên cứu mô tả/khảo sát đơn giản                │
│  → Google Forms (đơn giản, đủ dùng)                │
├────────────────────────────────────────────────────┤
│  Nghiên cứu thực địa (cộng đồng, miền núi)         │
│  → KoboToolbox (hoạt động offline)                 │
├────────────────────────────────────────────────────┤
│  Clinical trial (RCT, observational lớn)           │
│  → REDCap (nếu có) hoặc OpenClinica                │
├────────────────────────────────────────────────────┤
│  Multi-center collaboration                        │
│  → REDCap (chuẩn quốc tế)                          │
└────────────────────────────────────────────────────┘

💡 Khuyến nghị cho học viên VN: Bắt đầu với Google Forms — đủ cho 80% nghiên cứu của BV. Nâng cấp lên REDCap khi nghiên cứu phức tạp hơn.

5.3. Tính năng QUAN TRỌNG cần có

Dù dùng công cụ nào, hãy đảm bảo có:

Tính năng	Tại sao quan trọng
Required fields	Tránh missing data
Validation rules	Tránh nhập sai (VD: tuổi 0-120)
Skip logic	Câu hỏi tiếp theo phụ thuộc câu trước
Multi-language	Cho BN khác ngôn ngữ
Export to Excel/CSV	Để phân tích
Audit trail	Ai sửa gì, khi nào (cho RCT)
Mobile-friendly	BN dùng điện thoại điền được

5.4. So sánh nhanh: Paper vs Google Forms

Tiêu chí	Paper	Google Forms
Setup ban đầu	30 phút (in)	15 phút (tạo form)
BN trải nghiệm	Quen thuộc, chữ viết tay	Cần biết dùng smartphone
Missing data	10-25%	0% (nếu set required)
Transcription error	5-15%	0% (auto Excel)
Thời gian xử lý sau thu thập	10-50 giờ (nhập liệu)	0 giờ
Chi phí	Giấy + in + nhập liệu	0 đ
Phù hợp BN > 70 tuổi	✅ Tốt	⚠️ Cần hỗ trợ
Phù hợp BN ICU/cấp cứu	⚠️ Có thể	✅ Trên iPad
Audit trail	Không có	Có
Bảo mật dữ liệu	Vấn đề (giấy thất lạc)	Tốt (mã hóa)

✅ CHECKPOINT 5

Bạn nghiên cứu khảo sát kiến thức HIV ở 200 phụ nữ vùng cao Hà Giang (nhiều người không có smartphone, thu thập tại nhà).

Bạn dùng công cụ nào?

a) Google Forms — đơn giản nhất
b) Paper-based — vì BN không có smartphone
c) KoboToolbox — hoạt động offline trên tablet, người phỏng vấn dùng
d) REDCap — vì là chuẩn quốc tế

Đáp án ở cuối bài.

💻 PHẦN 6: THỰC HÀNH (50 phút)

6.1. Chuẩn bị (5 phút)

[ ] Mở ChatGPT (hoặc Claude)
[ ] Đăng nhập Google account để dùng Google Forms
[ ] Có sẵn smartphone hoặc 2 thiết bị để test

6.2. Thực hành 1: Tạo Questionnaire với AI (15 phút)

Tình huống: Bạn nghiên cứu chất lượng cuộc sống của bệnh nhân sau đột quỵ tại BV của bạn. Cần tạo bộ câu hỏi 15-20 câu.

Bước 1 (3 phút): Trước khi viết prompt, hãy kiểm tra:

"Có thang đo nào đã validate cho QoL ở BN sau đột quỵ chưa?"

Thử search:

"Stroke specific quality of life Vietnamese"
"SS-QOL Vietnamese validation"

Câu hỏi: Tìm thấy gì? Có nên dùng tool đã có thay vì tự tạo?

Bước 2 (5 phút): Giả sử không tìm được tool phù hợp — sao chép Prompt 1 ở Phần 4.2, điền:

Đối tượng: BN sau đột quỵ, 50-80 tuổi tại BV bạn
Domains: Physical, Mental, Social, Environment

Bước 3 (5 phút): Đánh giá kết quả AI:

Có câu nào "double-barreled" không?
Có câu nào dùng thuật ngữ khó không?
Likert scale nhất quán không?
Có phần consent ở đầu không?

Bước 4 (2 phút): Yêu cầu AI sửa các vấn đề bạn phát hiện:

Trong bộ câu hỏi trên, tôi thấy các vấn đề: [liệt kê]
Hãy sửa và đưa phiên bản v2.

📋 Sản phẩm: Bộ câu hỏi v2 đã được tinh chỉnh.

6.3. Thực hành 2: AI làm "reviewer khắt khe" (10 phút)

Mục tiêu: Học cách dùng AI như một "reviewer ảo" trước khi pilot.

Bước 1 (3 phút): Lấy bộ câu hỏi v2 từ Thực hành 1.

Bước 2 (5 phút): Sao chép Prompt 2 ở Phần 4.2 — yêu cầu AI đóng vai reviewer khắt khe.

Bước 3 (2 phút): Đọc kết quả:

AI tìm thêm vấn đề gì so với bạn tự đánh giá?
Có gợi ý nào quan trọng không?

💡 Mẹo: Đôi khi AI tìm ra lỗi mà chính bạn đã viết — vì khi viết, ta "bị mù" với chính câu của mình.

6.4. Thực hành 3: Tạo Google Form (15 phút)

Mục tiêu: Convert questionnaire AI tạo sang công cụ thực sự dùng được.

Bước 1 (5 phút): Tạo Google Form mới

Vào https://forms.google.com → Blank form
Tiêu đề: "Nghiên cứu chất lượng cuộc sống sau đột quỵ"
Mô tả: phần consent (lấy từ AI)

Bước 2 (8 phút): Nhập câu hỏi từ AI vào Google Forms

Câu hỏi có Likert: dùng "Linear scale" (1-5)
Demographics: dùng "Multiple choice" hoặc "Short answer"
Câu mở: dùng "Paragraph"
Đánh dấu Required cho câu bắt buộc

Bước 3 (2 phút): Settings quan trọng:

✅ Limit to 1 response (để tránh trả lời trùng)
✅ Show progress bar
✅ Shuffle question order (nếu phù hợp)
✅ Confirmation message: "Cảm ơn bạn đã tham gia"

📋 Sản phẩm: URL của Google Form hoạt động được.

6.5. Thực hành 4: Pilot test với partner (10 phút)

Mục tiêu: Thử nghiệm form thực sự với người thật.

Bước 1 (5 phút):

Chia cặp với bạn cùng lớp
Gửi link Google Form cho bạn
Bạn điền form trên smartphone của họ
Time it!

Bước 2 (5 phút): Hỏi phản hồi:

Bạn mất bao lâu để điền?
Có câu nào khó hiểu không?
Câu nào khó trả lời nhất?
Có muốn thêm/bớt câu gì?
Trải nghiệm trên điện thoại có tốt không?

💡 Lưu ý: Đây là mini-pilot — không thay thế pilot thực sự (10-30 người) nhưng giúp bạn hiểu quy trình.

📋 PHẦN 7: CHECKLIST KIẾN THỨC SAU BÀI HỌC

Kiến thức cốt lõi

[ ] Phân biệt được structured/semi-structured/unstructured data
[ ] Biết các thang đo đã validate phổ biến (SF-36, PHQ-9, GAD-7...)
[ ] Hiểu 7 nguyên tắc thiết kế questionnaire tốt
[ ] Biết cấu trúc chuẩn của một questionnaire/CRF
[ ] Hiểu ưu/nhược điểm của các công cụ EDC

Kỹ năng thực hành

[ ] Đã viết được prompt hiệu quả cho AI tạo questionnaire
[ ] Đã đánh giá được questionnaire (face validity)
[ ] Đã tạo được Google Form hoạt động được trên điện thoại
[ ] Đã pilot test với ít nhất 1 người
[ ] Biết khi nào dùng công cụ EDC nào

Thái độ

[ ] Ưu tiên dùng tool đã validate hơn tự tạo
[ ] Luôn pilot test trước khi triển khai chính thức
[ ] Coi questionnaire xấu = "rễ cây mục" của nghiên cứu
[ ] Cẩn trọng với câu hỏi nhạy cảm (vị trí, phrasing)

📖 PHẦN 8: CÂU HỎI THẢO LUẬN

Câu hỏi cá nhân:

Trong nghiên cứu của bạn, có thang đo đã validate phù hợp không? Nếu có, bạn dùng cái nào?
BV của bạn có dùng REDCap không? Nếu không, vì sao?
Bệnh nhân của bạn có dễ dùng smartphone không? Tỷ lệ bao nhiêu?

Câu hỏi nhóm:

Tại VN, cản trở lớn nhất khi chuyển từ paper sang digital là gì? (Gợi ý: hạ tầng, văn hóa, đào tạo, kinh phí)
Khi BN không có smartphone, làm sao thu thập digital? Ai điền form thay?
Câu hỏi nhạy cảm tại VN nên tránh hay nên hỏi tế nhị? Ví dụ: thu nhập, tình dục, tôn giáo

Câu hỏi phản biện:

Dùng AI tạo questionnaire có ảnh hưởng đến tính độc đáo của nghiên cứu không?
Nếu AI tạo ra questionnaire giống PHQ-9 (do đã học từ data internet), việc dùng nó có vi phạm bản quyền không?
Khi BV thiếu kinh phí, nên đầu tư vào EDC hay vào việc khác? Cost-benefit phân tích thế nào?

📚 TÀI LIỆU THAM KHẢO BÀI 9

Sách giáo khoa

Streiner, D. L., Norman, G. R., & Cairney, J. (2015). Health Measurement Scales: A practical guide to their development and use (5th ed.). Oxford University Press.
Fowler, F. J. (2014). Survey Research Methods (5th ed.). SAGE Publications.
Đại học Y Hà Nội. (2020). Phương pháp NCKH Y học — Chương: Công cụ thu thập dữ liệu.

Bài báo khoa học chính

Boateng, G. O., et al. (2018). Best practices for developing and validating scales for health, social, and behavioral research: A primer. Frontiers in Public Health, 6, 149.
Harris, P. A., et al. (2009). Research electronic data capture (REDCap)—A metadata-driven methodology and workflow process for providing translational research informatics support. Journal of Biomedical Informatics, 42(2), 377-381. (Bài kinh điển về REDCap)
Eysenbach, G. (2004). Improving the quality of Web surveys: the Checklist for Reporting Results of Internet E-Surveys (CHERRIES). JMIR, 6(3), e34.

Hướng dẫn quốc tế

WHO. (2017). Data Quality Assurance: Module 1 — Framework and metrics.
CONSORT 2025 — yêu cầu báo cáo phương pháp thu thập dữ liệu

Công cụ và phần mềm

Google Forms: https://forms.google.com
REDCap: https://www.project-redcap.org
KoboToolbox: https://www.kobotoolbox.org
OpenClinica: https://www.openclinica.com
Castor EDC: https://www.castoredc.com

Validated Vietnamese Questionnaires

SF-36 Vietnamese: Ngo-Metzger Q et al. (2008)
EQ-5D-5L Vietnamese: Mai VQ et al. (2020)
PHQ-9 Vietnamese: validated nhiều bài
PSS-10 Vietnamese: Dao-Tran TH et al. (2017)

Khóa học online

Coursera — "Survey Data Collection and Analytics" (University of Maryland)
REDCap official tutorials: https://projectredcap.org/resources/videos
KoboToolbox tutorials: https://help.kobotoolbox.org

Bối cảnh Việt Nam

Bộ Y tế. (2023). Hướng dẫn quản lý dữ liệu nghiên cứu y tế.
Hội Y học Dự phòng VN — Tài liệu về digital data collection.

✅ ĐÁP ÁN CÁC CHECKPOINT

Checkpoint 1:

3 hậu quả của paper-based:

Missing data 10-25% — Nhiều ô trống, BN bỏ qua câu khó, chữ viết không đọc được. Phân tích thống kê bị ảnh hưởng nghiêm trọng.
Transcription errors 5-15% — Khi nhân viên nhập từ giấy vào Excel, sai sót là không tránh khỏi (đọc sai số, đánh máy nhầm). Một sai số 8% trong dữ liệu = nghiên cứu không đáng tin.
Thời gian + chi phí ẩn lớn — Paper trông "rẻ" ban đầu nhưng tốn 200+ giờ nhập liệu, in giấy, lưu trữ. Tổng chi phí thường CAO HƠN Google Forms (miễn phí) hoặc KoboToolbox.

Còn các hậu quả khác:

Phiếu thất lạc → mất data vĩnh viễn
Không có audit trail → không biết ai sửa gì
Bảo mật kém → giấy có thể bị thấy/copy
Không có validation real-time → BN có thể nhập "tuổi = 200" mà không ai phát hiện cho đến khi nhập liệu xong

Checkpoint 2:

Semi-structured (Likert/numeric scale 1-10)
Unstructured (open-ended free text)
Structured (lab value, số cụ thể)
Unstructured (interview transcript, free narrative)

Checkpoint 3:

Câu hỏi: "Bạn có thường xuyên không tuân thủ điều trị thuốc và tập thể dục đều đặn không?"

Lỗi 1: Double-barreled — Hỏi 2 thứ cùng lúc (tuân thủ thuốc VÀ tập thể dục). Nếu BN tuân thủ thuốc nhưng không tập thể dục, họ trả lời thế nào?

Lỗi 2: Phủ định kép — "không tuân thủ" + "không" — gây khó hiểu, BN dễ nhầm lẫn.

Sửa: Tách thành 2 câu, dùng từ khẳng định:

"Trong 7 ngày qua, bạn có uống thuốc đúng theo chỉ định bác sĩ không? (Có/Không/Một phần)"
"Trong 7 ngày qua, bạn có tập thể dục không? (Có/Không/Đôi khi)"

Checkpoint 4:

Đáp án đúng: d) Cả b và c

Lý do:

(a) sai — không bao giờ dùng questionnaire mà chưa pilot, kể cả khi do AI/chuyên gia tạo
(b) đúng — pilot là bắt buộc
(c) đúng — nếu AI tạo ra cái gì đó giống tool đã validated, hãy dùng tool validated thay thế. EORTC QLQ-C30 là thang đo chuẩn vàng cho QoL ung thư đã có bản tiếng Việt
(d) đúng nhất — kết hợp cả hai

Quy trình đúng:

Search tool đã validate trước → nếu có, dùng tool đó (hoặc adapt)
Nếu không có, dùng AI tạo draft
Pilot 10-30 người
Sửa và validate (Cronbach's α)
Mới dùng cho nghiên cứu chính

Checkpoint 5:

Đáp án đúng: c) KoboToolbox

Lý do:

(a) sai — Google Forms cần internet liên tục, vùng cao có thể không có
(b) sai — paper sẽ có 15-25% lỗi như đã thảo luận
(c) đúng — KoboToolbox cho phép người phỏng vấn dùng tablet đi đến nhà BN, làm việc OFFLINE, sau đó sync khi có internet. Đây là tool chuẩn cho field research
(d) sai — REDCap cần internet và phức tạp, không phù hợp field research vùng cao

Lưu ý quan trọng: BN không cần có smartphone — người phỏng vấn (RA - Research Assistant) dùng tablet để hỏi và nhập liệu.

🎓 KẾT LUẬN BÀI 9

Chúc mừng bạn đã hoàn thành Bài 9 — bài học về kỹ năng "ít hào nhoáng nhưng quyết định". Hãy nhớ ba thông điệp cốt lõi:

💡 Thông điệp 1: Questionnaire là rễ cây của nghiên cứu. Rễ mục thì cây không thể sống. Một câu hỏi sai (double-barreled, leading) sẽ làm sai lệch tất cả phân tích sau đó. Đầu tư thời gian cho khâu này — không bao giờ là phí.

💡 Thông điệp 2: Ưu tiên dùng tool đã validate. SF-36, PHQ-9, GAD-7... đã có bản tiếng Việt — đừng phí công tự tạo. Tool đã validated giúp bạn so sánh kết quả với thế giới và được reviewer chấp nhận dễ hơn nhiều.

💡 Thông điệp 3: Chuyển từ paper sang digital là xu hướng không thể đảo ngược. Google Forms miễn phí và đủ cho 80% nghiên cứu của BV. KoboToolbox cho field research. REDCap cho clinical trials. Đầu tư học một công cụ — sẽ dùng cả sự nghiệp.

Chuẩn bị cho Bài 10

Bài tiếp theo: "Quản lý và Làm sạch Dữ liệu" — sau khi thu thập xong, làm gì với data raw?

Trước khi đến Bài 10, hãy:

[ ] Hoàn thiện Google Form cho nghiên cứu của bạn
[ ] Pilot test với ít nhất 5 người (đồng nghiệp, gia đình)
[ ] Sửa form dựa trên phản hồi pilot
[ ] Export thử dữ liệu sang Excel để xem format
[ ] Suy nghĩ: dữ liệu của bạn sẽ có loại lỗi gì? (cho Bài 10)

Soạn giả: Jack
Phiên bản: 1.0 (2026)
Liên hệ: thaihoadoanbrvt@gmail
Phản hồi: Mọi góp ý xin gửi về mail

"If you torture the data long enough, it will confess to anything."
— Ronald Coase (Nobel Economics)
("Tra tấn dữ liệu đủ lâu, nó sẽ thú nhận bất cứ điều gì.")
Đó là lý do bạn phải THU THẬP đúng từ đầu — vì sau đó không sửa lại được.

Khoa phòng

Nghiên cứu khoa học

Từ khoá

NCKH_AI