دوره آموزشی
دوبله زبان فارسی
پروژه جامع مهندسی داده با GCP در حوزه بهداشت و درمان
✅ سرفصل و جزئیات آموزش
آنچه یاد خواهید گرفت:
- درک کامل یک پروژه مهندسی داده از ابتدا تا انتها
- طراحی و پیادهسازی پایپ لاین های ETL مقیاسپذیر برای داده حوزه سلامت
- پیادهسازی تکنیکهای کلیدی مانند داده افزایشی، ابعاد به کندی متغیر نوع 2 (SCD2)، رویکرد مبتنی بر فراداده، معماری مدالیون، مدیریت خطا، CDM ،CI/CD و بسیاری موارد دیگر
- توسعه و استقرار راهحلهای داده با استفاده از شیوههای CI/CD
پیشنیازهای دوره
- دانش اولیه پایتون و SQL
توضیحات دوره
- این پروژه بر ساخت یک دیتا لیک در پلتفرم ابری گوگل (GCP) برای مدیریت چرخه درآمد (RCM) در حوزه بهداشت و درمان تمرکز دارد.
- هدف، متمرکزسازی، پاکسازی و تبدیل داده از منابع متعدد است تا ارائهدهندگان خدمات بهداشتی و شرکتهای بیمه بتوانند فرآیندهای صورتحساب، پردازش ادعاهای خسارت و ردیابی درآمد را بهینه کنند.
سرویسهای GCP مورد استفاده:
- Google Cloud Storage (GCS): برای ذخیرهسازی فایلهای داده خام و پردازششده
- BigQuery: به عنوان موتور تحلیلی برای ذخیرهسازی و اجرای کوئری روی داده ساختاریافته
- Dataproc: برای پردازش داده در مقیاس بزرگ با استفاده از Apache Spark
- Cloud Composer (Apache Airflow): برای خودکارسازی پایپ لاین های ETL و هماهنگسازی گردش های کاری
- Cloud SQL (MySQL): برای ذخیره داده تراکنشی سوابق پزشکی الکترونیکی (EMR)
- GitHub & Cloud Build: برای کنترل نسخه و پیادهسازی CI/CD
- CICD (یکپارچهسازی و استقرار مداوم): برای خودکارسازی پایپ لاین های استقرار جهت پردازش داده و گردش های کاری ETL
تکنیکهای مورد استفاده:
- رویکرد فراداده محور
- پیادهسازی ابعاد به کندی متغیر نوع 2
- مدل داده مشترک (CDM)
- معماری مدالیون
- ثبت وقایع و نظارت
- مدیریت خطا
- بهینهسازیها
- پیادهسازی CI/CD
- و بسیاری دیگر از بهترین شیوهها
منابع داده
- داده سوابق پزشکی الکترونیکی (EMR) از دو بیمارستان
- فایلهای ادعای خسارت
- کدهای اصطلاحات رویهای جاری
- داده شناسه ملی ارائهدهنده
نتایج مورد انتظار
- پایپ لاین داده کارآمد: خودکارسازی فرآیند دریافت و تبدیل داده RCM
- انبار داده ساختاریافته: جداول نهایی در BigQuery برای کوئریهای تحلیلی
- داشبوردهای KPI: ارائه بینش در مورد جمعآوری درآمد، کارایی پردازش ادعاها و روندهای مالی
این دوره برای چه کسانی مناسب است؟
- علاقهمندان به مهندسی داده و متخصصان داده
پروژه جامع مهندسی داده با GCP در حوزه بهداشت و درمان
-
درس مقدماتی برای درک پروژه 29:17
-
معرفی پروژه - بررسی و معماری 38:55
-
راه اندازی منابع داده - پایگاههای داده SQL ،GCS ،BigQuery، پیکربندیها 48:20
-
دریافت داده - Dataproc ،Pyspark، لندینگ در GCS 01:33:25
-
انتقال از لندینگ GCS به لایه برنز - GCS و BigQuery 01:03:59
-
پردازش از لایه برنز به نقرهای - BigQuery 01:06:28
-
پردازش از لایه نقرهای به طلایی - BigQuery 17:31
-
ساخت DAGها - هماهنگی گردش کاری - Airflow 28:46
-
CICD - گیتهاب، کلاد بیلد، ایر فلو 01:20:26
مشخصات آموزش
پروژه جامع مهندسی داده با GCP در حوزه بهداشت و درمان
- تاریخ به روز رسانی: 1404/06/21
- سطح دوره:همه سطوح
- تعداد درس:9
- مدت زمان :07:47:09
- حجم :3.52GB
- زبان:دوبله زبان فارسی
- دوره آموزشی:AI Academy