
علم داده (Data Science) شامل مجموعهای از اصول، تعریف مسئله، الگوریتمها و فرآیندها است که هدف آن استخراج الگوهای غیرواضح و مفید از مجموعه دادهها است. امروز علم داده در حال تحول حوزههای علمی و کاربردی مختلف از پزشکی، روان شناسی، علوم اجتماعی، کسب و کار و مدیریت، علوم پایه، فنی و مهندسی و … است.
کسانی که می خواهند در علم داده وارد شوند، باید در سه حوزه کلاسیک دانشی توانمندی و دانش خود را تقویت کنند: برنامهنویسی و علوم کامپیوتر، آمار و ریاضیات و یک حوزه تخصصی که حوزه ای است که می خواهند علم داده را در آن بکار ببرند.
انتظار این است دانش آموزان این حوزه با یادگیری ابزارها، الگوریتمها و اصولی که تدریس میشود، در نهایت بتوانند آنها را برای حل مسئله در رشته تخصصی خود بکار ببرند.
اهداف دوره
نوجوانان نیاز به داشتن آشنایی قبلی با برنامه نویسی ندارند و در طول دوره با زبان های برنامه نویسی R و پایتون (Python) آشنا خواهند شد. گرچه در این دوره به مفاهیم آماری زیاد اشاره می گردد، ولی این دوره درباره آموزش آمار نیست. انتظار این است که نوجوانان شرکتکننده با مفاهیم پایه آماری شامل مفاهیم اولیه احتمال، توزیعهای مهم احتمال مانند توزیع نرمال، دو جمله ای، پواسن و… ، نمونه گیری تصادفی، برآورد بازهای و نقطهای، آزمون فرضیه آشنا باشند.
در این دوره آموزشی، نوجوانان فرصت این را خواهند داشت که بر روی دادههای واقعی کار کنند تا زمینهای فراهم شود که دانش آموختهشده را برای حل مسائل عملی بکار ببرند. امید است مخاطبان با شرکت در این دوره به دانش و توانمندی دست یابند که بتوانند از آن در جهت فعالیت در زمینههای اجرایی، تحقیقاتی و آکادمیک در داخل یا خارج از کشور بهره ببرند.
مخاطبان دوره علم داده
- علاقمندان به حوزه علم داده (Data Science)، یادگیری ماشین و دادهکاوی
- علاقهمندان به امور پژوهشی در حوزه علم داده
- علاقمندان به اشتغال در خارج از ایران در حوزه علم داده
سرفصل های دوره علم داده (دیتا ساینس)
این دوره شامل هفده بخش یا دوره است که هر بخش خود از چندین جلسه تشکیل میگردد. هر جلسه 1.5 ساعت در هفته برگزار میگردد.
ماژولهای این دوره عبارتند از:
بخش اول: مقدمهای بر زبان برنامهنویسی R
بخش دوم: آشنایی با تکنیکهای آماده سازی داده در R
بخش سوم: تصویرسازی داده (Data Visualization)
بخش چهارم: مقدمهای بر یادگیری ماشین (Machine Learning)
بخش پنجم: الگوریتمهای یادگیری ماشین برای حل مسائل رگرسیون (Regression) شامل رگرسیون خطی، قاعدهسازی، درخت تصمیم،Bagging و تقویت گرادیان
بخش ششم: الگوریتمهای یادگیری ماشین برای حل مسائل دستهبندی (Classification) شامل رگرسیون لجستیک، LDA،SVM و روشهای مبتنی بر درخت
بخش هفتم: مقدمهای بر شبکههای عصبی و کار با پلتفورم H2O
بخش هشتم: الگوریتمهای خوشهبندی: خوشهبندی سلسله مراتبی، k-means، PAM و CLARA
بخش نهم: روشهای کاهش بعد PCA و Principal Component Regression
بخش دهم: تحلیل سریهای زمانی
بخش یازدهم: مقدمهای بر زبان برنامهنویسی Python
بخش دوازدهم: آشنایی با کتابخانههای NumPy، Pandas و Matplotlib در پایتون
بخش سیزدهم: پیادهسازی الگوریتمهای یادگیری ماشین برای حل مسائل رگرسیون در پایتون
بخش چهاردهم: پیادهسازی الگوریتمهای یادگیری ماشین برای حل مسائل دستهبندی در پایتون
بخش پانزدهم: اجرای الگوریتمهای خوشه بندی در پایتون
بخش شانزدهم: مقدمهای بر Keras
بخش هفدهم: مدیریت پایگاههای داده (SQL)
دوره های مرتبط
دنیای 2030
آینده برایمان چه خوابی دیده است؟ در این دوران پر از تردید و آشوب و آشفتگی، شاید این سؤال بیش…
همه دروغ می گویند به غیر از گوگل
ما به همه دروغ میگوییم به جز جستجوگر گوگل». انبوه اطلاعاتی که شرکتها بزرگ به ویژه گوگل از مردم جمع…
ستاره شناسی: کاوش در زمان و مکان
این دوره برای هر کسی که علاقه مند به یادگیری بیشتر در مورد نجوم مدرن است طراحی شده است. ما…
نظرات
رایگان!