DEVrepublik

Розширює кар’єрні можливості

Data Science bootcamp

Дата: 13 січня – 26 квітня

Час: 10:00 – 15:00

Цiна: 26000 грн

Реєстрація та оплата

РеєстраціяОлатити зараз
 
 
 
1
1

Наступні події

Data science

2 Березня – 14 Червня

Час: 16:00-21:00

Цiна: 52000 грн

Реєстрація

Data Science

У Київському кампусі ми пропонуємо курс Data Science, розроблений з потребами роботодавця. Ви будете отримувати знання на практиці та навчитеся вчитися.

Перетворіть свою кар’єру на найбільш затребувані Data Science Bootcamp. Це інтенсивний курс, де Ви можете вивчити складні теми з науки про дані, машинного навчання та штучного інтелекту. Ви познайомитеся з тенденціями в області технологій та отримаєте найсвіжішу інформацію.

ТОП навички, якими Ви оволодієте:

  • Досвід використання комп’ютерних мов (Python, SQL та ін.) для маніпулювання даними та отримання інформації з великих наборів даних.
  • Глибоке знання основ машинного навчання
  • Інтелектуальний аналіз даних та статистичне прогнозоване моделювання
  • Досвід застосування цих методів для вирішення реальних проблем
  • Досвід застосування і надання аналітичних моделей і рішень

Це саме для Вас, якщо Ви:

  • особа, яка шукає зміну кар’єри
  • випускник університету в пошуках роботи в науці про дані
  • розробник з математичним складом розуму, який хотів би домогтися кар’єрного зростання
  • власник бізнесу, який хотів би використовувати аналіз даних і реалізовувати проекти, засновані на даних та штучному інтелекті
  • фахівець Data Scientist, який хоче систематизувати знання та освоїти глибоке навчання

Це саме для Вас, якщо Ви:

  • особа, яка шукає зміну кар’єри
  • випускник університету в пошуках роботи в науці про дані
  • розробник з математичним складом розуму, який хотів би домогтися кар’єрного зростання
  • власник бізнесу, який хотів би використовувати аналіз даних і реалізовувати проекти, засновані на даних та штучному інтелекті
  • фахівець Data Scientist, який хоче систематизувати знання та освоїти глибоке навчання

Curriculum Overview

Модуль 1: Python

Python є кращою мовою програмування. Якщо фахівці в машинному навчанні захочуть помістити свій проект у відкритий доступ, вони, швидше за все, зроблять це на python. Тому курс починається з подання концепцій та пакетів Python, які корисні для аналізу даних.

Теми:

  • Змінні
  • Логічний тип даних та умовні вирази
  • Списки
  • Словники
  • Циклічність
  • Функції
  • Читання та запис файлів
  • Pandas
  • NumPy
  • Matlotlib / Seaborn для візуалізації даних
  • Git/Github

Модуль 2: Math for Machine Learning

Машинне навчання є технічною наукою та, як і будь-який технічний предмет, використовує математичну мову для формулювання ідей. Зростає число рішень, які намагаються автоматизувати весь процес машинного навчання, але якщо людина не розуміє математичний формалізм, що лежить в основі алгоритмів, неможливо протестувати та налагодити моделі, які можуть привести до помилкових висновків.

У цьому курсі студенти вивчають ті поняття лінійної алгебри, теорії ймовірностей та статистики, які є ключовими для розвідувального аналізу даних, а також для розуміння та розробки алгоритмів машинного навчання.

Теми:

  • Лінійна алгебра
  • Диференціальне числення
  • Теорія ймовірностей
  • Теорема Баєса
  • Статистичні величини
  • Розподіл

Модуль 3: Data Collection

«Чим більше даних, тим краще алгоритми» – ця цитата Пітера Норвіга підкреслює велике значення даних у машинному навчанні. У цій частині програми описуються структури даних, реляційні
та нереляційні бази даних, засоби взаємодії з базами даних, маніпулювання даними та злиття наборів даних з різних джерел.

Теми

  • Структури даних
  • Реляційні бази даних
  • SQL
  • JSON
  • HTML/XML
  • Доступ до даних через API
  • CSS
  • Web Scraping

Модуль 4: Intro to Machine Learning and Pre-Training Phase

Цей модуль починається зі вступу до машинного навчання: як воно організоване, які є підгалузі машинного навчання, фундаментальні відмінності між цими підходами та типи проблем, для вирішення яких вони призначені.

Потім студенти знайомляться з постановкою задачі машинного навчання, вибираючи відповідну цільову функцію та алгоритм для даної задачі Добре відомо, що обробка даних та вибір функцій займають більшу частину часу розробки моделі. Студенти вивчають методи, що дозволяють ефективно справлятися з відсутніми значеннями, викидами, категоріальними змінними та створюють нові функції.

Теми:

  • Вступ
  • Feature engineering
  • Очищення даних
  • Підготовка даних
  • Конструювання ознак

Модуль 5: Supervised Learning

Цей курс охоплює алгоритми, які використовуються, коли відома цільова змінна, яка повинна бути передбачена. Він починається з простого KNN та закінчується повністю підключеними нейронними мережами з прямим зв’язком. Правильне тестування моделі необхідне для створення надійного продукту. Студенти знайомляться з різними методами та параметрами тестування, які допомагають будувати узагальнені та стійкі моделі.

Теми:

  • Ліниві алгоритми – К найближчих сусідів
  • Лінійна регресія
  • Функція втрат
  • Оптимізація функції втратn
  • Регуляризація: L1 та L2
  • Поділ даних
  • Логістична регресія
  • Мультикласовий класифікатор: Softmax Regression
  • Ранжування
  • Класифікація та дерево регресії
  • Бустинг (підсилення): Adaboost, градієнтний бустинг (GBM)
  • Ансамблі моделей
  • Введення до Баєсового навчання
  • Введення до нейронних мереж
  • Навчання нейронних мереж

Модуль 6: Unsupervised Learning

Більшість тимчасових значень цільової змінної невідомі, в таких випадках необхідно застосовувати методи навчання без учителя. Вони дозволяють нам ідентифікувати приховані структури в багатовимірних наборах даних.

Теми:

  • Зниження розмірності
  • Кластеризація: метод K-середніх
  • Виявлення аномалій

Модуль 7: Фінальний Проект

Підсумкова перевірка та оцінка знань студентів буде полягати в тому, що після завершення всіх модулів кожен з них вибирає завдання машинного навчання та намагається знайти рішення, проходячи всі етапи підготовки даних, навчання моделі та тестування.

Модуль 8: Бонус

Цей модуль представить деякі провідні теми та інструменти для аналізу даних, які допоможуть Вам досягти успіху в області Data Science.

Наші тренери

Ірина Лазаренко

Одна з провідних інструкторів DEVrepublik boot camp, а також Старший викладач кафедри математичного моделювання економічних систем Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського». Ірина також науковий співробітник лабораторії комп'ютерного моделювання та інтелектуального аналізу даних у Світовому центрі даних з геоінформатики та сталого розвитку.
До її наукових інтересів відносяться Аналіз даних, дослідження операцій, оптимальне управління, сталий розвиток, теорія інтегральних та диференціальних рівнянь.
Вона також любить подорожувати.

Іван Лучко

Іван один із провідних інструкторів в DEVrepublik.
Іван виграв бронзову медаль на Міжнародній олімпіаді з фізики в Мексиці. Отримав ступінь магістра прикладної фізики в Технічному університеті Мюнхена. Пізніше проводив дослідження в антиферомагнетиках Гейзенберга за допомогою моделювання Qauntum Monte Carlo та техніки машинного навчання в Женеві (та PSI), Швейцарія. Має багатий досвід автоматизації бізнес-процесів, поглибленої аналітики, математичного моделювання, оптимізації та машинного навчання. Протягом останніх двох років Іван працює керівником команди Data Science в Boosta. Останні проекти пов'язані з динамічною ціновою оптимізацією та системою рекомендацій в електронній комерції.
Любить спорт, подорожі та походи.

Руслан Климентьєв

Руслан - автор навчальних програм в DEVrepublik та інструктор з практичних завдань.
Закінчив Одеський національний політехнічний університет, спеціаліст «Радіоелектронні апарати».
2,5 роки досвіду роботи в Data Science.
Інтереси: статистика, Data Visualization, CNN models та Computer Vision
2 рази отримував на Kaggle.com приз Weekly Kernels Award
Winner.
Хобі: скелелазання та туризм