DEVrepublik

Расширяет карьерные возможности

Data Science bootcamp

Дата: 2 Марта — 14 июня

Время: 16:00 — 21:00

Цена: 75000 грн

Early birds 52000 грн

Регистрация и оплата

 
 
 
1
1

Следующие события

Дата: 6 Апреля — 19 Июля

Время: 10:00 — 15:00

Дата: 16 Июня — 27 Сентября

Время: 16:00 — 21:00

Data Science

Сегодня для тех, кто хочет развиваться в сфере анализа больших данных, существует очень много возможностей, и мы решительно настроены помочь нашим студентам пополнить ряды дата саентистов. 

Существует много мифов вокруг профессии Data Scientist, многие считают, что, например, математика не важна и каждый кто может забить формулу в пайтоне уже считает себя дата саентистом при этом не имея ни малейшего понятия, что за этим стоит. А на выходе может получить нерелевантные заключения. При этом, не обращая внимание на то, что анализ данных, технологии машинного обучения и Big Data – все эти технологии и области знаний используют базовую математику как свою основу.

Поэтому в нашем курсе мы уделяем особое внимание математике, а также разработали специальный пре-курс по математике для тех, кто не изучал математику или изучал ее так давно, что уже ничего и не помнит.

Однако, нужно понимать, что заниматься Data Science так же трудно, как заниматься наукой в целом. Эта профессия предполагает умение строить гипотезы, ставить вопросы и находить ответы на них. Само слово scientist подчеркивает, что такой специалист должен быть исследователем, человеком с аналитическим складом ума, способным делать обоснованные выводы из огромных массивов информации в достаточно сжатые строки. Скрупулезный, внимательный, точный — чаще всего он одновременно и программист, и математик.

Соответственно, если вы решили посвятить себя профессии Data Scientist, вы должны понимать, что ее невозможно осилить за 2 недели, или же за пару часов в день, чего абсолютно недостаточно, чтоб получить знания и быть способным применять их на практике. 

В жизни человека самое важное и дорогое – это время, поэтому в нашем курсе мы постарались отразить наиболее важные моменты в Data Science и уделить внимание практике в особую очередь, чтобы не тратить ваше время зря. Таким образом, вы имеете 375 рабочих аудиторных часов, за этот период у вас есть возможность освоить новую профессию и через 15 недель применять все полученные знания на практике. 

Регистрируйтесь и давайте развиваться вместе!

ТОП навыки, которыми вы овладеете:

  • Опыт использования компьютерных языков (Python, SQL и т. Д.) для манипулирования данными и получения информации из больших наборов данных.
  • Глубокое знание основ машинного обучения
  • Интеллектуальный анализ данных и статистическое прогнозируемое моделирование
  • Опыт применения этих методов для решения реальных проблем.
  • Опыт применения и предоставления аналитических моделей и решений

Это именно для вас, если вы:

  • человек, ищущий смену карьеры
  • выпускник университета в поисках работы в науке о данных
  • разработчик с математическим складом ума, который хотел бы добиться карьерного роста
  • владелец бизнеса, который хотел бы использовать анализ данных и реализовывать проекты, основанные на данных и искусственном интеллекте
  • специалист Data Scientist, который хочет систематизировать знания и освоить глубокое обучение

Учебный план

Модуль 1: Python

Python является предпочтительным языком программирования. Если специалисты в машинном обучении решат поместить свой проект в открытый доступ, они, скорее всего, сделают это на python. Поэтому курс начинается с представления концепций и пакетов Python, которые полезны для анализа данных.

Темы:

  • Переменные
  • Логический тип данных и условные выражения
  • Списки
  • Словари
  • Цикличность
  • Функции
  • Чтение и запись файлов
  • Pandas
  • NumPy
  • Matlotlib / Seaborn для визуализации данных
  • Git/Github

Модуль 2: Math for Machine Learning

Машинное обучение является технической наукой и, как и любой технический предмет, использует математический язык для формулирования идей. Растет число решений, которые пытаются автоматизировать весь процесс машинного обучения, но если человек не понимает математический формализм, лежащий в основе алгоритмов, невозможно протестировать и отладить модели, которые могут привести к ложным выводам.

В этом курсе студенты изучают те понятия линейной алгебры, теории вероятностей и статистики, которые являются ключевыми для разведочного анализа данных, а также для понимания и разработки алгоритмов машинного обучения.

Темы:

  • Линейная алгебра
  • Дифференциальное исчисление
  • Теория вероятности
  • Теорема Байеса
  • Статистические величины
  • Распределения

Модуль 3: Data Collection

«Чем больше данных, тем лучше алгоритмы» — эта цитата Питера Норвига подчеркивает большое значение данных в машинном обучении. В этой части программы описываются структуры данных, реляционные и нереляционные базы данных, средства взаимодействия с базами данных, манипулирование данными и слияние наборов данных из разных источников.

Темы:

  • Структуры данных
  • Реляционные базы данных
  • SQL
  • JSON
  • HTML/XML
  • Доступ к данным через API
  • CSS
  • Web Scraping

Модуль 4: Intro to Machine Learning and Pre-Training Phase

Этот модуль начинается со введения в машинное обучение: как оно организовано, каковы подотрасли машинного обучения, фундаментальные различия между этими подходами и типы проблем, для решения которых они предназначены.

Затем студенты знакомятся с постановкой задачи машинного обучения, выбирая соответствующую целевую функцию и алгоритм для данной задачей. Хорошо известно, что обработка данных и выбор функций занимают большую часть времени разработки модели. Студенты изучают методы, позволяющие эффективно справляться с отсутствующими значениями, выбросами, категориальными переменными и создают новые функции.

Темы:

  • Вступление
  • Постановка задачи машинного обучения
  • Очистка данных
  • Подготовка данных
  • Конструирование признаков

Модуль 5: Supervised Learning

Этот курс охватывает алгоритмы, которые используются, когда известна целевая переменная, которая должна быть предсказана. Он начинается с простого KNN и заканчивается полностью подключенными нейронными сетями с прямой связью. Правильное тестирование модели необходимо для создания надежного продукта. Студенты знакомятся с различными методами и параметрами тестирования, которые помогают строить обобщенные и устойчивые модели.

Темы:

  • Ленивые алгоритмы — K ближайших соседей
  • Линейная регрессия
  • Функция потерь
  • Оптимизация функции потерь
  • Регуляризация: L1 и L2
  • Разделение данных
  • Логистическая регрессия
  • Мультиклассовый классификатор: Softmax Regression
  • Ранжирование
  • Классификация и дерево регрессии
  • Бустинг: Adaboost, градиентный бустинг (GBM)
  • Ансамбли моделей
  • Введение в байесовское обучение
  • Введение в нейронные сети
  • Обучение нейронных сетей

Модуль 6: Unsupervised Learning

Большинство временных значений целевой переменной неизвестны, в таких случаях необходимо применять методы обучения без учителя. Они позволяют нам идентифицировать скрытые структуры в многомерных наборах данных.

Темы:

  • Снижение размерности
  • Кластеризация: метод K-средних
  • Выявление аномалий

Финальный Проект

Итоговая проверка и оценка знания студентов будет состоять в том, что после завершения всех модулей каждый из них выбирает задачу машинного обучения и пытается найти решение, проходя все этапы подготовки данных, обучения модели и тестирования.

Модуль 8: Бонус

Этот модуль представит некоторые продвинутые темы и инструменты для анализа данных, которые помогут вам преуспеть в области Data Science.

Цeна:

Полная цена

₴75000

Или

Месячный взнос

₴21500 /мeс.

А знаешь ли ты, что выбрав наш курс, ты не только освоишь профессию Data Science, но и сэкономишь?

Давай немного посчитаем

В сумме получается 375 рабочих часов по цене 3000 $. Итак, за час ты платишь только 8 $.

Но это же настоящая шара!

Ты видел где-то такие цены? Конечно, нет! А мы еще и оплату частями предлагаем.

Все ради твоего обучения.

Наши Тренеры

Ирина Лазаренко

Одна из ведущих инструкторов DEVrepublik boot camp, а также Старший преподаватель кафедры математического моделирования экономических систем Национального технического университета Украины "Киевский политехнический институт имени Игоря Сикорского". Ирина также научный сотрудник лаборатории компьютерного моделирования и интеллектуального анализа данных в Мировом центре данных по геоинформатике и устойчивому развитию.
К ее научным интересам относятся Анализ данных, исследование операций, оптимальное управление, устойчивое развитие, теория интегральных и дифференциальных уравнений.
Она также любит путешествовать.

Иван Лучко

Иван один из ведущих инструкторов в DEVrepublik.
Иван выиграл бронзовую медаль на Международной олимпиаде по физике, в Мексике. Получил степень магистра прикладной физики в Техническом университете Мюнхена. Позже проводил исследования в антиферромагнетиках Гейзенберга с использованием моделирования Qauntum Monte Carlo и техники машинного обучения в Женеве (и PSI), Швейцария. Имеет богатый опыт автоматизации бизнес-процессов, углубленной аналитики, математического моделирования, оптимизации и машинного обучения. Последние два года Иван работает руководителем команды Data Science в Boosta. Последние проекты связаны с динамической ценовой оптимизацией и системой рекомендаций в электронной коммерции.
Любит спорт, путешествия и походы.

Руслан Климентьев

Руслан - автор учебных программ в DEVrepublik и инструктор по практическим заданиям.
Закончил Одесский национальный политехнический университет, специалист "Радиоэлектронные аппараты".
2,5 года опыта работы в Data Science.
Интересы: статистика, Data Visualization, CNN models и Computer Vision
2 раза получал на Kaggle.com приз Weekly Kernels Award
Winner.
Хобби: скалолазание и туризм

Николай Мерецкий

Николай является одним из ведущих инструкторов в DEVrepublik.
Он имеет 4-летний опыт в области Data Science и машинном обучении с использованием алгоритмов прогнозного моделирования, обработки данных, обработки изображений и видео, а также, интеллектуального анализа данных для решения сложных бизнес-задач.
Николай успешно применяет методы машинного обучения в медицине, финансах, агропромышленности, AR и многих других областях.
Помимо этого, он работал с большим количеством популярных технологий, таких как: Python, TensorFlow, Scikit, Keras, SciPy.
Хобби: Хайкинг.