Профессия Data Scientist

Онлайн-курс от Skillbox, длительностью 15 месяцев. Вы станете специалистом по анализу данных, алгоритмам машинного обучения и нейросетям, сможете построить карьеру в крупной технологической компании — в России или за рубежом.

Введение в анализ данных и машинное обучение

Аналитика. Начальный уровень

  • Введение в Data Science
  • Введение в Python
  • Основы Python: установка PyCharm
  • Основы Python: базовые структуры данных
  • Основы Python: циклы и условия
  • Основы Python: функции
  • Мастер-класс: воронки
  • Основы Python: классы и объекты
  • Основы Python: исключения
  • Библиотека NumPy: методы анализа массивов
  • Библиотека NumPy: способы преобразования массивов
  • Библиотека pandas: индексация и выбор данных
  • Библиотека pandas: применение функций, группировка, сортировка
  • Визуализация данных с помощью matplotlib
  • Мастер-класс: разведочный анализ (EDA)
  • Курсовая работа. Подготовка аналитического отчёта на основе имеющихся данных в качестве помощи продюсерам образовательных программ эффективно выстраивать стратегию по обновлению и улучшению курсов
  • Чтение и запись данных: CSV, HTML, XML, XLSX
  • Основы SQL
  • Чтение и запись данных: JSON, HDF5, Работа с БД: SQLite3, postgreSQL, MongoDB
  • Работа со строками
  • Курсовая работа. Часть 1. Подготовка аналитического отчёта для HR-отдела. На основе аналитики необходимо составить рекомендации для отдела кадров по стратегии набора персонала и взаимодействию с сотрудниками
  • Курсовая работа. Часть 2. подготовка аналитического отчёта для SMM-отдела компании Skillbox на основе паблика Skillbox «ВКонтакте»

Статистика и теория вероятностей

  • Основы статистики и теории вероятностей

Основы математики для Data Science

  • Базовые математические объекты и SymPy. Дроби и преобразования
  • Базовые математические объекты и SymPy. Функции и дополнительные объекты
  • Функции одной переменной, их свойства и графики
  • Интерполяция и полиномы: квадратичные и кубические функции
  • Аппроксимация и преобразование функций: сдвиги, растяжения, сжатия
  • Аппроксимация и работа с производными
  • Функции нескольких переменных, их свойства и графики
  • Частные производные функции нескольких переменных
  • Векторы и матрицы. Градиент
  • Линейная регрессия и системы линейных уравнений
  • Разложение матриц. Собственные векторы и значения

Машинное обучение. Начальный уровень

  • Основные концепции Machine Learning (ML)
  • Жизненный цикл ML-проекта
  • Регрессия: метрики качества, преобразование входных данных
  • Регрессия: регуляризация и градиентный спуск
  • Классификация: kNN, наивный байесовский классификатор, деревья решений
  • Классификация: метрики качества классификации и многоклассовая классификация
  • Кластеризация
  • Дополнительные техники: понижение размерности
  • Дополнительные техники: бустинг и стекинг
  • Знакомство с Kaggle
  • Курсовая работа. Проанализировать данные телекоммуникационной компании и спрогнозировать отток пользователей на основе демографических характеристик, услуг, которыми они пользуются, длительности пользования услугами, метода и размера оплаты

Специализация

Аналитика. Средний уровень

  • Язык программирования R: базовые операции и структуры данных
  • Язык программирования R: циклы и функции
  • Язык программирования R: анализ данных и их визуализация
  • Создание аналитических панелей (Dashboard) в R
  • A/B-тестирование: объем выборки и построение доверительных интервалов
  • A/B-тестирование: статистические гипотезы и алгоритмы их проверки (Bootstrap и статистический тест)
  • Мастер-класс: A/B-тестирование
  • Performance metrics
  • Мастер-класс: модели атрибуции прибыли
  • Интерактивная визуализация данных с помощью Plotly

Машинное обучение. Средний уровень

  • Введение в нейронные сети
  • Обучение нейронных сетей
  • Нейронные сети на практике
  • Свёрточные нейросети для задачи классификации изображений: введение в свёртки (многоканальные свёртки, рецептивное поле)
  • Свёрточные нейросети для задачи классификации изображений: продвинутые операции со свёрткой (архитектуры сетей VGG и ResNet, задача Transfer Learning для свёрточных сетей)
  • Семантическая сегментация: слабая локализация и полносвёрточные нейросети (FCN)
  • Семантическая сегментация: продвинутые архитектуры FCN для семантической сегментации
  • Детектирование объектов. Задачи классификации и локализации
  • Детектирование объектов. Анализ и реализация R-CNN-архитектуры
  • Детектирование объектов. Разбор популярных архитектур (Fast/Faster R-CNN, YOLO, SSD) и знакомство с TensorFlow Object Detection API
  • От дискриминативных моделей к генеративным. Style transfer
  • Генеративные состязательные сети
  • Введение в NLP
  • NLP на нейросетях. Рекуррентные нейросети, классификация текстов
  • NLP на нейросетях. Языковые модели, Attention, Transformer
  • Обучение с подкреплением. Q-Learning
  • Обучение с подкреплением. Deep Q-Learning
  • Ускорение и оптимизация нейронных сетей
  • Внедрение DL моделей в production
  • Введение в рекомендательные системы и задачи ранжирования
  • Современные подходы к построению рекомендательных систем

Бонусные курсы

Универсальные знания программиста

  • Как стать первоклассным программистом
  • Вёрстка email-рассылок. Советы на реальных примерах
  • The state of soft skills
  • Как мы создавали карту развития для разработчиков
  • Как общаться по email и эффективно работать с почтой?
  • Повышение своей эффективности
  • Спор о первом языке программирования
  • Саморазвитие: как я не усидел на двух стульях и нашёл третий
  • Data-driven-подход к продуктивности — инсайты из данных миллиона людей
  • Протокол HTTP
  • Введение в алгоритмы

Английский для IT-специалистов

  • IT Resume and CV
  • Job interview: questions and answers
  • Teamwork
  • Workplace communication
  • Business letter
  • Software development
  • System concept development and SRS
  • Design
  • Development and Testing
  • Deployment and Maintenance

Дипломные проекты

Рекомендательная система для онлайн-гипермаркета Instacart

  • Проект-соревнование на платформе Kaggle. Вы используете анонимные данные о заказах клиентов, чтобы предсказать, какие продукты будут в их следующем чеке. Создадите рекомендательную систему для сайта и рекламных коммуникаций.

Система по распознаванию эмоций

  • Проект-соревнование на платформе Kaggle. Это подразумевает написание воспроизводимого кода, генерирующего csv-файл с ответами, в котором для каждого изображения с лицом человека указана его наиболее вероятная эмоция. В итоге вы реализуете собственный проект в области компьютерного зрения.
172 800 ₽
288 000 ₽

Актуальная стоимость обучения.

Данные обновлены 9 мая 2021 г.

Рассрочка: 3675 ₽ в месяц

  • 15 месяцев
  • Сертификат об обучении
Перейти на страницу курса
Информация о школе

Skillbox — это онлайн-университет, организующий прикладные курсы и программы от главных экспертов рынка. Данная школа использует актуальные подходы к обучению, помогает работать над реальными проектами, стажироваться и трудоустраиваться в крупнейшие компании страны.
158 достоверных отзывов о школе Skillbox
Мы не нашли много отзывов конкретно про курс «Профессия Data Scientist». Зато мы собрали 158 отзывов о школе Skillbox — они помогут вам получить общее представление о процессе обучения.