Python для работы с данными

Онлайн-курс от Нетологии. Научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных и научитесь реализовывать это языке Python.

  • Основы Python для работы с данными . Вы научитесь пользоваться базовыми инструментами Python. Для студентов без опыта в программировании модуль предполагает интенсивную самостоятельную работу. По ходу занятия преподаватель даст много полезных дополнительных библиотек и методов, которые ускорят работу с кодом, оставив больше времени на аналитические задачи.
    • Вводные видео-уроки по установке, синтаксису и функциям Python
    • Основы Python и Git
    • Базовые типы данных и циклы
    • Функции и классы
    • Продвинутые типы данных: массивы, множества, словари
  • Знакомство с основными библиотеками для анализа данных. Вы научитесь работать с главными аналитическими библиотеками, а визуализации помогут быстро находить зависимости и корреляции. Одно из больших преимуществ языка Python — это большое и сильное сообщество, которое ежедневно пополняет язык простыми готовыми решениями.
    • numpy и scipy
    • pandas
    • Визуализация данных: seaborn, plotly, matplotlib
    • Получение данных с внешних сайтов и API
    • Data mining и парсинг
  • Статистика в Python. В этом модуле вы познакомитесь со статистикой: именно она помогает закопаться глубже в данные, чтобы найти интересные связи и эффективно генерировать гипотезы. Вас ждут не только среднее, медиана и квартили, но и одномерный и многомерный анализ, коллинеарность. Вы научитесь рассчитывать необходимую выборку и доверительный интервал для стат. значимости теста и проектировать дизайн A/B-тестов.
    • Основы описательной статистики, виды распределений в Python
    • Центральная предельная теорема и статистический анализ данных в Python
    • Основные статистические тесты и проверка гипотез
    • Кейс-стади. Статистические показатели в Python
  • Feature engineering и предобработка данных. Вы изучите инструменты выбора и оценки фичей, научитесь оптимизировать их количество. Новые знания помогут плотнее общаться с разработкой в продукте и быстро вычленять ошибки в их логике. Также вы приобщитесь к главной библиотеке data scientists — sklearn для feature selection.
    • Проверка и очистка данных с помощью pandas и numpy
    • Проведение анализа и рекурсивного feature selection и на базе моделей
    • Методы оценки значимости и отбора признаков и их использование
    • «Проклятие размерности», основные алгоритмы и принципы их работы
    • Использование алгоритмов sklearn
  • Лабораторные работы. Кроме домашних заданий, в которых вы отрабатываете отдельные навыки, в курсе будет две проверочные точки. Они помогут вам оценить свои силы в комплексных задачах.
    • С помощью статистики изучите данные небольшого датасета на 200+ автомобилей по 26 параметрам, с помощью визуализаций выведете закономерности и протестируете несколько статистических гипотез.
    • Вместе с преподавателем подготовите датасет на 1500 строк к анализу, оцените и выберете из 80 признаков нужные и спрогнозируете стоимостную категорию дома.
31 500 ₽
45 000 ₽

Актуальная стоимость обучения.

Данные обновлены 8 мая 2021 г.

  • Сертификат об обучении
Перейти на страницу курса
Информация о школе

101 достоверный отзыв о школе Нетология
Мы не нашли много отзывов конкретно про курс «Python для работы с данными». Зато мы собрали 101 отзыв о школе Нетология — они помогут вам получить общее представление о процессе обучения.