[Udemy] [Alexander Hagmann] Наука о данных Python с Pandas. Освойте 12 продвинутых проектов
Курс на английском языке
Добро пожаловать на первый продвинутый и проектный курс науки о данных Панд!
Этот курс начинается там, где заканчиваются многие другие курсы: вы можете написать код Панд, но вы все еще боретесь с реальными проектами.
Реальные данные обычно не предоставляются в одном или нескольких текстовых файлах/excel- > требуются более продвинутые методы импорта данных.
Реальные данные большие, неструктурированные, вложенные и нечистые -> требуются более продвинутые методы обработки данных и анализа/визуализации данных.
Многие простые в использовании методы Pandas лучше всего работают с относительно небольшими и чистыми наборами данных- > реальные наборы данных требуют более общего кода (включая другие библиотеки/модули).
Независимо от того, нужны ли вам отличные навыки Панд для анализа данных, машинного обучения или финансовых целей, это правильный курс для вас, чтобы получить свои навыки на экспертном уровне!
Освойте свои реальные проекты!
Этот курс охватывает полный рабочий процесс обработки данных A-Z:
- Импорт (сложных и вложенных) данных из JSON-файлов.
- Импорт (сложных и вложенных) данных из Интернета с помощью веб-API, JSON и пакетов-оболочек.
- Импорт (сложных и вложенных) данных из баз данных SQL.
- Храните (сложные и вложенные) данные в файлах JSON.
- Храните (сложные и вложенные) данные в базах данных SQL.
- Работайте с Панд и базами данных SQL параллельно (получая лучшее из обоих миров).
- Эффективно импортируйте и объединяйте данные из многих текстовых/CSV-файлов.
- Очистите большие и грязные наборы данных с помощью более общего кода.
- Очищайте, обрабатывайте и сглаживайте вложенные и строковые данные в фреймах данных.
- Знать, как обрабатывать и нормализовать строки Unicode.
- Эффективно объединяйте и объединяйте множество наборов данных.
- Масштабирование и автоматизация слияния данных.
- Анализ пояснительных данных и представление данных с помощью передовых инструментов визуализации (advanced Matplotlib & Seaborn).
- Проверьте пределы производительности Панд с помощью расширенных агрегаций и группировок данных.
- Предварительная обработка данных и разработка функций для машинного обучения с помощью простого кода Pandas.
- Обучайте и тестируйте модели машинного обучения на предварительно обработанных данных и анализируйте полученные результаты.
- Используйте свои данные 2: Бэктестирование и Форвардное тестирование инвестиционных стратегий (Finance & Investment Stack).
- Используйте свои данные 3: Отслеживание индексов (Finance & Investment Stack).
- Используйте свои данные 4: Представьте свои данные с помощью
- Python в красивом HTML-формате (качество веб-сайта).
Скачать:
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.