Введение
Вы, возможно, обучали множество моделей машинного обучения в университете или на работе, но развертывали ли вы когда-нибудь модель так, чтобы любой мог использовать её через API или веб-приложение? Развертывание — это этап, на котором модели становятся продуктами, и это один из самых ценных (и недооцененных) навыков в современном ML.
В этой статье мы рассмотрим 10 GitHub-репозиториев для освоения развертывания машинного обучения. Эти проекты, примеры, курсы и списки ресурсов помогут вам научиться упаковывать модели, предоставлять их через API, развертывать в облаке и создавать реальные ML-приложения, которые можно запускать и делиться ими.
1. MLOps Zoomcamp
Репозиторий: DataTalksClub/mlops-zoomcamp
Этот репозиторий предлагает MLOps Zoomcamp — бесплатный 9-недельный курс по созданию ML-сервисов для производства.
Вы изучите основы MLOps от обучения до развертывания и мониторинга через 6 структурированных модулей, практические семинары и финальный проект. Доступен в формате когортного обучения (начинается 5 мая 2025 года) или самостоятельного изучения с поддержкой сообщества через Slack для учащихся с базовыми знаниями Python, Docker и ML.
2. Made With ML
Репозиторий: GokuMohandas/Made-With-ML
Этот репозиторий предлагает курс по созданию ML-систем производственного уровня.
Вы изучите основы MLOps от отслеживания экспериментов до обслуживания моделей; реализуете конвейеры CI/CD для непрерывного развертывания; масштабируете рабочие нагрузки с помощью Ray/Anyscale; и развернете надежные API для вывода — преобразуя ML-эксперименты в приложения, готовые к производству, с помощью протестированных скриптов на Python.
3. Machine Learning Systems Design
Репозиторий: chiphuyen/machine-learning-systems-design
Этот репозиторий предоставляет книгу по проектированию систем машинного обучения, охватывающую настройку проекта, конвейеры данных, моделирование и обслуживание.
Вы изучите практические принципы через кейсы ведущих технологических компаний, исследуете 27 открытых вопросов для интервью с ответами от сообщества и обнаружите ресурсы для создания производственных ML-систем.
4. A Guide to Production Level Deep Learning
Репозиторий: alirezadir/Production-Level-Deep-Learning
Этот репозиторий предлагает руководство по проектированию систем глубокого обучения производственного уровня.
Вы изучите четыре ключевых этапа: настройку проекта, конвейеры данных, моделирование и обслуживание через практические ресурсы и реальные кейсы от инженеров ML ведущих технологических компаний.
5. Deep Learning In Production Book
Репозиторий: The-AI-Summer/Deep-Learning-In-Production
Этот репозиторий предлагает книгу "Deep Learning In Production", всеобъемлющее руководство по созданию надежных ML-приложений.
Вы изучите лучшие практики написания и тестирования кода DL, построения эффективных конвейеров данных, обслуживания моделей с помощью Flask/uWSGI/Nginx, развертывания с Docker/Kubernetes и реализации сквозных MLOps с использованием TensorFlow Extended и Google Cloud.
6. Machine Learning + Kafka Streams Examples
Репозиторий: kaiwaehner/kafka-streams-machine-learning-examples
Этот репозиторий демонстрирует развертывание аналитических моделей в производстве с использованием Apache Kafka и его Streams API.