Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Стартап MyHair AI использует искусственный интеллект для анализа фото головы и выявления ранних признаков выпадения волос. Сервис предлагает персонализированные планы ухода, подбор продуктов и доступ к проверенным специалистам. Продукт уже обработал сотни тысяч снимков и привлекает тысячи пользователей, отличаясь специализированной моделью ИИ.
ИИ-системы часто не справляются с соединением восприятия и мышления в динамичных условиях, но NVIDIA Cosmos Reason VLM решает эту задачу через интеграцию зрения, языка и мировых знаний. На стриме покажут дообучение модели на своих данных, создание агентов с NIM и VSS, плюс примеры для производства, логистики и безопасности. Зрители получат практические советы и демонстрации для умных рабочих процессов.
Автоматическое распознавание листьев растений с использованием глубоких эмбеддингов и евклидова сходства позволяет эффективно идентифицировать виды по изображениям. На основе датасета UCI One-Hundred Plant Species Leaves модель ResNet-50 достигает высокой точности, демонстрируя применение в экологии, сельском хозяйстве и образовании. Система включает предобработку, извлечение признаков и анализ, обеспечивая воспроизводимость и интерпретируемость результатов.
В этой статье разбирается использование второй производной изображения для обнаружения краев с помощью оператора Лапласа. Рассматриваются дискретные приближения, влияние шума и роль гауссова фильтра для повышения устойчивости. Показана реализация в OpenCV с примерами кода и визуализацией результатов.
RF-DETR представляет собой эволюцию моделей обнаружения объектов, начиная от DETR и заканчивая реал-тайм трансформером. Она сочетает деформируемое внимание для эффективности с предобученной основой DINOv2 для адаптивности. Эта архитектура преодолевает ограничения предшественников, обеспечивая высокую производительность на малых объектах и в реальном времени.
Китайская компания DeepSeek разработала OCR-модель, которая использует визуальные токены для эффективного хранения информации в ИИ, снижая потребление ресурсов и борясь с "гниением контекста". Это инновационное решение привлекает внимание экспертов и может улучшить работу ИИ-агентов, а также увеличить объем обучающих данных. Однако технология пока находится на ранней стадии и требует дальнейших исследований для динамичного управления памятью.
Компания Aurora расширила сеть беспилотных маршрутов для грузовиков, добавив 600-мильный путь от Форт-Уэрта до Эль-Пасо. Фирма преодолела 100 000 миль автономного пробега и представила улучшенное аппаратное обеспечение. Планы включают расширение до Финикса и производство тысяч машин в партнерстве с Volvo и Aumovio.
Спин-офф Оксфорда RADiCAIT разрабатывает ИИ-технологию для преобразования доступных КТ-сканирований в эквивалент ПЭТ-изображений, делая диагностику рака дешевле и проще. Компания привлекла 1,7 миллиона долларов и готовит 5-миллионный раунд для клинических испытаний. Технология уже тестируется в пилотах с ведущими клиниками и может революционизировать радиологию.
Flux2.cloud предлагает бесплатный и неограниченный доступ к генератору изображений на базе модели Flux.2 от Black Forest Labs. Сервис не требует регистрации или платежей, обеспечивает приватность и поддерживает разнообразные стили. В сравнении с FLUX.1 новая версия предлагает улучшения в детализации, текстах и редактировании.
Компания Sortera использует ИИ для сортировки алюминиевых отходов с точностью более 95%, превращая проблему переработки в источник дохода. Система анализирует фрагменты за миллисекунды с помощью лазеров и камер, что позволяет достигать высокой прибыльности. Фирма расширяется, строя новый завод, и фокусируется на автомобильных отходах для возврата металла в производство.
В публикации объясняется работа сверточных нейронных сетей (CNN) через создание простой модели в Excel. Рассматриваются принципы восприятия изображений машинами, от классического машинного обучения к CNN, включая кросс-корреляцию и фильтры. Это помогает понять фундаментальные вычисления глубокого обучения без сложных инструментов.
World Labs, основанный Фэй-Фэй Ли, выпустил Marble — первую коммерческую модель для генерации редактируемых 3D-миров из текста, изображений и видео. Продукт предлагает гибкие инструменты редактирования и экспорт в различные форматы, опережая конкурентов. Marble ориентирован на геймдев, VFX и VR, с потенциалом для робототехники и дальнейшего развития пространственного интеллекта.
Статья объясняет проблемы традиционного разбора документов в RAG, особенно с таблицами и изображениями, и представляет модель ColPali как решение. ColPali преобразует страницы PDF в изображения и использует мультивекторные встраивания для точного извлечения. Примеры демонстрируют, как это улучшает обработку сложного контента.
Бринн Путнам, основательница Mirror, представила новый стартап Board — игровую консоль, сочетающую настольные и цифровые игры. Устройство с 24-дюймовым сенсорным экраном стоит 500 долларов и использует ИИ для персонализации. Проект уже привлек 15 миллионов долларов инвестиций.
Adobe выпустила ИИ-ассистентов для Express и Photoshop, упрощающих создание и редактирование изображений. В Express реализован специальный режим для текстовых промптов, а в Photoshop ассистент работает в боковой панели и автоматизирует рутинные задачи. Компания также тестирует межприложные ассистенты и интеграцию с ChatGPT, плюс новые ИИ-функции в Creative Cloud.
Приложение для силовых тренировок Ladder интегрирует новую платформу Ladder Nutrition для удобного отслеживания калорий и макронутриентов с использованием ИИ. Пользователи могут фиксировать еду через фото, скан, текст или голос, а система обеспечивает точность даже для международных блюд благодаря партнерствам. Функция дополнена геймификацией и доступна всем подписчикам, что соответствует запросам аудитории.