Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Стартап MyHair AI использует искусственный интеллект для анализа фото головы и выявления ранних признаков выпадения волос. Сервис предлагает персонализированные планы ухода, подбор продуктов и доступ к проверенным специалистам. Продукт уже обработал сотни тысяч снимков и привлекает тысячи пользователей, отличаясь специализированной моделью ИИ.
Google разрабатывает Nano Banana 2 — продвинутую модель ИИ для генерации изображений в экосистеме Gemini, которая обещает революционные улучшения в реализме и контроле. Эта версия способна самостоятельно исправлять ошибки, генерировать 4K-изображения и точно отображать сложные элементы, что может изменить подходы в маркетинге и дизайне. Однако рост реализма вызывает опасения по поводу дипфейков и необходимости осторожности в онлайн-контенте.
В публикации объясняется работа сверточных нейронных сетей (CNN) через создание простой модели в Excel. Рассматриваются принципы восприятия изображений машинами, от классического машинного обучения к CNN, включая кросс-корреляцию и фильтры. Это помогает понять фундаментальные вычисления глубокого обучения без сложных инструментов.
RF-DETR представляет собой эволюцию моделей обнаружения объектов, начиная от DETR и заканчивая реал-тайм трансформером. Она сочетает деформируемое внимание для эффективности с предобученной основой DINOv2 для адаптивности. Эта архитектура преодолевает ограничения предшественников, обеспечивая высокую производительность на малых объектах и в реальном времени.
Adobe обновила свою AI-платформу Firefly, представив модель Image Model 5 для фотореалистичной генерации и интеллектуальных AI-агентов. Эти агенты изучают стиль пользователя и предлагают контекстные правки, превращая творческий процесс в диалог, но также поднимают вопросы об аутентичности и этике.
Спин-офф Оксфорда RADiCAIT разрабатывает ИИ-технологию для преобразования доступных КТ-сканирований в эквивалент ПЭТ-изображений, делая диагностику рака дешевле и проще. Компания привлекла 1,7 миллиона долларов и готовит 5-миллионный раунд для клинических испытаний. Технология уже тестируется в пилотах с ведущими клиниками и может революционизировать радиологию.
Backstory — экспериментальный ИИ-инструмент от Google, помогающий анализировать контекст и происхождение онлайн-изображений. Он определяет ИИ-генерацию, историю использования и возможные изменения, предоставляя отчёты для осознанного восприятия контента. Разработка ведётся с акцентом на комплексную оценку надёжности и сотрудничество с экспертами.
Визуальные языковые модели, такие как Qwen 3 VL, позволяют эффективно обрабатывать изображения и текст, превосходя традиционные методы OCR. Статья демонстрирует их применение для распознавания символов и извлечения данных из документов, а также обсуждает ограничения. Эти модели открывают новые перспективы в анализе визуальной информации.
Команда Things, Inc. выпустила Mixup — iOS-приложение для генерации ИИ-изображений с помощью шаблонных "рецептов" на базе фото, текста или рисунков. Оно превращает сложный процесс в игру, позволяя делиться подсказками в публичной ленте и использовать чужие фото для mashup'ов. Приложение использует модели Google и OpenAI, с модерацией и кредитной системой для генерации.
Автоматическое распознавание листьев растений с использованием глубоких эмбеддингов и евклидова сходства позволяет эффективно идентифицировать виды по изображениям. На основе датасета UCI One-Hundred Plant Species Leaves модель ResNet-50 достигает высокой точности, демонстрируя применение в экологии, сельском хозяйстве и образовании. Система включает предобработку, извлечение признаков и анализ, обеспечивая воспроизводимость и интерпретируемость результатов.
В этой статье разбирается использование второй производной изображения для обнаружения краев с помощью оператора Лапласа. Рассматриваются дискретные приближения, влияние шума и роль гауссова фильтра для повышения устойчивости. Показана реализация в OpenCV с примерами кода и визуализацией результатов.
Китайская компания DeepSeek разработала OCR-модель, которая использует визуальные токены для эффективного хранения информации в ИИ, снижая потребление ресурсов и борясь с "гниением контекста". Это инновационное решение привлекает внимание экспертов и может улучшить работу ИИ-агентов, а также увеличить объем обучающих данных. Однако технология пока находится на ранней стадии и требует дальнейших исследований для динамичного управления памятью.
Adobe выпустила ИИ-ассистентов для Express и Photoshop, упрощающих создание и редактирование изображений. В Express реализован специальный режим для текстовых промптов, а в Photoshop ассистент работает в боковой панели и автоматизирует рутинные задачи. Компания также тестирует межприложные ассистенты и интеграцию с ChatGPT, плюс новые ИИ-функции в Creative Cloud.
В старшей школе Кенвуд в Мэриленде система ИИ ошибочно идентифицировала пакет Doritos как оружие, что привело к задержанию ученика Таки Аллена. Директор Кэти Смит отменила сигнал, но инцидент все равно дошел до полиции. Компания Omnilert выразила сожаление, подтвердив работоспособность системы.
Платформа ChatUp AI предлагает уникальный генератор видео из NSFW-изображений без цензуры, позволяя анимировать взрослый контент в высоком качестве. Сервис обеспечивает анонимность, бесплатный доступ и реалистичную анимацию, делая его идеальным для творческих экспериментов. Это решение выделяется на фоне строгих альтернатив, предоставляя свободу для воплощения идей.
Искусственный интеллект открывает новые возможности для предсказания сердечных приступов через анализ КТ-сканирований на наличие кальция в коронарных артериях. Стартапы вроде Bunkerhill Health и Nanox.AI разрабатывают алгоритмы, которые выявляют скрытые риски у миллионов пациентов. Однако технология сталкивается с вызовами в плане внедрения, этических вопросов и доказанной эффективности на популяционном уровне.