Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
ИИ-инструменты помогают моделировать сценарии для реки Колорадо, где сток упал на 20% и переговоры провалились. Бюро по рекультивации проводит миллионы симуляций, а новые системы на базе глубокого обучения и эволюционных алгоритмов вроде Borg прогнозируют сток и засухи. Модели выявляют компромиссы, но не решают вопрос распределения потерь между штатами и секторами.
Исследование Google Research и Rochester Institute of Technology выявило, что стандартные бенчмарки ИИ с 3–5 оценщиками игнорируют разнообразие человеческих мнений. Симулятор показал: для надежности нужно более 10 человек на пример и правильное распределение бюджета. Стратегия зависит от метрики — для точности хватит широкого охвата, для разброса ответов требуется глубокая оценка.
Работа вводит фреймворк JIT для моделирования мира на лету, повторяя человеческие симуляции в планировании через симуляцию, поиск и обновление моделей. Тесты в навигации и предсказаниях физики подтвердили эффективность при минимальном использовании памяти. Дальше — динамичные сценарии для ИИ.
Mantis Biotech разрабатывает цифровые двойники человеческого тела на базе синтетических данных, чтобы преодолеть дефицит информации в биомедицине. Платформа использует LLM и физический движок для моделирования редких случаев, предсказания травм у спортсменов и обучения ИИ. Стартап привлёк 7,4 млн долларов и работает с NBA-командой, планируя выход на превентивную медицину.
Трейдеры разбирают надёжность ИИ-инструментов для прогнозов цен на валютных рынках, отличая бэктесты от живой торговли. Описаны архитектуры вроде RNN, CNN, трансформеров, метрики типа directional accuracy, MAE, RMSE и calibration. Подчёркнуты риски overfitting, latency, slippage и нужда в риск-менеджменте с человеческим контролем.
Два энтузиаста горных лыж, Брайан Аллегретто и Джоэл Гратц, основали OpenSnow — сервис точных прогнозов снега на основе госданных и опыта. Они разработали ИИ-модель PEAKS, которая даунскейлит прогнозы до 3 км и повышает точность на 50%. Из email-листа на 37 человек выросла аудитория в 500 тысяч с высокой лояльностью.
General Motors обучает ИИ для автономного вождения в симуляциях в 50 000 раз быстрее реального времени, используя Boxworld, VLA-модели и синтетические данные для длинного хвоста сценариев. Подход сочетает высокодетализированные симуляции, adversarial тесты и дистилляцию политики, снижая риски столкновений на 30%. Это создает основу для полностью надежных систем.
Глобальное исследование Ocorian выявило: 86% семейных офисов с активами на $119,37 млрд используют ИИ для операций и анализа данных. Технология ускоряет выявление аномалий и упрощает compliance, но прямые инвестиции в ИИ составляют всего 7%. Большинство ожидает роста вложений в цифровые активы в ближайшие годы.
Системы RAG развивают LLM, устраняя галлюцинации и проблемы с актуальными знаниями. Статья разбирает семь шагов: от очистки данных и разбиения на чанки до векторизации, хранения, извлечения контекста и генерации ответов. Это позволяет создавать надежные ИИ-приложения на свежих данных.
Команда Qwen из Alibaba разработала алгоритм FIPO, который решает проблему равномерного распределения наград в обучении с подкреплением, удваивая длину цепочек рассуждений до 10 000 токенов и поднимая точность на AIME 2024 до 58%. Модель начинает самостоятельно проверять свои расчеты, обходясь без дополнительных данных CoT. Пока результаты ограничены математикой, но код обещают открыть.
В эпоху инкрементальных улучшений универсальных ИИ прорывы возможны только в доменной специализации, где Mistral AI помогает компаниям персонализировать модели под свои данные и логику. Примеры из софта, автопрома и госсектора показывают автоматизацию задач и суверенность. Стратегия успеха включает ИИ как инфраструктуру, контроль данных и непрерывную адаптацию.
Пять скриптов на Python автоматизируют отбор признаков в машинном обучении: от удаления констант и корреляций до статистических тестов, модельных важностей и рекурсивного исключения. Каждый решает конкретные проблемы вроде шума, дубликатов и взаимодействий. Их комбинация ускоряет создание эффективных моделей.
Naver разработала Seoul World Model — видео-модель на базе 1,2 млн панорам Street View Сеула, которая генерирует реалистичные видео по реальным маршрутам без вымысла. Она решает проблемы с временными объектами, пробелами в данных и накоплением ошибок, обобщаясь на другие города вроде Пусана и Энн-Арбора. Модель превосходит конкурентов и открывает применение в автономном вождении и урбанистике.
RPA эффективно автоматизирует рутинные задачи со структурированными данными, но ИИ позволяет справляться с неструктурированными входами и вариациями. Компании переходят к интеллектуальной автоматизации, комбинируя оба подхода, как делает Blue Prism в составе SS&C. Переход постепенный: существующие RPA-системы дополняют ИИ без полной замены.
Проект vibe-кодинга на Python создал приватного ИИ-аналитика финансов с локальными LLM. Приложение автоматически разбирает CSV разных банков, классифицирует транзакции по правилам, находит аномалии Isolation Forest и генерирует insights через Ollama. Всё работает локально с интерактивными Plotly-графиками в Streamlit.
Андрей Карпати поделился, как автономный агент за ночь улучшил настройку GPT-2 лучше, чем его месяцы ручной работы. Люди теперь bottleneck в ИИ-исследованиях с четкими метриками, и пора автоматизировать процесс. Это соответствует целям ведущих лабораторий.