глубокое-обучение

61 публикаций по теме

глубокое-обучение

Sarvam представила новые открытые модели ИИ

Индийская лаборатория Sarvam выпустила модели ИИ с 30 и 105 миллиардами параметров, рассчитывая на успех открытых решений против гигантов. Новинки обучены с нуля на огромных объемах данных индийских языков и предназначены для голосовых ассистентов и чатов. Компания фокусируется на практических задачах и планирует open-source публикацию.

3 мин

18 февраля 2026 г.

Статьи

Крипторынки как полигон для ИИ-прогнозов

Рынки криптовалют служат идеальным полигоном для тестирования ИИ-моделей прогнозирования благодаря реал-тайм данным блокчейна и децентрализованным сетям. Нейросети вроде LSTM и гибридные системы анализируют цены, настроения и транзакции, эволюционируя от реактивных ботов к предвидящим агентам. DePIN решает проблемы вычислений, но остаются вызовы с галлюцинациями и масштабированием.

4 мин

9 февраля 2026 г.

Статьи

5 моделей для прогнозирования временных рядов

Фундаментальные модели меняют подход к прогнозированию временных рядов, предлагая zero-shot точность без дообучения. Мы разбираем пять сильных вариантов: Chronos-2, TiRex, TimesFM, Granite TTM R2 и Toto Open Base 1. Каждая подходит для разных задач — от одномерных до высокомерных с ковариатами.

5 мин

3 февраля 2026 г.

Статьи

5 прорывов в графовых нейронных сетях на 2026 год

Графовые нейронные сети (GNN) продолжают эволюционировать: от динамических моделей для реального времени до интеграции с большими языковыми моделями и усиленной защиты. Эти пять прорывов помогут решить задачи в рекомендациях, химии, безопасности и многом другом. Они уже меняют подходы к анализу сложных данных.

5 мин

24 января 2026 г.

Статьи

Параметры LLM: что это и как они работают

Параметры — основа больших языковых моделей: эмбеддинги кодируют слова, веса и смещения обрабатывают контекст, нейроны организуют расчеты. Обучение настраивает миллиарды значений для генерации текста. Маленькие модели догоняют крупные за счет данных, дистилляции и смеси экспертов.

12 мин

7 января 2026 г.

Новости

Nemotron 3 от Nvidia: гибрид для эффективных ИИ-агентов

Nvidia представила линейку Nemotron 3 с гибридной архитектурой Mamba и Transformer для ИИ-агентов, способных работать с контекстом в миллион токенов без перерасхода ресурсов. Версия Nano уже доступна с открытыми весами и датасетами, а Super и Ultra принесут улучшения вроде LatentMoE и multi-token prediction. Это вписывается в тренд компании на быстрые компактные модели.

3 мин

17 декабря 2025 г.

Статьи

5 критических ошибок в инженерии признаков, которые губят ML-проекты

Инженерия признаков — ключевой этап в машинном обучении. Статья рассматривает пять критических ошибок: утечку данных мультиколлинеарность неправильное таргет-кодирование неправильное управление выбросами и несоответствие модели данным Эти проблемы часто приводят к провалу проектов даже с хорошими алгоритмами.

18 мин

14 декабря 2025 г.

Новости

ИИ звучит как человек, но теряет смысл

Ученые из Цюрихского университета обнаружили что текст созданный искусственным интеллектом можно надежно отличить от текста написанного человеком Попытки сделать модели более естественными часто приводят к потере точности

4 мин

13 декабря 2025 г.

Новости

Новые RRAM обойдут стену памяти

Ученые из Калифорнийского университета в Сан-Диего создали новый тип RRAM без нитей, который позволяет выполнять матричные операции ИИ прямо в памяти и стековать в 8 слоев по 40 нм. Массив на 1 КБ показал 90% точности в непрерывном обучении на данных сенсоров, идеально для edge-устройств. Однако остается вызов с удержанием данных при высоких температурах.

5 мин

9 февраля 2026 г.

Новости

AlphaGenome расшифровывает некодирующую ДНК

Google DeepMind представил AlphaGenome — ИИ-инструмент для анализа некодирующей ДНК, которая составляет 98% генома и управляет регуляцией генов. Модель предсказывает 11 биологических сигналов на уровне одной пары оснований и обрабатывает участки до миллиона букв ДНК. Это помогает в исследованиях рака, редких болезней и разработке лекарств.

6 мин

4 февраля 2026 г.

Статьи

Что такое параметр в машинном обучении?

Параметры — внутренние настройки моделей машинного обучения, определяющие их работу и качество предсказаний. Статья разбирает, как они выглядят, сколько их бывает и какие проблемы возникают при обучении. Понимание параметров помогает лучше ориентироваться в машинном обучении.

5 мин

2 февраля 2026 г.

Новости

Новая техника DeepSeek стабилизирует ИИ-модели

Команда DeepSeek разработала mHC — улучшенную версию Hyper-Connections, которая математически ограничивает усиление сигналов и стабилизирует обучение больших моделей. Тесты на моделях до 27 миллиардов параметров показали лучшие результаты на бенчмарках BBH и DROP при минимальных накладных расходах. Это открывает перспективы для дальнейших экспериментов с топологиями сетей.

3 мин

10 января 2026 г.

Новости

StoryMem: память для стабильных ИИ-видео

StoryMem от ByteDance решает проблему нестабильности персонажей в ИИ-видео, храня ключевые кадры в памяти для всех сцен. Система показывает лучшие результаты в тестах по последовательности и эстетике. Модель дообучена с минимальными усилиями и доступна открыто.

4 мин

3 января 2026 г.

Статьи

Появление интроспективной осознанности в больших языковых моделях

Исследование показывает первые признаки интроспективной осознанности у больших языковых моделей (LLM), таких как Claude Opus 4.1. Модели иногда способны распознавать «внедренные» концепции внутри своих нейронных сетей — например, отличать искусственно добавленные «мысли» от реальных входных данных.

5 мин

15 декабря 2025 г.

Статьи

Следующий рубеж в ИИ: не данные, а опыт

Следующий этап развития искусственного интеллекта будет связан не только с увеличением объемов данных но также созданием специализированных сред где модели смогут учиться через взаимодействие эксперименты ошибки Это позволит им лучше адаптироваться сложным реальным сценариям

5 мин

13 декабря 2025 г.

Статьи

Как начать создавать реальные приложения с ИИ в 2025 году

Статья рассматривает основные вопросы и советы для начинающих разработчиков, которые хотят создавать реальные приложения с использованием инструментов искусственного интеллекта.

3 мин

13 декабря 2025 г.

глубокое-обучение

Sarvam представила новые открытые модели ИИ

Крипторынки как полигон для ИИ-прогнозов

5 моделей для прогнозирования временных рядов

5 прорывов в графовых нейронных сетях на 2026 год

Параметры LLM: что это и как они работают

Nemotron 3 от Nvidia: гибрид для эффективных ИИ-агентов

5 критических ошибок в инженерии признаков, которые губят ML-проекты

ИИ звучит как человек, но теряет смысл

Новые RRAM обойдут стену памяти

AlphaGenome расшифровывает некодирующую ДНК

Что такое параметр в машинном обучении?

Новая техника DeepSeek стабилизирует ИИ-модели

StoryMem: память для стабильных ИИ-видео

Появление интроспективной осознанности в больших языковых моделях

Следующий рубеж в ИИ: не данные, а опыт

Как начать создавать реальные приложения с ИИ в 2025 году

Сейчас в тренде

Популярные темы