Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
ИИ-цифровые персоны позволяют экспертам масштабировать себя, создавая цифровых двойников на базе личных данных. Они обрабатывают запросы круглосуточно, фильтруют лиды и сохраняют стиль общения. Реальные примеры из риелторства, HR, образования, консалтинга и VC показывают, как это повышает продуктивность и доходы.
Статья делится десятью практическими выводами по разработке приложений на базе больших языковых моделей для инженеров в отраслях вроде процессов и кибербезопасности. Выводы охватывают этапы от постановки задачи до интеграции и оценки, подчеркивая усиление экспертизы, структуру и реальные тесты. Это поможет избежать типичных ошибок и создать полезные инструменты.
Агентный поиск информации сочетает традиционные методы вроде TF-IDF и современные подходы на базе RAG для эффективного нахождения данных с помощью ИИ-агентов. Статья описывает создание собственной системы RAG, использование управляемых сервисов и интеграцию инструментов поиска в LLM для повышения качества ответов. Такой подход позволяет агентам самостоятельно решать, когда применять поиск, что улучшает результаты в сложных сценариях.
В руководстве описаны семь шагов для создания простой системы retrieval-augmented generation (RAG) с нуля, которая улучшает точность ответов больших языковых моделей за счет извлечения внешних данных. Процесс включает предобработку, разбиение на фрагменты, создание embeddings, хранение в FAISS, поиск, объединение контекста и генерацию ответа с использованием открытой модели. Это позволяет избежать галлюцинаций и обеспечивать актуальную информацию.
Сравнение Graph RAG и SQL RAG на данных Формулы-1 показало высокую эффективность современных LLM в обоих подходах. Новые модели, такие как GPT-5, достигли почти идеальной точности без специальной настройки. Разница между базами данных минимальна, выбор зависит от структуры данных.
Статья объясняет проблемы традиционного разбора документов в RAG, особенно с таблицами и изображениями, и представляет модель ColPali как решение. ColPali преобразует страницы PDF в изображения и использует мультивекторные встраивания для точного извлечения. Примеры демонстрируют, как это улучшает обработку сложного контента.
Системы LLM в роли судей могут вводить в заблуждение уверенными, но ошибочными ответами, искажая результаты на 10–20%. Исследователи создали датасет с ручной разметкой и фреймворк syftr для тестирования конфигураций, выявив оптимальные комбинации моделей и промптов. Это позволяет строить дешевле и точнее gpt-4o-mini, достигая до 96% согласованности с человеческими оценками.
С помощью Bag of Words можно быстро подключить большую языковую модель к SQL-базам и создать ИИ-аналитика для ответов на бизнес-вопросы. Статья описывает шаги развертывания, включая подготовку данных, тестирование и масштабирование, а также типичные вызовы. Это упрощает интеграцию без лишнего кода и помогает получать надежные insights.
NVIDIA и Microsoft объединили усилия для интеграции SQL Server 2025 с моделями Nemotron RAG, позволяя создавать быстрые и защищенные ИИ-приложения на корпоративных данных. Архитектура решает проблемы производительности RAG, упрощает развертывание и обеспечивает гибкость в облаке или локально. Это открывает путь к семантическому поиску и рекомендациям прямо в базе данных.
Инструмент поиска по файлам Google упрощает создание RAG-систем, интегрируясь напрямую в API Gemini и автоматизируя обработку документов. Он поддерживает различные форматы, обеспечивает векторный поиск и встроенные цитаты для верификации. Примеры кода демонстрируют загрузку файлов и запросы, а также управление лимитами и различия с другими инструментами Google.
В третьей части серии о метриках оценки извлечения в RAG рассматриваются градированные меры DCG@k и NDCG@k, которые учитывают спектр релевантности результатов. Объясняется их расчет, преимущества и применение в Python для улучшения конвейеров RAG. Эти метрики позволяют сравнивать качество ранжирования независимо от размера набора результатов.
В интервью Шуай Го делится опытом создания ИИ-агентов, подчеркивая важность защитных механизмов и системного мышления. Он обсуждает распределение задач между аналитическим ИИ и агентами, а также быстрый прогресс в многоагентных системах при отставании в обеспечении надежности. Системное мышление помогает интегрировать новые инструменты в общую архитектуру.
В статье разбираются ключевые метрики для оценки качества извлечения документов в конвейерах RAG: HitRate@k, Recall@k, Precision@k и F1@k. Объясняется их значение, формулы и применение на примере текста 'Войны и мира' с использованием FAISS и OpenAI. Это помогает понять, насколько хорошо векторный поиск находит релевантные фрагменты для последующей генерации ответов.
Статья разбирает инженерию ИИ как расширение традиционной разработки ПО с акцентом на новые уровни сложности. Особое внимание уделяется оценкам (evals) как ключевому инструменту для предотвращения регрессий и обеспечения качества. Рассматриваются типы оценок, методы их реализации и принципы разработки на основе оценок для создания надежных ИИ-приложений.
Показаны все статьи (14)