AI Tools

Стратегия Vanguard по работе с данными для ИИ: инсайты вирту

Забудьте о модных ИИ-моделях. Проект Vanguard 'Виртуальный аналитик' высвечивает суровую реальность: истинное узкое место для корпоративного ИИ — это не вычислительная мощность, а глубоко укоренившиеся 'зоопарки' данных.

{# Always render the hero — falls back to the theme OG image when article.image_url is empty (e.g. after the audit's repair_hero_images cleared a blocked Unsplash hot-link). Without this fallback, evergreens with cleared image_url render no hero at all → the JSON-LD ImageObject loses its visual counterpart and LCP attrs go missing. #}
Схема, иллюстрирующая план Vanguard по созданию 'данных, готовых для ИИ' для решения 'Виртуальный аналитик'.

Key Takeaways

  • Успех корпоративного ИИ зависит от инфраструктуры 'данных, готовых для ИИ', а не только от передовых моделей.
  • Ключевыми для ИИ-инициатив являются междисциплинарное сотрудничество и установление четких моделей владения данными, семантических определений и стандартов качества.
  • Vanguard использовал сервисы AWS, такие как Bedrock, Redshift и Glue, для создания своей архитектуры 'данных, готовых для ИИ'.

Вот что происходит в Кремниевой долине в наши дни: каждый второй пресс-релиз кричит об ИИ. Обычно это замаскированный пересказ использования какой-нибудь модной новой языковой модели для выполнения того, что десятилетиями делал поисковик, только с большим количеством жаргона и более высоким ценником. Поэтому, когда я увидел, что Vanguard — да, тот самый степенный инвестиционный гигант, а не какой-нибудь модный стартап — говорит о своем ‘пути Виртуального аналитика’ и ‘данных, готовых для ИИ’, я поднял бровь. Двадцать лет освещения этого цирка учат смотреть сквозь блеск.

И именно этим и занимались аналитики Vanguard. Представьте, что нужно запросить информацию из сложных финансовых наборов данных. Ваш обычный аналитик? Он не запускал чат-бот. Нет. Он боролся с SQL, писал сложные запросы, на получение ответа уходили дни. Дни. В финансах это вечность. Это не уникальная проблема, заметьте. Компании по всему миру смотрят на горы данных и понимают, что их старые инструменты просто не справляются, когда им нужны быстрые, разговорные инсайты.

Так они решили построить ‘Виртуального аналитика’. Звучит круто, да? Как что-то из фантастического фильма. Но настоящая история, та, что похоронена под шумихой о фундаментальных моделях и сервисах AWS, гораздо более приземленная. Это кропотливая, неприглядная работа по подготовке корпоративных данных к работе с ИИ. На минуту забудьте о ярком самом ИИ; настоящая задача, как обнаружил Vanguard, заключалась в архитектуре данных.

Неужели это очередной корпоративный хайп?

Будем откровенны: здесь блестящий объект — это разговорный ИИ. Но команда Vanguard сама наткнулась на истину, которую многие компании удобно умалчивают: даже самые умные большие языковые модели хороши настолько, насколько хороши данные, которые им скармливают. Нельзя просто направить модный ИИ на вашу беспорядочную, разрозненную, десятилетней давности базу данных и ожидать блестящих, точных ответов. Это как ожидать, что шеф-повар Мишлен приготовит изысканное блюдо, используя только ингредиенты из мусорного бака. Нет, вам нужен фундамент. А для Vanguard это означало построение ‘данных, готовых для ИИ’.

Вся эта установка больше похожа не на революцию, а на необходимую эволюцию, пусть и одетой в ИИ-терминологию. Настоящая победа, та, которая реально приносит деньги (а поверьте, это всегда главный вопрос), заключается в том, делает ли это их аналитиков более эффективными, а процесс принятия решений — более быстрым. В статье намекают на ‘измеримые бизнес-результаты’, но в мельчайших деталях всегда какая-то неясность, не так ли?

Когда разрозненные данные наносят удар

Самым большим препятствием был не выбор правильного сервиса AWS или самой передовой фундаментальной модели. Нет, это было нечто гораздо более прозаическое: сотрудничество. Vanguard собрал вместе инженеров данных, бизнес-аналитиков, офицеров по комплаенсу, специалистов по безопасности и реальных бизнес-пользователей. Зачем? Потому что каждая группа держит в руках ключевой фрагмент головоломки. Инженеры знают ‘трубы’, аналитики знают, что означают цифры в реальных финансовых терминах, а комплаенс гарантирует, что вы не попадете на первую полосу по неправильным причинам. Этот междисциплинарный балет — то место, где происходит магия, или, по крайней мере, функциональность.

Без четких моделей владения, семантических определений и стандартов качества, которые могли бы понимать и поддерживать все команды, у ИИ-решения не было бы хорошего фундамента.

Эта цитата, вот она. В этом суть. Дело не в ИИ; дело в управлении, ясности и общем понимании того, что представляют собой данные. Этот проект, очевидно, стал катализатором для улучшения процессов, что замечательно, но давайте не будем притворяться, что это нечто совершенно новое. Это просто взятие вековой проблемы управления данными и наклеивание на нее ярлыка ИИ.

Технологический стек: AWS, очевидно

Естественно, они опирались на AWS. Потому что кто же в наши дни этого не делает? Amazon Bedrock для фундаментальных моделей (мозг, по слухам), Bedrock Guardrails, чтобы конфиденциальные финансовые данные не разбрелись, DynamoDB для сохранения истории чатов (кто захочет потерять свой ИИ-разговор?), S3 для хранения, SageMaker для экспериментов, Redshift для хранилища данных и Glue для каталогизации. Это стандартный корпоративный набор инструментов для всех, кто пытается управлять данными в масштабе. Впечатляет не выбор сервисов, а их применение для того, чтобы данные заговорили на языке, понятном ИИ.

Они продвигают восемь руководящих принципов для этих ‘данных, готовых для ИИ’. И, честно говоря, они звучат как здравый смысл в области управления данными, одетый в новый наряд. Создание четких продуктов данных. Обеспечение качества данных. Управление метаданными. Сделать данные обнаруживаемыми. Предоставление семантического контекста. Управление доступом. Обеспечение безопасности и соответствия требованиям. Оптимизация производительности. Это основа любой хорошей стратегии работы с данными, ИИ или нет. Новизна заключается в том, как они представляют это как предварительное условие для ИИ, что, надо признать, абсолютно верно.

Но кто здесь на самом деле зарабатывает? AWS, например, продавая свои облачные услуги. И, возможно, Vanguard, если этот ‘Виртуальный аналитик’ действительно выдаст лучшие инвестиционные стратегии или сократит операционные расходы. Консультанты, которые помогли им все это настроить? Определенно. А для рядового финансового аналитика? Надеюсь, его работа стала немного менее утомительной и намного более информативной. Но сам ИИ? Это инструмент, очень дорогой инструмент, который требует массивных инвестиций в свою ‘инфраструктуру’.


🧬 Связанные материалы

Часто задаваемые вопросы

Что на самом деле делает Виртуальный аналитик Vanguard?

Виртуальный аналитик Vanguard — это инструмент на базе ИИ, разработанный для предоставления финансовым аналитикам более быстрого и прямого доступа к сложным финансовым данным. Вместо написания сложных SQL-запросов, на которые уходят дни, аналитики могут задавать вопросы на естественном языке и получать немедленные ответы, повышая эффективность и скорость принятия решений.

Заменит ли этот ИИ финансовых аналитиков?

Статья не предполагает прямой замены. Вместо этого она позиционирует Виртуального аналитика как инструмент, расширяющий возможности аналитиков, освобождая их от утомительных задач по извлечению данных, чтобы они могли сосредоточиться на более ценном анализе и принятии решений. Акцент делается на повышении эффективности, а не на сокращении штата.

Что такое ‘данные, готовые для ИИ’?

‘Данные, готовые для ИИ’ — это данные, которые были структурированы, каталогизированы и контекстуализированы таким образом, чтобы сделать их легкодоступными и понятными для систем искусственного интеллекта. Это включает создание четких продуктов данных, обеспечение высокого качества данных, управление метаданными и предоставление семантического контекста, по сути, подготовку фундамента данных для надежного и точного функционирования ИИ-инструментов.

Written by
theAIcatchup Editorial Team

AI news that actually matters.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by AWS Machine Learning Blog