요즘 실리콘밸리 말이죠. 여기저기서 AI 신제품 소식이 들려옵니다. 하지만 대부분은 수십 년 전 검색 엔진이 했던 일을 그저 더 어렵고 비싼 용어로 포장한 것에 불과하죠. 그런데 뱅가드, 네, 그 보수적인 투자 거물 뱅가드가 ‘가상 애널리스트 여정’과 ‘AI 준비 데이터’에 대해 이야기하길래 눈길이 갔습니다. 이 업계에서 20년을 굴러먹다 보니, 번쩍이는 겉치레 뒤를 보는 눈이 생겼거든요.
뱅가드 애널리스트들이 바로 그런 일을 하고 있었습니다. 복잡한 금융 데이터셋에 대해 질문해야 한다고 상상해 보세요. 일반적인 애널리스트라면? 챗봇을 띄우는 게 아니었습니다. 맙소사. 그들은 SQL과 씨름하며 복잡한 쿼리를 작성했고, 답변을 얻는 데 며칠씩 걸렸습니다. 며칠이요. 금융 업계에서 이건 영원에 가깝습니다. 이게 뱅가드만의 문제는 아니죠. 전 세계 수많은 기업들이 쌓여있는 데이터 더미를 보며, 빠르고 대화식 인사이트를 얻으려면 기존 도구로는 어림도 없다는 사실을 깨닫고 있습니다.
그래서 ‘가상 애널리스트’를 만들기로 했습니다. 뭔가 있어 보이죠? SF 영화에 나올 법한. 하지만 파운데이션 모델이나 AWS 서비스에 대한 떠들썩한 이야기 뒤에 숨겨진 진짜 이야기는 훨씬 현실적입니다. 바로 기업 데이터를 AI에 적합하게 만드는, 지루하고 땀 나는 작업이죠. 일단 화려한 AI 자체는 잠시 접어두고요. 뱅가드가 발견한 실제 과제는 바로 데이터 아키텍처였습니다.
그냥 기업들의 허풍은 아닐까?
분명히 말하지만, 여기서 주목해야 할 것은 대화형 AI입니다. 하지만 뱅가드 팀 스스로도 많은 기업들이 슬쩍 넘어가는 진실을 발견했습니다. 아무리 똑똑한 LLM(대규모 언어 모델)이라도 결국 입력되는 데이터의 질에 따라 결과가 결정된다는 것입니다. 엉망진창이고, 사일로화되어 있으며, 수십 년 된 데이터베이스에 최첨단 AI를 갖다 대고 훌륭하고 정확한 답변을 기대할 수는 없습니다. 쓰레기통에서 주워온 재료로 미슐랭 셰프가 고급 요리를 만들길 기대하는 것과 같죠. 아니요, 기반이 필요합니다. 그리고 뱅가드에게 그 기반은 ‘AI 준비 데이터’를 구축하는 것이었습니다.
이 모든 것이 혁신이라기보다는, AI라는 옷을 입었을 뿐 꼭 필요한 진화처럼 느껴집니다. 진짜 승자는 물론 돈을 버는 쪽이겠죠. (믿으세요, 항상 그게 문제니까요.) 이로 인해 애널리스트들이 더 효율적으로 일하고 의사결정이 빨라졌는지 여부입니다. 이 글에서는 ‘측정 가능한 비즈니스 성과’를 암시하지만, 세부적인 내용은 항상 좀 모호하죠, 그렇죠?
데이터 사일로의 공격
가장 큰 장애물은 올바른 AWS 서비스나 최첨단 파운데이션 모델을 선택하는 것이 아니었습니다. 아니요, 훨씬 더 평범한 것이었습니다. 바로 협업이었죠. 뱅가드는 데이터 엔지니어, 비즈니스 애널리스트, 규제 담당자, 보안 전문가, 그리고 실제 비즈니스 사용자를 한자리에 모았습니다. 왜냐고요? 각 그룹이 퍼즐의 중요한 조각을 쥐고 있기 때문입니다. 엔지니어는 파이프라인을 알고, 애널리스트는 숫자가 실제 금융 용어로 무엇을 의미하는지 알고, 규제 담당자는 잘못된 이유로 헤드라인에 오르지 않도록 보장합니다. 이 기능 간의 발레가 바로 마법, 혹은 적어도 기능이 작동하는 곳입니다.
명확한 소유권 모델, 의미론적 정의, 모든 팀이 이해하고 기여할 수 있는 품질 표준 없이는 AI 솔루션이 좋은 기반을 갖지 못했을 것입니다.
바로 그 인용문입니다. 그것이 핵심입니다. AI 자체에 관한 것이 아니라, 거버넌스, 명확성, 그리고 데이터가 무엇인지에 대한 공유된 이해에 관한 것입니다. 이 프로젝트는 더 나은 프로세스의 촉매제가 되었다고 하는데, 좋습니다. 하지만 이것이 완전히 새로운 것이라고 생각하지는 맙시다. 단순히 오래된 데이터 관리 문제를 AI라는 라벨을 붙인 것뿐입니다.
기술 스택: 당연히 AWS
당연히 AWS에 의존했습니다. 요즘 누가 안 그렇겠어요? 파운데이션 모델(두뇌라고 주장되는)을 위한 Amazon Bedrock, 민감한 금융 데이터가 유출되지 않도록 하는 Bedrock Guardrails, 대화 지속성을 위한 DynamoDB(AI 대화를 잃고 싶지 않으니까요), 스토리지용 S3, 실험을 위한 SageMaker, 데이터 웨어하우스를 위한 Redshift, 그리고 카탈로깅을 위한 Glue. 대규모 데이터를 다루려는 기업이라면 누구나 사용하는 표준 기업 도구 모음입니다. 인상적인 것은 서비스 선택이 아니라, 데이터를 AI가 이해할 수 있는 언어로 말하게 만드는 적용 방식입니다.
그들은 이 ‘AI 준비 데이터’를 위한 여덟 가지 지침 원칙을 내세우고 있습니다. 솔직히 말하면, 새로운 옷을 입은 당연한 데이터 거버넌스처럼 들립니다. 명확한 데이터 제품 수립. 데이터 품질 보증. 메타데이터 관리. 데이터 검색 가능성 확보. 의미론적 컨텍스트 제공. 접근 제어. 보안 및 규정 준수 보장. 성능 최적화. AI든 아니든, 이는 모든 좋은 데이터 전략의 기초입니다. 새로운 점은 이를 AI의 전제 조건으로 프레임화한다는 것인데, 솔직히 말해서 절대적으로 그렇습니다.
그럼 여기서 누가 진짜 돈을 벌고 있을까요? AWS는 분명히 클라우드 서비스를 판매하고 있습니다. 그리고 아마도 뱅가드도 이 ‘가상 애널리스트’가 실제로 더 나은 투자 전략을 생성하거나 운영 비용을 절감한다면 말이죠. 그것을 설정하는 데 도움을 준 컨설턴트들은요? 분명히요. 일반 금융 애널리스트에게는? 그들의 일이 조금 덜 지루하고 훨씬 더 통찰력 있게 되기를 바랍니다. 하지만 AI 자체는요? 엄청난 투자가 필요한, 매우 비싼 도구일 뿐입니다.
🧬 관련 인사이트
- 더 보기: Swagger vs Postman: 개발자의 팁으로 API 테스트 허점을 드러내다
- 더 보기: Google Lyria 3, Gemini에 상륙: AI 징글인가, 음악의 종말인가?
자주 묻는 질문
뱅가드의 가상 애널리스트는 실제로 무엇을 하나요?
뱅가드의 가상 애널리스트는 금융 애널리스트에게 복잡한 금융 데이터에 더 빠르고 직접적으로 접근할 수 있도록 설계된 AI 기반 도구입니다. 며칠씩 걸리는 복잡한 SQL 쿼리를 작성하는 대신, 애널리스트는 자연어로 질문하고 즉각적인 답변을 받을 수 있어 효율성과 의사결정 속도를 향상시킵니다.
이 AI가 금융 애널리스트를 대체할까요?
이 기사는 직접적인 대체 가능성을 시사하지 않습니다. 대신, 가상 애널리스트를 애널리스트의 역량을 강화하는 도구로 보고, 지루한 데이터 검색 작업에서 벗어나 더 높은 가치의 분석 및 의사결정에 집중할 수 있도록 합니다. 인력 감축보다는 효율성 향상에 중점을 둡니다.
‘AI 준비 데이터’란 무엇인가요?
‘AI 준비 데이터’는 인공지능 시스템이 쉽게 접근하고 이해할 수 있도록 구조화, 카탈로깅 및 컨텍스트화된 데이터를 의미합니다. 여기에는 명확한 데이터 제품 수립, 높은 데이터 품질 보장, 메타데이터 관리, 의미론적 컨텍스트 제공이 포함되며, 본질적으로 AI 도구가 안정적이고 정확하게 작동하기 위한 데이터 기반을 준비하는 것입니다.