고객사는 생성형 AI 기반 수학 학습 플랫폼을 운영하는 에듀테크 스타트업으로, 사진 인식·풀이 설명·개인화 문제은행 등 혁신적인 기능을 제공하며 빠르게 성장했습니다. 하지만 사용자가 급격히 늘고 AI 파이프라인이 복잡해지면서, OCR 정확도 저하·AI 추론 지연·실시간 서비스 확장성 한계·운영 비용 급증 같은 문제가 본격화되었습니다.
위시켓은 AWS 기반 서버리스 아키텍처와 MLOps 파이프라인을 도입해 성능과 비용을 동시에 최적화했습니다. 그 결과 OCR 정확도와 응답 속도가 크게 개선되었고, 실시간 서비스 안정성과 비용 효율성을 확보했으며, 데이터 기반 학습 사이클까지 가속화되어 사용자 만족도와 비즈니스 성과 모두에서 눈에 띄는 성과를 달성했습니다.
생성형 AI 기반 수학 서비스 플랫폼을 운영하는 에듀테크 스타트업인 고객사는 혁신적인 학습 경험을 제공하고 있습니다. 학생들이 수학 문제를 사진으로 찍으면 AI가 자동으로 문제를 인식하고 해결 과정을 단계별로 설명하며, 개념 이해를 위한 유사 문제와 영상 콘텐츠까지 제공합니다.
더 나아가 실시간 질의응답 서비스와 개인별 맞춤형 문제은행 구축 기능을 통해 완전히 새로운 차원의 개인화 학습을 구현하고 있습니다. 하지만 급격히 증가하는 사용자와 복잡해지는 AI 파이프라인으로 인해 성능과 비용 최적화가 시급한 과제가 되었습니다.
수학 문제 인식의 핵심인 OCR 처리가 가장 큰 걸림돌이었습니다. 특히 수식이 포함된 수학 문제는 일반적인 텍스트와 달리 복잡한 기호, 분수, 제곱근, 적분 기호 등을 정확히 인식해야 하는데, 기존 범용 OCR 솔루션으로는 한계가 있었습니다.
손글씨로 작성된 문제나 인쇄 품질이 낮은 교재에서는 인식률이 60%까지 떨어져 사용자 경험을 크게 저하시켰습니다. 더욱이 모든 OCR 처리가 동기적으로 실행되어, 복잡한 수식이 포함된 문제 하나를 처리하는 동안 다른 사용자들이 대기해야 하는 상황이 빈발했습니다.
핵심 경쟁력인 AI 기반 문제 해결 기능에서 심각한 성능 이슈가 발생했습니다. 문제 해석, 풀이 생성, 개념 설명, 유사 문제 추천 등 각 단계마다 별도의 AI 모델을 순차적으로 호출하다 보니 전체 응답 시간이 15-30초까지 늘어났습니다.
특히 방과 후 시간대(오후 4-8시)에 동시 접속자가 집중되면서 EC2 인스턴스의 GPU 리소스가 포화상태에 이르렀고, 이로 인해 AI 추론 비용이 예상보다 300% 증가하는 상황이 발생했습니다. 게다가 AI 모델별로 필요한 컴퓨팅 리소스가 달랐지만, 모든 모델이 동일한 인스턴스에서 실행되어 리소스 낭비가 심각했습니다.
사용자가 실시간으로 질문을 올리고 영상 답변을 받는 서비스는 고객사의 차별화 포인트였지만, 기술적 구현에서 한계에 부딪혔습니다. 질문이 몰리는 시간대에는 응답 대기시간이 5분을 넘어서면서 사용자 이탈이 급증했고, 영상 생성과 스트리밍 처리를 위한 인프라 비용도 감당하기 어려운 수준까지 올라갔습니다. 특히 개인별 문제은행 구축을 위한 자동 분류 및 편집 기능에서 처리 실패가 빈번해지면서 서비스 신뢰도에도 악영향을 미쳤습니다.
AI 모델 성능 향상을 위해서는 지속적인 학습 데이터 수집과 모델 재훈련이 필수적이었지만, 기존 시스템에서는 이러한 MLOps 워크플로가 체계적으로 구축되지 않았습니다. 사용자가 업로드한 수학 문제 이미지, OCR 결과, AI 생성 답변, 사용자 피드백 등 다양한 형태의 데이터가 산재되어 있었지만, 이를 통합적으로 분석하고 모델 개선에 활용할 수 있는 파이프라인이 부재했습니다.
결과적으로 풍부한 사용자 데이터를 보유하고 있음에도 불구하고 AI 모델의 지속적인 개선은 이루어지지 못하는 악순환이 반복되었습니다.
OCR 처리의 병목을 해결하기 위해 완전히 새로운 접근 방식을 도입했습니다. Amazon Textract를 기반으로 하되, 수학 특화 전처리 Lambda 함수를 개발하여 이미지 품질을 최적화하고 수식 영역을 사전 식별하는 파이프라인을 구축했습니다.
사용자가 문제 이미지를 업로드하면 S3 이벤트가 트리거되어 다음과 같은 단계로 처리됩니다
이를 통해 OCR 정확도를 85%까지 끌어올렸고, 비동기 처리로 사용자 대기시간도 실질적으로 제로에 가깝게 단축했습니다.
AI 모델 처리의 근본적인 문제를 해결하기 위해 모델별 특화된 실행 환경을 구축했습니다. Lambda 함수를 활용한 서버리스 추론과 EC2 기반 GPU 인스턴스를 하이브리드로 조합하여 각 모델의 특성에 맞는 최적화를 실현했습니다.
실시간 질의응답 서비스의 확장성 문제를 해결하기 위해 이벤트 기반 아키텍처를 도입했습니다. 사용자 질문부터 영상 답변 생성까지의 전 과정을 마이크로서비스로 분해하여 각각을 독립적으로 스케일링할 수 있도록 설계했습니다.
SNS/SQS 조합을 통해 질문 접수, 답변 생성, 영상 편집, 스트리밍 준비 등 각 단계를 비동기적으로 처리하며, 사용자에게는 WebSocket을 통해 실시간 진행 상황을 알려줍니다. 이를 통해 피크 시간 처리 능력을 10배 향상시키고, 평균 응답 시간을 2분 이내로 단축했습니다.
AI 모델의 지속적인 개선을 위한 완전 자동화된 MLOps 파이프라인을 구축했습니다. 모든 사용자 상호작용 데이터를 S3 데이터 레이크에 수집하고, 주기적으로 모델 성능을 평가하여 필요시 자동으로 재훈련을 수행합니다.
AI 중심의 아키텍처 최적화를 통해 기술, 사용자 경험, 비즈니스 전반에 걸쳐 괄목할 만한 성과를 달성했습니다.
기술적 관점에서 OCR 정확도가 크게 향상되어 문제 인식의 신뢰성을 확보했으며, AI 추론 응답시간이 수십 초에서 수 초 단위로 단축되어 사용자 대기시간이 현저히 줄어들었습니다. 실시간 질의응답 서비스의 응답 속도 역시 대폭 개선되었고, 서버리스 아키텍처 도입으로 AI 인프라 비용을 절반 가까이 절감하면서도 시스템 가용성은 오히려 향상되는 결과를 얻었습니다.
사용자 경험 측면에서는 OCR 정확도 개선에 따른 문제 인식 성공률이 높아져 서비스 신뢰도가 크게 향상되었습니다. 이는 앱 세션 지속시간의 증가로 이어졌으며, 일일 활성 사용자 수가 배 이상 증가하는 등 사용자 참여도가 눈에 띄게 개선되었습니다. 전반적인 사용자 만족도 역시 보통 수준에서 매우 우수한 수준으로 상승했습니다.
비즈니스 성과로는 월간 처리 가능한 문제 수가 수배 증가하여 서비스 확장성을 확보했으며, 개인 문제은행 등록률이 비약적으로 상승하여 사용자 정착률이 크게 개선되었습니다. 특히 실시간 질의응답 서비스 이용률이 급증하면서 프리미엄 기능 활용도가 높아졌고, 이는 월 구독자 전환율의 대폭적인 상승으로 이어져 비즈니스 수익성이 크게 향상되었습니다.
AI 모델 개선 사이클이 월 단위에서 주 단위로 단축되어 빠른 서비스 개선이 가능해졌습니다. 특히 MLOps 파이프라인을 통해 사용자 피드백이 실시간으로 모델 훈련에 반영되어, AI의 수학 문제 해결 능력이 지속적으로 향상되고 있습니다.
무엇보다 개발팀이 인프라 관리보다는 AI 알고리즘과 교육 콘텐츠 개발에 집중할 수 있게 되어, 혁신적인 기능들을 더 빠르게 출시할 수 있게 되었습니다. 앞으로는 개인별 학습 패턴 분석을 통한 맞춤형 문제 추천, 실시간 학습 상태 진단 등 더욱 지능적인 AI 튜터 서비스로 발전시켜 나갈 계획입니다.
위시켓은 기업에 필요한 IT 아웃소싱, 채용, SW 조달 등 SW 업무 프로젝트와 관련된 모든 서비스를 제공하는 슈퍼 플랫폼입니다. 한국의 스타트업부터 글로벌 대기업까지 위시켓은 빠르게 성장하는 10만 개 이상의 기업들의 디지털 혁신에 참여하고 있습니다.
위시켓은 AWS의 공식 파트너로서 기업들의 IT 서비스 운영 상황에 맞는 클라우드 여정을 지원합니다. 각 기업의 규모와 요구사항에 맞춰, AWS의 최신 기술과 서비스를 활용한 맞춤형 솔루션으로 기업들이 빠르게 변화하는 시장 환경에서 경쟁력을 유지할 수 있도록 지속적으로 지원하고 있습니다.