기본 콘텐츠로 건너뛰기

중소기업 온프레미스 sLLM 구축 가이드: RAG 적용의 두 가지 접근법

나는 현재 생성형 AI를 활용한 검색 서비스를 개발 중이다. 처음에는 메타의 Llama 모델을 사용하다가 최근 알리바바의 Qwen3 모델로 변경하여 RAG(Retrieval-Augmented Generation) 기술을 적용하고 있다. 이 과정에서 나는 RAG의 적용 방식을 두고 개발업체와 의견이 갈리는 경험을 했다.

나의 초기 생각은 'LLM이 가진 기존 지식 + 내부 문서'를 융합하여 더 풍부한 답변을 만드는 것이었다. 하지만 개발업체는 '오직 내부 문서'만으로 답변을 생성하는 것이 RAG의 올바른 방향이라고 주장했다.

이 글은 나의 이런 고민을 정리하고, 중소기업이 온프레미스 환경에서 sLLM(소형 거대 언어 모델)을 구축할 때 고려해야 할 사항, 특히 RAG 적용 방안에 대한 두 가지 접근법을 비교 분석하기 위해 작성해 본다.

LLM 구축


1. 왜 중소기업은 '온프레미스 sLLM'을 고민하는가?

대기업처럼 막대한 자본이 없는 중소기업이 OpenAI의 ChatGPT API를 사용하지 않고, 굳이 복잡한 온프레미스 sLLM 구축을 고민하는 이유는 명확하다.

  • 보안: 가장 결정적인 이유다. 기업의 민감한 내부 데이터를 외부 클라우드 서비스로 전송하지 않고, 우리 회사 서버 안에서만 안전하게 처리할 수 있다.

  • 비용: 초기 구축 비용은 들지만, API 호출당 과금되는 방식이 아니므로 장기적으로 대규모 사용 시 비용을 절감할 수 있다.

  • sLLM의 발전: Llama, Qwen, Mistral 등 오픈소스 sLLM의 성능이 비약적으로 발전하여, 비교적 적은 컴퓨팅 자원으로도 충분히 활용 가능한 수준에 도달했다.

2. RAG 적용의 두 가지 접근법: 당신의 AI는 '창작자'인가, '답변자'인가?

RAG는 LLM이 답변을 생성할 때, 외부 지식 DB(우리의 경우 내부 문서)에서 관련 정보를 '검색(Retrieval)'하여, 그 내용을 '참고(Augmented)'해서 답변을 '생성(Generation)'하는 기술이다. 환각(Hallucination)을 줄이는 핵심 기술이지만, 그 적용 방식에 따라 AI의 역할이 완전히 달라진다.

2.1 접근법 A (개발업체의 제안): 순수 내부 문서 기반 답변 (Grounded Answering) 이 방식에서 LLM은 '제공된 문서의 내용을 충실하게 이해하고 요약하는 답변자'의 역할만 수행한다. LLM이 가진 자체적인 일반 지식은 철저히 배제된다.

  • 장점

    • 환각 최소화: 답변이 100% 내부 문서에 근거하므로, AI가 사실이 아닌 내용을 지어낼 확률이 거의 없다.

    • 정보 출처 명확: 모든 답변은 특정 문서를 근거로 하므로, 답변의 신뢰도를 확보하고 검증하기 쉽다.

  • 단점

    • 제한된 답변 범위: 내가 우려했듯, 내부 문서에 없는 내용을 질문하면 "알 수 없습니다"라고 답변할 수밖에 없다.

    • 답변의 깊이 부족: 참고하는 문서의 내용이 짧으면, AI의 답변 역시 단편적이고 짧아질 수밖에 없다.

2.2 접근법 B (나의 초기 생각): LLM 지식 + 내부 문서 융합 답변 (Creative Answering) 이 방식에서 LLM은 '내부 문서를 중심으로 하되, 자신의 배경지식을 활용하여 내용을 더 풍부하게 만드는 창작자'의 역할을 수행한다.

  • 장점

    • 폭넓은 답변 범위: 내부 문서에 없는 내용이라도, LLM의 일반 지식을 활용하여 어느 정도 답변을 제공할 수 있다.

    • 더 풍부하고 자연스러운 답변: 단순한 요약을 넘어, 추가적인 배경 설명이나 예시를 덧붙여 훨씬 더 깊이 있고 자연스러운 답변을 생성할 수 있다.

  • 단점

    • 환각 발생 가능성 증가: 내부 문서의 사실과 LLM의 (검증되지 않은) 일반 지식이 섞이면서, 그럴듯하지만 사실이 아닌 정보가 생성될 위험이 있다.

    • 정보 출처의 모호성: 답변의 어느 부분이 내부 문서에서 왔고, 어느 부분이 LLM의 자체 지식인지 구분하기 어려워 신뢰도 문제가 발생할 수 있다.

RAG


3. 실무자를 위한 제안: 어떤 접근법을 선택해야 하는가?

결론적으로, 두 접근법 중 어느 하나가 절대적으로 옳은 것은 아니다. 만들고자 하는 '서비스의 목적'에 따라 선택이 달라져야 한다.

  • 접근법 A (내부 문서 기반)가 적합한 경우

    • 서비스 예시: 사내 규정 챗봇, 기술 매뉴얼 검색, 과거 계약서 조회, 고객 지원(CS) 답변 시스템

    • 핵심 요구사항: '정확성'과 '신뢰성'이 무엇보다 중요할 때. AI가 창의성을 발휘하면 안 되는 경우.

  • 접근법 B (융합 기반)가 적합한 경우

    • 서비스 예시: 아이디어 발상 도우미, 시장 조사 보고서 초안 작성, 블로그 글이나 마케팅 문구 생성

    • 핵심 요구사항: '창의성'과 '풍부한 내용'이 더 중요할 때. 약간의 사실관계 오류는 후속 검토로 보완할 수 있는 경우.

[실무자를 위한 샘플 프롬프트 예제] 
LLM의 행동을 통제하는 가장 직접적인 방법은 프롬프트다.

  • 접근법 A를 위한 프롬프트:

    너는 지금부터 '내부 문서 분석 전문가' 역할을 맡는다. 아래에 제공되는 [문서]의 내용만을 기반으로 질문에 답변해야 한다. [문서]에 내용이 없으면, 반드시 '자료에 없는 내용입니다'라고만 답변해라. 절대로 너의 기존 지식을 사용해서는 안 된다.

  • 접근법 B를 위한 프롬프트:

    너는 지금부터 '친절한 비즈니스 분석가' 역할을 맡는다. 아래 [문서]의 내용을 최우선으로 참고하여 질문에 답변하되, 답변을 더 풍부하고 이해하기 쉽게 만들기 위해 너의 일반적인 지식을 활용하여 추가적인 설명을 덧붙여도 좋다. 단, [문서]의 내용과 너의 지식은 명확히 구분하여 설명해라.

4. 결론

온프레미스 sLLM 구축은 단순히 모델을 설치하는 기술적인 문제를 넘어, 우리 회사에 맞는 AI의 역할을 정의하는 전략적인 과정이다. 개발업체와의 논의에서 핵심은 '어떤 RAG가 진짜인가'가 아니라, '우리가 만들 서비스에 어떤 RAG가 더 적합한가'가 되어야 한다.

이러한 명확한 기준을 가지고 접근할 때, 중소기업도 성공적으로 우리만의 생성형 AI 서비스를 구축할 수 있을 것이다.

댓글

이 블로그의 인기 게시물

[볼링 초보 가이드 4탄] 스페어 처리는 '과학'? 볼링 점수 계산법 & 점수 올리는 팁!

지난 1탄부터 3탄까지 볼링의 매력에 푹 빠지고, 장비 고르는 법, 에티켓, 그리고 기본적인 자세와 스텝까지 배웠지? 이제 볼링장에 가서 공을 굴릴 준비는 완벽하다! 으흐흐~ 그런데 말이야, 열심히 공을 굴렸는데 '이게 대체 몇 점이야?', '스트라이크랑 스페어는 점수가 어떻게 계산되는 거야?' 하고 점수판만 멍하니 쳐다보고 있는 사람들이 많을 거야. 핀은 분명 많이 쓰러뜨린 것 같은데 점수는 왜 맨날 그 모양인지... 나도 예전엔 100점 넘는 게 꿈이었는데 말이야. 흠냐~ 걱정 마라! 오늘은 볼링 점수 계산의 비밀을 파헤치고, 네 점수를 쑥쑥 올릴 수 있는 **'스페어 처리의 과학'**과 실질적인 꿀팁들을 풀어줄게! 이거 알면 볼링이 더 재밌어지고, '저 사람 볼링 좀 치는데?' 소리도 더 자주 들을 수 있을 거다! 1. 볼링 점수, 대체 어떻게 계산되는 거야? (초보도 알기 쉽게!) 볼링 점수판을 보면 X, /, - 등 알 수 없는 기호들 때문에 머리가 아팠지? 볼링은 총 10개의 '프레임(Frame)'으로 이루어져 있으며, 각 프레임마다 점수를 계산한다. 기본 원리만 알면 생각보다 간단하다! 프레임 (Frame): 볼링 한 게임은 총 10개의 프레임으로 구성된다. 각 프레임마다 최대 2번의 투구 기회가 주어진다. 점수 기본: 쓰러뜨린 핀 수만큼 점수를 얻는다. (예: 5개 쓰러뜨리면 5점) 스페어 (Spare - / 표시): 한 프레임에서 두 번의 투구 만에 10개의 핀을 모두 쓰러뜨린 경우를 '스페어'라고 한다. 보너스 점수: 스페어는 그냥 10점이 아니다! 다음 프레임의 첫 번째 투구에서 쓰러뜨린 핀 수만큼 보너스 점수를 더해준다. 예시: 스페어 후 다음 투구에서 7개를 쓰러뜨렸다면, 그 스페어 프레임의 점수는 10(핀) + 7(보너스) = 17점 이 된다.  핵심!: 스트라이크에만 목맬 필요 없다. '스페어 처리는 곧 점수다!' 스페어만...

제주도 탐나는전 결제 사용 후기 (실물카드 미소지로 사용 실패)

제주도 여행을 앞두고 지역화폐인 '탐나는전'을 신청했다. 평소 성남사랑상품권을 잘 쓰고 있어서 제주도에서도 비슷하게 편리하게 쓸 수 있을 거라 생각했거든. 그런데... 결론부터 말하면 한 번도 써보지 못하고 환불하게 됐다. 탐나는전 신청과 설정 제주 출발 전에 미리 탐나는전을 신청했어. 신청 후 1주일 이내에 집에 도착.. 안내 브로셔를 보니 꽤 체계적으로 되어있더라고. 캐시백 혜택부터 시작해서 카드 등록, 사용법까지 자세히 나와있었어. 특히 소득공제 혜택도 있고, 한도상향 완료라는 문구도 보이니 더욱 기대가 됐어. 성남사랑상품권처럼 잘 활용할 수 있을 거라 생각했거든. 카드 등록 카드 등록을 진행했어. 인터페이스도 깔끔하고 사용하기 편해 보였어. "탐나는전 사용 가능한 카드를 신청 또는 등록해주세요!"라는 안내 문구를 보며 설레었지. 카드 정보를 직접 입력하거나 바코드로 인식할 수 있게 되어있어서 편리했어. 성남사랑상품권 앱과 비슷한 느낌이었거든. 난 바코드로 한큐에 등록.. 출발 전날인 6월 24일에 10만원을 충전했어. 탐나는전 선불카드로 등록도 완료하고, 제주도에서 맛있는 것도 사고 기념품도 살 생각에 들떠있었지. 그런데... 현실은? 제주도에 도착해서 탐나는전을 써보려고 했는데, 큰 문제가 있었어. 성남사랑상품권처럼 QR코드나 바코드로 간편하게 결제할 수 있을 거라 생각하고 실물카드를 안 가져갔거든. 그런데 제주도 매장들은 대부분 실물카드만 받더라고! QR코드나 바코드 결제를 지원하는 곳이 거의 없어서 당황했어. 성남에서는 거의 모든 곳에서 앱으로 간편결제가 되니까 당연히 제주도에서도 될 거라 생각했는데... 완전 오산이었어 😢 결국 환불... 여행 내내 한 번도 써보지 못하고, 마지막 날인 6월 29일에 결국 10만원 전액 환불했어. 충전 수수료나 환불 수수료 같은 건 없어서 다행이었지만, 뭔가 허무한 기분이었어. 후기와 조언 탐나는전 자체는 나쁘지 않은 시스템인 것 같아. 소득공제 혜택도 있고, 앱도 사용하기 편해...

싱가포르 여행 필수 준비물: G타입 변환 어댑터 (돼지코 전기 플러그)

조만간 우리 아이들이 싱가포르로 여행을 간다. 핸드폰 충전은 물론이고 다른 전기 제품 사용 때문에 어댑터가 꼭 필요하다. 해외여행 갈 때 어댑터 하나 잘못 챙겨가면 충전도 못 하고 전기 사용도 못 해서 낭패 보는 경우가 많다. 10년 전에 내가 싱가포르에 출장 갈 일이 있었는데 그때는 멀티 어댑터를 누군가에게 빌려갔었다. 이번 기회에 아이들 여행 준비물 중에 하나인 변환 플러그 검색하면서 알게 된 싱가포르 사용하는 전압과 플러그 타입, 어떤 어댑터를 챙겨야 하는지를 공유하려 한다. 싱가포르 여행을 계획하는 사람들을게 도움이 되겠지?  내 자식들 챙겨주는 마음으로 꼼꼼하게 설명해 줄 테니, 싱가포르 여행 준비물 리스트에 어댑터 관련 정보가 필요한 사람들은 꼭 참고했으면 한다. 1. 싱가포르 전기 환경 (전압과 플러그 타입) 해외여행 시 현지 전기 환경을 파악하는 것은 필수적인 여행 준비물 점검 사항이다. 싱가포르는 한국과 다른 전압 및 플러그 타입을 사용한다. 1.1 싱가포르 전압 (Voltage) 싱가포르는 230V(볼트) 전압을 사용한다. 한국은 220V를 사용하므로 전압 자체는 큰 차이가 없다. 대부분의 최신 전자기기(휴대폰 충전기, 노트북 충전기 등)는 100~240V의 프리볼트(Free Voltage)를 지원하므로, 전압 변환기(변압기)는 별도로 필요하지 않다. 1.2 싱가포르 플러그 타입 (Plug Type) 및 사용 국가 싱가포르는 Type G 플러그를 사용한다. 이는 영국식 3핀(세 발) 플러그 형태로, 한국(Type C, F)과는 모양이 완전히 다르다. 따라서 한국에서 사용하는 전자기기를 싱가포르에서 사용하려면 반드시 Type G 형태의 어댑터가 필요하다. Type G 플러그를 사용하는 주요 국가   아시아: 싱가포르, 홍콩, 말레이시아, 아랍에미리트(UAE) 등 유럽: 영국, 아일랜드, 몰타, 키프로스 등 기타: 사우디아라비아, 카리브해 일부 국가 등 이러한 국가들을 여행할 때도 Type G 어댑터 하나만 있으면 전기 ...