LangChain 입문 7편 - 대화 기억하기

2025년 11월 28일 (수정: 2025년 11월 29일 ) learning by Seven Fingers Studio 15분

LangChainAIPythonLLM챗봇

※ 이 게시물은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

langchain guide 07 memory

챗봇 테스트하다가 “아까 말한 거 기억 안 나?” 하면서 짜증났던 적 있어요. 메모리 추가하니까 진짜 대화하는 느낌이 나더라고요.

대화 메모리가 없으면 생기는 문제

AI 챗봇을 만들다 보면 꼭 겪는 답답한 상황이 있어요. 바로 AI가 방금 전 대화를 까먹는 거죠.

“내 이름은 민수야”라고 했는데, 다음 질문에서 “내 이름이 뭐였지?”라고 물으면 “죄송하지만 이전 대화 내용을 모르겠습니다”라고 답하는 식이에요. 실제로 사람과 대화하는 느낌이 전혀 안 나죠.

이런 일이 생기는 이유는 LLM(대규모 언어 모델) 자체는 상태를 저장하지 않기 때문이에요. 매번 새로운 요청으로 인식하죠. 그래서 LangChain에서는 메모리(Memory) 기능을 제공해서 이전 대화를 기억하게 만들 수 있습니다.

제 경험상 메모리 기능을 추가하는 순간 챗봇의 품질이 확 달라져요. 진짜 대화하는 느낌이 나기 시작합니다.

ConversationBufferMemory - 모든 대화 기억하기

가장 기본적인 메모리는 ConversationBufferMemory예요. 이름처럼 모든 대화 내용을 버퍼에 저장해서 기억합니다.

from langchain_openai import ChatOpenAI
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory

# 모델 설정
model = ChatOpenAI(model="gpt-3.5-turbo", temperature=0.7)

# 메모리 생성
memory = ConversationBufferMemory()

# 대화 체인 생성
conversation = ConversationChain(
    llm=model,
    memory=memory,
    verbose=True  # 대화 과정을 보여줌
)

# 첫 번째 대화
response1 = conversation.predict(input="안녕! 내 이름은 지혜야.")
print(f"AI: {response1}\n")

# 두 번째 대화
response2 = conversation.predict(input="내 이름이 뭐였지?")
print(f"AI: {response2}\n")

# 세 번째 대화
response3 = conversation.predict(input="나는 파이썬을 공부하고 있어.")
print(f"AI: {response3}\n")

# 네 번째 대화
response4 = conversation.predict(input="내가 뭘 공부한다고 했지?")
print(f"AI: {response4}")

실행 결과:

AI: 안녕하세요 지혜님! 만나서 반가워요. 오늘 어떤 이야기를 나누고 싶으신가요?
AI: 당신의 이름은 지혜예요!
AI: 파이썬 공부를 하고 계시는군요! 파이썬은 정말 유용한 언어죠. 어떤 부분을 공부하고 계신가요?
AI: 파이썬을 공부하고 계시다고 하셨어요!

보세요! AI가 이름도 기억하고, 파이썬 공부한다는 것도 기억하고 있어요. 이게 바로 메모리의 힘입니다.

메모리에 저장된 내용을 확인하려면 이렇게 해보세요:

# 메모리 내용 확인
print(memory.load_memory_variables({}))

실행 결과:

{'history': 'Human: 안녕! 내 이름은 지혜야.\nAI: 안녕하세요 지혜님! 만나서 반가워요...\nHuman: 내 이름이 뭐였지?\nAI: 당신의 이름은 지혜예요!\n...'}

ConversationBufferWindowMemory - 최근 대화만 기억하기

모든 대화를 기억하면 좋긴 한데, 문제가 하나 있어요. 대화가 길어질수록 토큰을 너무 많이 사용하게 된다는 거죠. 비용이 점점 올라가는 문제가 생깁니다.

그럴 때는 최근 N개의 대화만 기억하는 ConversationBufferWindowMemory를 사용하면 돼요.

from langchain.memory import ConversationBufferWindowMemory

# 최근 2개의 대화만 기억하는 메모리
memory = ConversationBufferWindowMemory(k=2)

# 대화 체인 생성
conversation = ConversationChain(
    llm=model,
    memory=memory,
    verbose=False
)

# 여러 대화 진행
conversation.predict(input="내 이름은 철수야.")
conversation.predict(input="나는 서울에 살아.")
conversation.predict(input="내 취미는 축구야.")
conversation.predict(input="나는 개발자야.")

# 이름을 물어보면?
response = conversation.predict(input="내 이름이 뭐야?")
print(f"AI: {response}")

# 메모리 확인
print("\n저장된 대화:")
print(memory.load_memory_variables({}))

실행 결과:

AI: 죄송하지만 이름을 말씀하신 내용이 최근 대화에 없어서 기억이 나지 않네요.
저장된 대화:
{'history': 'Human: 내 취미는 축구야.\nAI: ...\nHuman: 나는 개발자야.\nAI: ...'}

k=2로 설정했기 때문에 최근 2개의 대화쌍만 기억하고 있어요. 그래서 맨 처음에 했던 “내 이름은 철수야”는 잊어버린 거죠. 하지만 최근에 말한 취미와 직업은 기억하고 있을 거예요.

langchain guide 07 memory

ConversationSummaryMemory - 요약해서 기억하기

긴 대화 내용을 전부 저장하기엔 부담스럽고, 그렇다고 최근 몇 개만 기억하긴 아쉬울 때가 있어요. 이럴 때는 대화 내용을 요약해서 저장하는 방법이 있습니다.

from langchain.memory import ConversationSummaryMemory

# 요약 메모리 생성 (LLM이 요약을 만듦)
memory = ConversationSummaryMemory(llm=model)

# 대화 체인 생성
conversation = ConversationChain(
    llm=model,
    memory=memory,
    verbose=True
)

# 긴 대화 시뮬레이션
conversation.predict(input="안녕! 나는 서울에 사는 25살 대학생이야.")
conversation.predict(input="컴퓨터공학을 전공하고 있고, 졸업 후엔 AI 엔지니어가 되고 싶어.")
conversation.predict(input="요즘은 LangChain을 공부하면서 챗봇 프로젝트를 진행 중이야.")

# 메모리 확인
print("\n요약된 메모리:")
print(memory.load_memory_variables({}))

# 대화 내용을 물어봄
response = conversation.predict(input="내가 어떤 공부를 하고 있다고 했지?")
print(f"\nAI: {response}")

실행 결과:

요약된 메모리:
{'history': '사용자는 서울에 거주하는 25살 대학생으로 컴퓨터공학을 전공 중이며, 졸업 후 AI 엔지니어가 되기를 희망합니다. 현재 LangChain을 공부하며 챗봇 프로젝트를 진행하고 있습니다.'}
AI: LangChain을 공부하고 계시고, 챗봇 프로젝트를 진행하고 계시다고 하셨어요!

대화 내용이 요약되어 저장되는 걸 볼 수 있죠? 이렇게 하면 토큰을 절약하면서도 중요한 정보는 잃지 않을 수 있어요.

실전 활용 - 개인 비서 챗봇 만들기

이제 배운 메모리 기능을 활용해서 실용적인 개인 비서 챗봇을 만들어볼게요. 사용자 정보를 기억하고 맥락에 맞는 답변을 하는 챗봇입니다.

from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferWindowMemory
from langchain_core.prompts import PromptTemplate

# 개인 비서 스타일의 프롬프트
template = """당신은 친근하고 유능한 개인 비서입니다.
사용자의 이전 대화 내용을 기억하고, 맥락에 맞는 도움을 제공하세요.

현재까지의 대화:
{history}

사용자: {input}
비서:"""

prompt = PromptTemplate(
    input_variables=["history", "input"],
    template=template
)

# 최근 5개 대화를 기억하는 메모리
memory = ConversationBufferWindowMemory(k=5)

# 체인 생성
assistant = ConversationChain(
    llm=model,
    prompt=prompt,
    memory=memory,
    verbose=False
)

# 대화 시뮬레이션
print("=== 개인 비서 챗봇 ===\n")

conversations = [
    "내일 오전 10시에 회의가 있어.",
    "점심으로 뭐 먹을까?",
    "내일 일정이 어떻게 되지?",
    "회의 준비물로 뭐가 필요할까?"
]

for user_input in conversations:
    print(f"나: {user_input}")
    response = assistant.predict(input=user_input)
    print(f"비서: {response}\n")

실행 결과:

=== 개인 비서 챗봇 ===
나: 내일 오전 10시에 회의가 있어.
비서: 알겠습니다! 내일 오전 10시 회의를 기억해두겠습니다. 회의와 관련해서 준비하실 것이 있으신가요?
나: 점심으로 뭐 먹을까?
비서: 내일 오전 10시에 회의가 있으시니, 가볍게 드시면 좋을 것 같아요. 샐러드나 샌드위치는 어떠세요?
나: 내일 일정이 어떻게 되지?
비서: 내일은 오전 10시에 회의가 예정되어 있습니다!
나: 회의 준비물로 뭐가 필요할까?
비서: 회의 준비물로는 노트북, 필기도구, 관련 자료가 필요할 것 같습니다. 회의 주제에 따라 추가 준비물을 챙기시는 게 좋겠어요.

봤죠? 챗봇이 “내일 10시 회의”를 계속 기억하고 있어요. 점심 메뉴 추천할 때도 회의를 고려해서 답변하고, 일정을 물어봤을 때도 제대로 알려주죠.

메모리 직접 조작하기

때로는 메모리를 직접 컨트롤해야 할 때도 있어요. 특정 정보를 미리 넣어두거나, 불필요한 내용을 지우고 싶을 수 있죠.

from langchain.memory import ConversationBufferMemory

# 메모리 생성
memory = ConversationBufferMemory()

# 대화 내용 직접 추가
memory.save_context(
    {"input": "내 이름은 영희야."},
    {"output": "안녕하세요 영희님!"}
)
memory.save_context(
    {"input": "나는 디자이너야."},
    {"output": "디자이너시군요! 어떤 디자인을 주로 하시나요?"}
)

# 저장된 내용 확인
print("저장된 메모리:")
print(memory.load_memory_variables({}))

# 메모리 초기화
memory.clear()
print("\n메모리 초기화 후:")
print(memory.load_memory_variables({}))

실행 결과:

저장된 메모리:
{'history': 'Human: 내 이름은 영희야.\nAI: 안녕하세요 영희님!\nHuman: 나는 디자이너야.\nAI: 디자이너시군요! 어떤 디자인을 주로 하시나요?'}
메모리 초기화 후:
{'history': ''}

메모리 선택 가이드

상황에 따라 어떤 메모리를 쓸지 고민될 수 있어요. 제가 실제로 사용하는 기준을 알려드릴게요:

ConversationBufferMemory: 짧은 대화나 중요한 정보를 절대 놓치면 안 될 때. 고객 상담 챗봇 같은 곳에 좋아요.

ConversationBufferWindowMemory: 일반적인 대화형 챗봇에 가장 많이 씁니다. 비용과 성능의 균형이 좋아요. k=5~10 정도가 적당해요.

ConversationSummaryMemory: 매우 긴 대화가 예상될 때. 고객 서비스나 상담 챗봇처럼 한 세션이 오래 지속되는 경우에 유용합니다.

운영자 실전 노트

실제 프로젝트 진행하며 겪은 문제

대화가 길어지니까 토큰이 8192 초과해서 에러 → ConversationBufferWindowMemory로 최근 N개만 유지
ConversationSummaryMemory 쓰니까 요약하는데도 API 호출해서 비용 추가 → 대화 100턴 이상 아니면 Window가 나음

이 경험을 통해 알게 된 점

토큰 계산: tiktoken 라이브러리로 미리 토큰 수 계산해서 메모리 크기 조절
메모리 전략: 일반 챗봇은 Window(k=5), 장기 상담은 Summary, 중요 정보만 저장하는 Entity Memory도 있음

다음 단계

대화 메모리까지 마스터했다면 이제 정말 강력한 기능을 배울 차례다. 다음 글에서는 RAG(검색 증강 생성)를 다룰 건데, 이걸 배우면 AI가 우리가 제공한 문서나 데이터를 기반으로 답변할 수 있게 된다.

실제로 회사 내부 문서로 QA 시스템을 만들거나, PDF 파일 내용을 기반으로 답변하는 챗봇을 만들 수 있다.

ConversationBufferWindowMemory의 k 값 설정이 은근 중요하다. 너무 작으면 맥락을 잃고, 너무 크면 토큰 비용이 올라간다. 보통 k=5~7 정도로 설정한다. 대화 흐름 유지하면서도 비용 효율적이다.

진짜 실용적인 애플리케이션을 만드는 핵심 기술이다!

다음 글 보기

← 이전 글

LangChain 독학 가이드 6 - 출력 파서

LangChain 독학 가이드 8 - RAG 구현하기

← 블로그 목록으로