Upstash로 강력한 RAG 챗봇 만들기:단계별 가이드

이 게시물에서는 Upstash Vector, Upstash Redis, Hugging Face Inference API, Replicate LLAMA-2-70B Chat 모델 및 Vercel을 사용하여 오픈 소스 사용자 정의 콘텐츠 RAG Chatbot을 구축한 방법에 대해 설명합니다. Upstash Vector는 벡터를 삽입하고 쿼리하여 각 사용자 메시지에 대한 관련 컨텍스트를 동적으로 생성 또는 업데이트하는 데 도움이 되었으며 Upstash Redis는 챗봇 대화를 저장하는 데 도움이 되었습니다.

전제조건

다음이 필요합니다:

Node.js 18 이상
Upstash 계정
Hugging Face 계정
복제 계정
Vercel 계정

기술 스택

기술 설명 Upstash서버리스 데이터베이스 플랫폼. 우리는 벡터와 대화를 각각 저장하기 위해 Upstash Vector와 Upstash Redis를 모두 사용하고 있습니다.Next.js웹용 React Framework. 우리는 신속한 프로토타이핑을 위해 populate shadcn/ui를 사용하고 있습니다.ReplicateRun과 오픈 소스 모델 미세 조정이 가능합니다. 우리는 LLAMA-2-70B 채팅 모델을 사용하고 있습니다.Hugging Face기계 학습 커뮤니티가 모델, 데이터 세트 및 애플리케이션에 대해 협업하는 플랫폼입니다. 우리는 임베딩 생성을 위해 Hugging Face Inference API를 사용하고 있습니다. 언어 모델로 구동되는 애플리케이션 개발을 위한 LangChainFramework. 맞춤형 디자인 구축을 위한 TailwindCSSCSS 프레임워크.Vercel웹 애플리케이션 배포 및 확장을 위한 클라우드 플랫폼입니다.

Upstash Redis 설정

Upstash 계정을 생성하고 로그인하면 Redis 탭으로 이동하여 데이터베이스를 생성하게 됩니다.

Upstash로 강력한 RAG 챗봇 만들기:단계별 가이드

데이터베이스를 생성한 후 세부정보 탭으로 이동합니다. 데이터베이스 연결 섹션을 찾을 때까지 아래로 스크롤합니다. 콘텐츠를 복사하여 안전한 곳에 저장하세요.

Upstash로 강력한 RAG 챗봇 만들기:단계별 가이드

또한 REST API 섹션을 찾을 때까지 아래로 스크롤하고 .env 버튼을 선택합니다. 콘텐츠를 복사하여 안전한 곳에 저장하세요.

Upstash로 강력한 RAG 챗봇 만들기:단계별 가이드

Upstash 벡터 설정

Upstash 계정을 생성하고 로그인하면 벡터 탭으로 이동하여 인덱스를 생성하게 됩니다.

Upstash로 강력한 RAG 챗봇 만들기:단계별 가이드

또한 연결을 찾을 때까지 아래로 스크롤하세요. 섹션을 클릭하고 .env를 선택하세요. 버튼. 콘텐츠를 복사하여 안전한 곳에 저장하세요.

Upstash로 강력한 RAG 챗봇 만들기:단계별 가이드

프로젝트 설정

설정하려면 앱 저장소를 복제하고 이 튜토리얼에 따라 그 안에 있는 모든 내용을 알아보세요. 프로젝트를 포크하려면 다음을 실행하세요:

git clone https://github.com/rishi-raj-jain/custom-rag-chatbot-upstash-vector
cd custom-rag-chatbot-upstash-vector
pnpm install

저장소를 복제한 후에는 .env를 생성하게 됩니다. 파일. 위 섹션에서 저장한 항목을 추가하게 됩니다.

다음과 같아야 합니다:

# .env
 
# Obtained from the steps as above
 
# Upstash Redis URL and Token
UPSTASH_REDIS_REST_URL="https://....upstash.io"
UPSTASH_REDIS_REST_TOKEN="..."
 
# Upstash Vector URL and Token
UPSTASH_VECTOR_REST_URL="https://...-vector.upstash.io"
UPSTASH_VECTOR_REST_TOKEN="..."
 
# Replicate API Key
REPLICATE_API_TOKEN="r8_..."
 
# Hugging Face Inference API Key
HUGGINGFACEHUB_API_KEY="hf_..."

이 단계 후에는 다음 명령을 사용하여 로컬 환경을 시작할 수 있습니다:

pnpm dev

저장소 구조

이는 프로젝트의 기본 폴더 구조입니다. 사용자 정의 컨텍스트에서 학습된 AI와 채팅하기 위한 API 경로를 생성하고 upsert로 컨텍스트를 업데이트하는 작업을 다루는 이 게시물에서 추가로 논의될 파일을 빨간색으로 표시했습니다. -기존 인덱스에 벡터를 넣습니다.

Upstash로 강력한 RAG 챗봇 만들기:단계별 가이드

Next.js 앱 라우터에서 채팅 경로 설정

이 섹션에서는 app/api/chat/route.js 경로를 설정한 방법에 대해 설명합니다. 서버리스 데이터베이스에서 대화를 동기화하고, 문자열 임베딩을 동적으로 생성하고, 주어진 인덱스에서 관련 벡터를 쿼리하여 컨텍스트를 생성하고, LLAMA-2-70B 채팅 모델을 사용하여 관련 예측을 요청합니다. 단순화를 위해 다음과 같은 부분으로 나누어 보겠습니다.

대화 저장

Upstash Redis에서 진행되는 대화를 캐시하기 위해 Redis 목록을 사용하겠습니다. 사용자로부터 응답하라는 메시지가 들어오면 조건에 따라 챗봇(이전)의 응답을 목록에 푸시합니다. 그런 다음 사용자가 보낸 최신 메시지를 목록에 푸시하여 저장하고 이에 대한 응답을 진행합니다.

// File: app/api/chat/route.js
 
import { Redis } from '@upstash/redis'
 
// Instantiate the Upstash Redis
const upstashRedis = new Redis({
 url: process.env.UPSTASH_REDIS_REST_URL,
 token: process.env.UPSTASH_REDIS_REST_TOKEN,
})
 
export async function POST(req) {
 try {
 
 // the whole chat as array of messages
 const { messages } = await req.json()
 
 // assuming user - assistant chat
 // add assitant's response to the chat history
 if (messages.length > 1) {
 await upstashRedis.lpush('unique_conversation_id', JSON.stringify(messages[messages.length - 2]))
 }
 // add user's request to the chat history
 await upstashRedis.lpush('unique_conversation_id', JSON.stringify(messages[messages.length - 1]))
 
 // Proceed to create a response
}

예측 컨텍스트가 포함된 프롬프트 LLAMA-2-70B 채팅 모델

이제 관련 컨텍스트를 문자열로 얻었으므로 마지막 단계는 llama-2-70B 채팅 모델이 사용자의 최신 메시지에 응답하도록 하는 것입니다. 우리는 Vercel AI SDK의 experimental_buildLlama2Prompt을 사용합니다. llama-2-70B 채팅 모델에 적합한 프롬프트 형식을 생성하는 방법입니다.

// File: app/api/chat/route.js
 
import Replicate from 'replicate'
import { experimental_buildLlama2Prompt } from 'ai/prompts'
import { ReplicateStream, StreamingTextResponse } from 'ai'
 
// Instantiate the Replicate API
const replicate = new Replicate({
 auth: process.env.REPLICATE_API_TOKEN,
})
 
export async function POST(req) {
 try {
 // ...
 
 const response = await replicate.predictions.create({
 // You must enable streaming.
 stream: true,
 // The model must support streaming. See https://replicate.com/docs/streaming
 // This is the model ID for Llama 2 70b Chat
 version: '2c1608e18606fad2812020dc541930f2d0495ce32eee50074220b87300bc16e1',
 // Format the message list into the format expected by Llama 2
 // @see https://github.com/vercel/ai/blob/99cf16edf0a09405d15d3867f997c96a8da869c6/packages/core/prompts/huggingface.ts#L53C1-L78C2
 input: {
 prompt: experimental_buildLlama2Prompt([
 {
 // create a system content message to be added as
 // the llama2prompt generator will supply it as the context with the API
 role: 'system',
 content: queryPrompt.substring(0, Math.min(queryPrompt.length, 2000)),
 },
 // also, pass the whole conversation!
 ...messages,
 ]),
 },
 })
 
 // stream the result to the frontend
 const stream = await ReplicateStream(response)
 return new StreamingTextResponse(stream)
}

Next.js 앱 라우터에서 기차 경로 설정

이 섹션에서는 app/api/train/route.js 경로를 설정하는 방법에 대해 설명합니다. 요청 객체에 전달된 문자열의 임베딩을 동적으로 생성하고 이를 Upstash 벡터 인덱스에 추가합니다. 단순화를 위해 다음과 같은 부분으로 나누어 보겠습니다.

문자열 임베딩 생성

기존 인덱스를 설정하거나 업데이트하는 데 도움이 되는 문자열 임베딩을 생성하겠습니다. 그렇게 하면 챗봇의 향후 응답에 대한 컨텍스트를 최신 상태로 유지할 수 있습니다. 우리는 LangChain과 함께 Hugging Face Inference API를 사용하여 에지에서 API 호출만으로 임베딩을 생성할 것입니다.

// File: app/api/train/route.js
 
import { HuggingFaceInferenceEmbeddings } from '@langchain/community/embeddings/hf'
 
// Instantiate the Hugging Face Inference API
const embeddings = new HuggingFaceInferenceEmbeddings()
 
export async function POST(req) {
 try {
 
 // a default set of messages to create vector embeddings on
 let messagesToVectorize = [
 'Rishi is pretty much active on Twitter nowadays.',
 'Rishi loves writing for Upstash',
 "Rishi's recent article on building chatbot using Upstash went viral",
 'Rishi is enjoying building launchfa.st.',
 ]
 
 // if the POST request is of type application/json
 if (req.headers.get('Content-Type') === 'application/json') {
 // and if the request contains array of messages to train on
 const { messages } = await req.json()
 if (typeof messages !== 'string' && messages.length > 0) {
 messagesToVectorize = messages
 }
 }
 
 // Call the Hugging Face Inference API to get emebeddings on the messages
 const generatedEmbeddings = await Promise.all(messagesToVectorize.map((i) => embeddings.embedQuery(i)))
 
 // ...
}

Vercel에 배포

이제 저장소를 Vercel에 배포할 준비가 되었습니다. 배포하려면 다음 단계를 따르세요 👇🏻

앱 코드가 포함된 GitHub 저장소를 만드는 것부터 시작하세요.
그런 다음 Vercel 대시보드로 이동하여 새 프로젝트를 만듭니다. .
새 프로젝트를 방금 생성한 GitHub 저장소에 연결하세요.
설정 , Environment Variables을 업데이트하세요. 지역 .env의 항목과 일치시키려면 파일.
배치하세요! 🚀

추가 정보

더 자세한 통찰력을 얻으려면 이 게시물에 인용된 참고 자료를 살펴보세요.

결론

결론적으로, 이 프로젝트는 필요에 따라 확장되는 서비스(예:Upstash)를 사용하면서 임베딩을 생성하고, 기존 벡터 세트에서 쿼리하고, 컨텍스트를 사용하여 LLAMA-2-70B 채팅 모델을 사용하여 관련 예측을 생성하는 방법을 배우는 귀중한 경험을 제공했습니다.

Upstash로 강력한 RAG 챗봇 만들기:단계별 가이드

전제조건

기술 스택

Upstash Redis 설정

Upstash 벡터 설정

프로젝트 설정

저장소 구조

Next.js 앱 라우터에서 채팅 경로 설정

대화 저장

최신 메시지 삽입 만들기

최신 메시지를 기반으로 관련 컨텍스트 벡터 검색

예측 컨텍스트가 포함된 프롬프트 LLAMA-2-70B 채팅 모델

Next.js 앱 라우터에서 기차 경로 설정

문자열 임베딩 생성

관련성 검색을 위한 벡터 저장

Vercel에 배포

추가 정보

결론