pgvector 설치 가이드

pgvector 확장

pgvector는 PostgreSQL의 확장 기능으로, 벡터 데이터 타입과 벡터 인덱싱을 지원하여 임베딩 벡터를 효율적으로 저장하고 검색할 수 있습니다. PostgreSQL을 그대로 활용할 수 있어 별도의 추가 인프라 없이도 서비스에 손쉽게 적용할 수 있다는 장점이 있습니다. 또한, Django는 PostgreSQL과 높은 호환성을 갖춘 프레임워크이므로, pgvector를 활용한 벡터 검색 기능을 쉽게 통합할 수 있습니다.

주요 기능:

  • 벡터 데이터 타입 지원

  • L2 거리, 내적(dot product), 코사인 유사도 연산 지원

  • 근사 최근접 이웃(ANN) 검색을 위한 IVFFlat 인덱스 지원

  • 대규모 벡터 데이터셋에서의 효율적인 유사도 검색

pgvector 지원되는 데이터베이스 만들기

아래 문서를 참고해서 pgvector를 지원하는 데이터베이스를 만들어주시고, 데이터베이스에 대한 연결 문자열 DATABASE_URL 환경변수 문자열을 획득해주세요. 이 환경변수를 장고 프로젝트 등의 애플리케이션에 주입에서 활용합니다.