pgvector 설치 가이드¶
pgvector 확장¶
pgvector는 PostgreSQL의 확장 기능으로, 벡터 데이터 타입과 벡터 인덱싱을 지원하여 임베딩 벡터를 효율적으로 저장하고 검색할 수 있습니다. PostgreSQL을 그대로 활용할 수 있어 별도의 추가 인프라 없이도 서비스에 손쉽게 적용할 수 있다는 장점이 있습니다. 또한, Django는 PostgreSQL과 높은 호환성을 갖춘 프레임워크이므로, pgvector를 활용한 벡터 검색 기능을 쉽게 통합할 수 있습니다.
주요 기능:
벡터 데이터 타입 지원
L2 거리, 내적(dot product), 코사인 유사도 연산 지원
근사 최근접 이웃(ANN) 검색을 위한 IVFFlat 인덱스 지원
대규모 벡터 데이터셋에서의 효율적인 유사도 검색
pgvector 지원되는 데이터베이스 만들기¶
아래 문서를 참고해서 pgvector를 지원하는 데이터베이스를 만들어주시고, 데이터베이스에 대한 연결 문자열 DATABASE_URL
환경변수 문자열을 획득해주세요.
이 환경변수를 장고 프로젝트 등의 애플리케이션에 주입에서 활용합니다.