Document Processing API with Semantic Search

A FastAPI-based service for processing PDFs/text documents, generating embeddings, and enabling semantic search using Supabase and pgvector.

✨ Key Features

Document Processing: Upload and chunk PDFs/text files with semantic splitting
Vector Search: Find relevant document sections using embedding similarity
Supabase Integration: Store documents + embeddings with pgvector for efficient search
REST API: Well-structured endpoints with Swagger UI documentation

🛠️ Tech Stack

Backend: Python (FastAPI)
Database: Supabase (PostgreSQL + pgvector)
Embeddings: [sentence-transformers]

🚀 Quick Start

Setup environment:

git clone https://github.com/nishchalacharya/Document-Processor-.git
cd Document-Processor
pip install -r requirements.txt

2.Configure environment variables
SUPABASE_URL=your-supabase-url
SUPABASE_KEY=your-supabase-key
EMBEDDING_MODEL=your-model-name
```bash
3.Run API:
   uvicorn main:app --reload

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
database		database
schemas		schemas
services		services
tests		tests
.gitignore		.gitignore
README.md		README.md
config.py		config.py
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Document Processing API with Semantic Search

✨ Key Features

🛠️ Tech Stack

🚀 Quick Start

About

Uh oh!

Releases

Packages

Languages

nishchalacharya/Document-Processor-

Folders and files

Latest commit

History

Repository files navigation

Document Processing API with Semantic Search

✨ Key Features

🛠️ Tech Stack

🚀 Quick Start

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages