feat: add OpenRouter as first-class embedding provider

BeamNawapat · BeamNawapat · commit 6cb1f2ce14df · 2026-04-21T01:11:26.000+07:00
Add dedicated OpenRouter embedding provider that routes through
OpenRouter's OpenAI-compatible API. This provides a cleaner UX
than using OPENAI_BASE_URL workaround, with proper model naming
(e.g., openai/text-embedding-3-small) and configuration.

New env vars: EMBEDDING_PROVIDER=OpenRouter, OPENROUTER_API_KEY
diff --git a/packages/core/src/embedding/index.ts b/packages/core/src/embedding/index.ts
@@ -5,4 +5,5 @@ export * from './base-embedding';
 export * from './openai-embedding';
 export * from './voyageai-embedding';
 export * from './ollama-embedding';
-export * from './gemini-embedding'; 
+export * from './gemini-embedding';
+export * from './openrouter-embedding'; 
diff --git a/packages/core/src/embedding/openrouter-embedding.ts b/packages/core/src/embedding/openrouter-embedding.ts
@@ -0,0 +1,151 @@
+import OpenAI from 'openai';
+import { Embedding, EmbeddingVector } from './base-embedding';
+
+export interface OpenRouterEmbeddingConfig {
+    model: string;
+    apiKey: string;
+    baseURL?: string;
+}
+
+const OPENROUTER_BASE_URL = 'https://openrouter.ai/api/v1';
+
+export class OpenRouterEmbedding extends Embedding {
+    private client: OpenAI;
+    private config: OpenRouterEmbeddingConfig;
+    private dimension: number = 1536;
+    protected maxTokens: number = 8192;
+
+    constructor(config: OpenRouterEmbeddingConfig) {
+        super();
+        this.config = config;
+        this.client = new OpenAI({
+            apiKey: config.apiKey,
+            baseURL: config.baseURL || OPENROUTER_BASE_URL,
+        });
+
+        const model = config.model || 'openai/text-embedding-3-small';
+        const knownModels = OpenRouterEmbedding.getSupportedModels();
+        if (knownModels[model]) {
+            this.dimension = knownModels[model].dimension;
+            this.maxTokens = knownModels[model].maxTokens || 8192;
+        }
+    }
+
+    async detectDimension(testText: string = "test"): Promise<number> {
+        const model = this.config.model || 'openai/text-embedding-3-small';
+        const knownModels = OpenRouterEmbedding.getSupportedModels();
+
+        if (knownModels[model]) {
+            return knownModels[model].dimension;
+        }
+
+        try {
+            const processedText = this.preprocessText(testText);
+            const response = await this.client.embeddings.create({
+                model: model,
+                input: processedText,
+                encoding_format: 'float',
+            });
+            return response.data[0].embedding.length;
+        } catch (error) {
+            const errorMessage = error instanceof Error ? error.message : 'Unknown error';
+            throw new Error(`Failed to detect dimension for model ${model}: ${errorMessage}`);
+        }
+    }
+
+    async embed(text: string): Promise<EmbeddingVector> {
+        const processedText = this.preprocessText(text);
+        const model = this.config.model || 'openai/text-embedding-3-small';
+
+        try {
+            const response = await this.client.embeddings.create({
+                model: model,
+                input: processedText,
+                encoding_format: 'float',
+            });
+
+            this.dimension = response.data[0].embedding.length;
+
+            return {
+                vector: response.data[0].embedding,
+                dimension: this.dimension
+            };
+        } catch (error) {
+            const errorMessage = error instanceof Error ? error.message : 'Unknown error';
+            throw new Error(`Failed to generate OpenRouter embedding: ${errorMessage}`);
+        }
+    }
+
+    async embedBatch(texts: string[]): Promise<EmbeddingVector[]> {
+        const processedTexts = this.preprocessTexts(texts);
+        const model = this.config.model || 'openai/text-embedding-3-small';
+
+        try {
+            const response = await this.client.embeddings.create({
+                model: model,
+                input: processedTexts,
+                encoding_format: 'float',
+            });
+
+            this.dimension = response.data[0].embedding.length;
+
+            return response.data.map((item) => ({
+                vector: item.embedding,
+                dimension: this.dimension
+            }));
+        } catch (error) {
+            const errorMessage = error instanceof Error ? error.message : 'Unknown error';
+            throw new Error(`Failed to generate OpenRouter batch embeddings: ${errorMessage}`);
+        }
+    }
+
+    getDimension(): number {
+        const model = this.config.model || 'openai/text-embedding-3-small';
+        const knownModels = OpenRouterEmbedding.getSupportedModels();
+
+        if (knownModels[model]) {
+            return knownModels[model].dimension;
+        }
+
+        return this.dimension;
+    }
+
+    getProvider(): string {
+        return 'OpenRouter';
+    }
+
+    async setModel(model: string): Promise<void> {
+        this.config.model = model;
+        const knownModels = OpenRouterEmbedding.getSupportedModels();
+        if (knownModels[model]) {
+            this.dimension = knownModels[model].dimension;
+            this.maxTokens = knownModels[model].maxTokens || 8192;
+        } else {
+            this.dimension = await this.detectDimension();
+        }
+    }
+
+    getClient(): OpenAI {
+        return this.client;
+    }
+
+    static getSupportedModels(): Record<string, { dimension: number; maxTokens?: number; description: string }> {
+        return {
+            'openai/text-embedding-3-small': {
+                dimension: 1536,
+                maxTokens: 8192,
+                description: 'OpenAI text-embedding-3-small via OpenRouter'
+            },
+            'openai/text-embedding-3-large': {
+                dimension: 3072,
+                maxTokens: 8192,
+                description: 'OpenAI text-embedding-3-large via OpenRouter'
+            },
+            'openai/text-embedding-ada-002': {
+                dimension: 1536,
+                maxTokens: 8192,
+                description: 'OpenAI text-embedding-ada-002 via OpenRouter'
+            },
+        };
+    }
+}
diff --git a/packages/mcp/src/config.ts b/packages/mcp/src/config.ts
@@ -4,14 +4,16 @@ export interface ContextMcpConfig {
     name: string;
     version: string;
     // Embedding provider configuration
-    embeddingProvider: 'OpenAI' | 'VoyageAI' | 'Gemini' | 'Ollama';
+    embeddingProvider: 'OpenAI' | 'VoyageAI' | 'Gemini' | 'Ollama' | 'OpenRouter';
     embeddingModel: string;
     // Provider-specific API keys
     openaiApiKey?: string;
     openaiBaseUrl?: string;
     voyageaiApiKey?: string;
     geminiApiKey?: string;
     geminiBaseUrl?: string;
+    // OpenRouter configuration
+    openrouterApiKey?: string;
     // Ollama configuration
     ollamaModel?: string;
     ollamaHost?: string;
@@ -76,6 +78,8 @@ export function getDefaultModelForProvider(provider: string): string {
             return 'voyage-code-3';
         case 'Gemini':
             return 'gemini-embedding-001';
+        case 'OpenRouter':
+            return 'openai/text-embedding-3-small';
         case 'Ollama':
             return 'nomic-embed-text';
         default:
@@ -94,6 +98,7 @@ export function getEmbeddingModelForProvider(provider: string): string {
         case 'OpenAI':
         case 'VoyageAI':
         case 'Gemini':
+        case 'OpenRouter':
         default:
             // For all other providers, use EMBEDDING_MODEL or default
             const selectedModel = envManager.get('EMBEDDING_MODEL') || getDefaultModelForProvider(provider);
@@ -117,14 +122,16 @@ export function createMcpConfig(): ContextMcpConfig {
         name: envManager.get('MCP_SERVER_NAME') || "Context MCP Server",
         version: envManager.get('MCP_SERVER_VERSION') || "1.0.0",
         // Embedding provider configuration
-        embeddingProvider: (envManager.get('EMBEDDING_PROVIDER') as 'OpenAI' | 'VoyageAI' | 'Gemini' | 'Ollama') || 'OpenAI',
+        embeddingProvider: (envManager.get('EMBEDDING_PROVIDER') as 'OpenAI' | 'VoyageAI' | 'Gemini' | 'Ollama' | 'OpenRouter') || 'OpenAI',
         embeddingModel: getEmbeddingModelForProvider(envManager.get('EMBEDDING_PROVIDER') || 'OpenAI'),
         // Provider-specific API keys
         openaiApiKey: envManager.get('OPENAI_API_KEY'),
         openaiBaseUrl: envManager.get('OPENAI_BASE_URL'),
         voyageaiApiKey: envManager.get('VOYAGEAI_API_KEY'),
         geminiApiKey: envManager.get('GEMINI_API_KEY'),
         geminiBaseUrl: envManager.get('GEMINI_BASE_URL'),
+        // OpenRouter configuration
+        openrouterApiKey: envManager.get('OPENROUTER_API_KEY'),
         // Ollama configuration
         ollamaModel: envManager.get('OLLAMA_MODEL'),
         ollamaHost: envManager.get('OLLAMA_HOST'),
@@ -162,6 +169,9 @@ export function logConfigurationSummary(config: ContextMcpConfig): void {
                 console.log(`[MCP]   Gemini Base URL: ${config.geminiBaseUrl}`);
             }
             break;
+        case 'OpenRouter':
+            console.log(`[MCP]   OpenRouter API Key: ${config.openrouterApiKey ? '✅ Configured' : '❌ Missing'}`);
+            break;
         case 'Ollama':
             console.log(`[MCP]   Ollama Host: ${config.ollamaHost || 'http://127.0.0.1:11434'}`);
             console.log(`[MCP]   Ollama Model: ${config.embeddingModel}`);
diff --git a/packages/mcp/src/embedding.ts b/packages/mcp/src/embedding.ts
@@ -1,8 +1,8 @@
-import { OpenAIEmbedding, VoyageAIEmbedding, GeminiEmbedding, OllamaEmbedding } from "@zilliz/claude-context-core";
+import { OpenAIEmbedding, VoyageAIEmbedding, GeminiEmbedding, OllamaEmbedding, OpenRouterEmbedding } from "@zilliz/claude-context-core";
 import { ContextMcpConfig } from "./config.js";
 
 // Helper function to create embedding instance based on provider
-export function createEmbeddingInstance(config: ContextMcpConfig): OpenAIEmbedding | VoyageAIEmbedding | GeminiEmbedding | OllamaEmbedding {
+export function createEmbeddingInstance(config: ContextMcpConfig): OpenAIEmbedding | VoyageAIEmbedding | GeminiEmbedding | OllamaEmbedding | OpenRouterEmbedding {
     console.log(`[EMBEDDING] Creating ${config.embeddingProvider} embedding instance...`);
 
     switch (config.embeddingProvider) {
@@ -47,6 +47,19 @@ export function createEmbeddingInstance(config: ContextMcpConfig): OpenAIEmbeddi
             console.log(`[EMBEDDING] ✅ Gemini embedding instance created successfully`);
             return geminiEmbedding;
 
+        case 'OpenRouter':
+            if (!config.openrouterApiKey) {
+                console.error(`[EMBEDDING] ❌ OpenRouter API key is required but not provided`);
+                throw new Error('OPENROUTER_API_KEY is required for OpenRouter embedding provider');
+            }
+            console.log(`[EMBEDDING] 🔧 Configuring OpenRouter with model: ${config.embeddingModel}`);
+            const openrouterEmbedding = new OpenRouterEmbedding({
+                apiKey: config.openrouterApiKey,
+                model: config.embeddingModel,
+            });
+            console.log(`[EMBEDDING] ✅ OpenRouter embedding instance created successfully`);
+            return openrouterEmbedding;
+
         case 'Ollama':
             const ollamaHost = config.ollamaHost || 'http://127.0.0.1:11434';
             console.log(`[EMBEDDING] 🔧 Configuring Ollama with model: ${config.embeddingModel}, host: ${ollamaHost}`);
@@ -63,7 +76,7 @@ export function createEmbeddingInstance(config: ContextMcpConfig): OpenAIEmbeddi
     }
 }
 
-export function logEmbeddingProviderInfo(config: ContextMcpConfig, embedding: OpenAIEmbedding | VoyageAIEmbedding | GeminiEmbedding | OllamaEmbedding): void {
+export function logEmbeddingProviderInfo(config: ContextMcpConfig, embedding: OpenAIEmbedding | VoyageAIEmbedding | GeminiEmbedding | OllamaEmbedding | OpenRouterEmbedding): void {
     console.log(`[EMBEDDING] ✅ Successfully initialized ${config.embeddingProvider} embedding provider`);
     console.log(`[EMBEDDING] Provider details - Model: ${config.embeddingModel}, Dimension: ${embedding.getDimension()}`);
 
@@ -78,6 +91,9 @@ export function logEmbeddingProviderInfo(config: ContextMcpConfig, embedding: Op
         case 'Gemini':
             console.log(`[EMBEDDING] Gemini configuration - API Key: ${config.geminiApiKey ? '✅ Provided' : '❌ Missing'}, Base URL: ${config.geminiBaseUrl || 'Default'}`);
             break;
+        case 'OpenRouter':
+            console.log(`[EMBEDDING] OpenRouter configuration - API Key: ${config.openrouterApiKey ? '✅ Provided' : '❌ Missing'}`);
+            break;
         case 'Ollama':
             console.log(`[EMBEDDING] Ollama configuration - Host: ${config.ollamaHost || 'http://127.0.0.1:11434'}, Model: ${config.embeddingModel}`);
             break;