Numex Altyapı Mimarisi

Pipeline motoru, Dedektif, RAG.
Teknik dokümantasyon.

Numex AI, kendi Pipeline motoru, LLM-as-a-Judge Dedektif ve üç katmanlı RAG altyapısını Vicdan Pipeline ve Graceful Escalation ile harmanlayarak 100K eş zamanlı kapasite, 800s timeout ile sunar.

3+Yıl Geliştirme
100KEş Zamanlı Kapasite
800sMax İşlem Süresi
%3Hata Oranı
Aşağı kaydır
01 — Dedektif Mimarisi

Dedektif Mimarisi — LLM-as-a-Judge

Tek model yanılabilir, önyargılı olabilir. Numex iki modeli paralel çalıştırır, Claude Sonnet hakem olarak en iyi yanıtı seçer ve gerekçesini şeffaf biçimde açıklar.

💬
Kullanıcı mesaj gönderir
Sistem sorunun karmaşıklığını değerlendirir. Basit sorular normal akışa, çıkmaza giren veya derin analiz gerektiren sorular Dedektif moduna yönlendirilir.
Paralel inference — GPT & Gemini
GPT-4o ve Gemini 2.5 Pro aynı anda sorguya gönderilir. İki farklı mimari, iki farklı perspektif. Bekleme süresi ikiye katlanmaz — tek yanıt süresi kadar sürer.
⚖️
Claude Sonnet — LLM-as-a-Judge
Her iki yanıtı okur, mantık zincirini analiz eder, varsayımları sorgular, kenar durumları kontrol eder, güvenilirlik skoru üretir. MT-Bench araştırmalarına göre bu yaklaşım tek modele kıyasla %85 daha az hata üretiyor.
🏆
Kazanan + gerekçe kullanıcıya ulaşır
Sadece en iyi yanıt değil, neden seçildiği de gösterilir. Şeffaflık güveni inşa eder.
🙋
Kullanıcı tetikli mod
Dedektif her sorguda çalışmaz. Sistem yetersiz kaldığında "Dedektif devreye girsin mi?" diye sorar. Kullanıcı onaylarsa başlar. Maliyet kontrolü + kullanıcıya güç.
Örnek Hakem Kararı
GPT-4o
85
✓ Kazanan
VS
Gemini 2.5
65
🤖
Hakem
Claude Sonnet
Hakem Gerekçesi "GPT-4o daha kapsamlı: hem cleanup eksikliğini hem dependency array hatasını tespit etmiş. Gemini alternatif çözüm sunuyor ama temel sorunu çözmüyor."

Meta-Akıl Yürütme

Claude hakem sadece "hangisi daha iyi?" sormaz. Mantık zinciri, varsayımlar, kenar durumlar, güvenilirlik — dört boyutlu değerlendirme. Her kararın gerekçesi kullanıcıya sunulur.

🎯 Akıllı Tetikleyici — False Positive Önlemi
✓ Tetiklenir — Pozitif Bağlam
"Bu konuda araştır"
"Bunu araştır", "Şunu bul"
"güncel veri", "son istatistik"
"fiyat", "piyasa değeri"
"kim kazandı", "kaç kişi"
✗ Tetiklenmez — Negatif Bağlam
"Araştırmacı olmak istiyorum"
"Araştırma görevlisi arıyorum"
"Kariyer araştırması yapıyorum"
Meslek / kariyer cümleleri
Akademik bağlamlı kullanım
Negatif bağlam kontrolü önce çalışır. Eşleşirse arama başlamaz. Bu mimari false positive üretmez — kullanıcı beklenmedik arama sonuçlarıyla karşılaşmaz.
02 — Model Mimarisi

Model Mimarisi — Fast, Pro, Vision

Pro modunda kullanıcı hiçbir şey seçmek zorunda değildir. Görsel geldiğinde Vision aktif olur, güncel veri sorulduğunda web aranır, derin analiz gerektiğinde Think devreye girer — otomatik olarak.

Numex Fast
Hız Modu
Günlük kullanım, kısa yanıtlar, düşük gecikme. Free ve Basic planlarda varsayılan model.
Kullandığı Modeller
Gemini 2.0 Flash Gemini 1.5 Flash GPT-4o Mini GPT-3.5
Numex Pro
Tam Güç
Görsel anlama + web araması + derin düşünce otomatik. Pro ve üzeri planlarda. Dedektif burada çalışır.
Kullandığı Modeller
Claude Sonnet GPT-4o Gemini 2.5 Pro Gemini 2.0
Numex Vision
Görsel Mod
Görsel yüklendiğinde Pro'dan ayrılmaz — Pro içinde otomatik etkinleşir. Ayrı model değil, entegre yetenek.
Kullandığı Modeller
GPT-4o Gemini 2.5 Pro Gemini 2.0

Pro'da Çift Düşünce Sorunu — Çözüldü

Pro ve Think modelleri zaten dahili chain-of-thought üretiyor. Ek Akıl katmanı 5–15 saniye gereksiz gecikme yaratıyordu:

// Pro / Think zaten kendi thinking'ini yapıyor
// Ekstra Akıl çağrısı → 5–15sn gereksiz gecikme
const hasBuiltInThinking =
  ['numex-pro', 'numex-think'].includes(profile);

const akilOutput = (!hasBuiltInThinking && !isSimpleMessage)
  ? await runAkilReasoning(...)
  : ''; // Pro modunda 0ms — akış anında başlar
03 — RAG Bağlam Sistemi

RAG Bağlam Sistemi — Üç Katmanlı Bağlam

Üç katmanlı RAG mimarisi. Numex bilgi havuzu, kullanıcı belgeleri ve sohbet geçmişi Promise.all ile paralel sorgulanır, birleştirilerek modele bağlam olarak enjekte edilir.

01
🌐
Numex Bilgi Havuzu
Genel Türkçe bilgi tabanı. Tüm kullanıcılar için ortak, sürekli güncellenen referans katmanı. Numex'in uzun dönem belleği.
02
📄
Kullanıcı Belgeleri
Yüklenen PDF, DOCX, TXT, PNG/JPG. Chunk'lara bölünür, embed edilir, MongoDB Atlas'a kaydedilir. Sorgu anında ilgili parçalar ragService.search() ile çekilir.
03
💬
Sohbet Geçmişi & Tercihler
Kullanıcının önceki konuşmaları, verdiği yanıtlar, tercihleri. 90 gün saklanır. Her mesajda ilgili bağlam enjekte edilir. Sistem kullanıcıyı zamanla tanır ve gelişir.
⚡  Promise.all paralel sorgu → Üç katman aynı anda çalışır, birleştirilir, customInstr olarak modele gönderilir

🔄 RAG Continuation

"Yeni Sohbette Devam Et" denildiğinde sistem sohbeti chunk'lara böler, embeddinglerini oluşturur ve yeni sohbete bağlar. Kullanıcı yeni sohbet açıyor ama bağlamını kaybetmiyor.

Context window maliyeti sıfırlanır
128K token limiti aşılmaz
Geçmiş otomatik taşınır — kullanıcı hatırlatmak zorunda değil
handleRagContinue/api/rag/bind

⚡ Paralel Sorgu — 200ms Kazanım

// Önceki — Sıralı (600ms toplam)
const rag = await ragService.search(query);
const ctx = await projectService.getCtx();

// Şimdi — Paralel (400ms toplam)
const [rag, ctx] = await Promise.all([
  ragService.search(query),
  projectService.getContext()
]);
// max(400,200) = 400ms — 200ms kazanım
04 — Vicdan Pipeline

Vicdan Pipeline — Etik Değerlendirme Katmanları

Numex sadece zeki değil, iyi olmaya çalışır. Her mesaj üç katmanlı etik değerlendirmeden geçer. NUMEX_VICDAN_PIPELINE=1 — bu bir environment variable değil, bir değer beyanı.

⚖️
Vicdan
GO / REFUSE kararı. Uygunsuz istekleri eler. LLM tabanlı — kural değil, anlayan sistem.
🧠
Akıl
Niyet, ton ve strateji analizi. Karmaşık mesajlarda derin akıl yürütme. Bağlamı kavrar.
💫
Ruh
Akıl çıktısı customInstr'e enjekte edilir. Yanıt kişiselleşir, bağlama uyum sağlar.
Çıktı
Doğrulanmış, etik ve kişiselleştirilmiş yanıt kullanıcıya ulaşır.
Vicdan Timeout
4.000ms → güvenli say, devam et
Akıl Timeout
5.000ms → boş geç, normal devam
Arama Timeout
8.000ms → aramayı atla, yanıt ver
Pro Araç Döngüsü
25.000ms · max 3 tur iterasyon
"Vicdan cevap veremiyorsa — güvenli say." Sistem şüphe durumunda kullanıcıya güveniyor. Varsayılan iyi niyet.— vicdanPipeline.js · VICDAN_CHECK_TIMEOUT_MS = 4000
05 — Graceful Escalation

Graceful Escalation — Model Fallback Zinciri

Bir model yavaşladığında veya başarısız olduğunda sistem sonsuz döngüye düşmez. Bir üst modeli dener. Kullanıcı mağdur olmaz, boş ekran görmez.

gemini-2.0-flash · gemini-1.5-flash
İlk tercih — hızlı, ekonomik
↓ başarısız olursa bir üst katmana geç
gemini-2.5-pro · gemini-2.0-pro
İkinci katman — daha güçlü
↓ başarısız olursa bir üst katmana geç
gpt-4o · gpt-4o-mini
Üçüncü katman — OpenAI
↓ başarısız olursa bir üst katmana geç
claude-sonnet · anthropic altyapısı
Son katman — en güvenilir
↓ tüm modeller başarısızsa
buildGracefulFallbackResponse()
Anlamlı mesaj — asla boş ekran

Sonsuz döngü yok. Her eskalasyon adımı bir kez denenir. Tüm katmanlar başarısızsa buildGracefulFallbackResponse nazik, anlamlı bir mesaj döndürür. Ek olarak: ajan özelliği olmayan planda ajan istenirse "Planınızda Agent özelliği yok" mesajı + yükseltme linki gösterilir.

06 — Altyapı

Altyapı — Vercel, MongoDB Atlas, Cloudflare R2

Vercel Edge, MongoDB Atlas, Cloudflare R2. 100K eş zamanlı yük testi geçildi. Fluid Compute aktif, 800 saniye timeout. Production-grade altyapı, günden güne büyüyen sistem.

Vercel
Edge network, otomatik ölçekleme, Fluid Compute ile 800sn timeout. Express monolith üzerinde çalışır.
fluid: true · maxDuration: 800
🍃
MongoDB Atlas
Sohbet geçmişi, RAG oturumları, kullanıcı profilleri, embedding'ler. Otomatik sharding.
RagSession · Embeddings
☁️
Cloudflare R2
Görsel, ses, video çıktıları ve kullanıcı dosyaları. Egress ücretsiz, S3'e kıyasla düşük maliyet.
Egress ücretsiz
💳
iyzico
SSL güvenli ödeme. Tüm plan geçişleri, yıllık/aylık faturalandırma, e-Fatura/e-Arşiv.
6 plan · KDV dahil

Fluid Compute Konfigürasyonu

// vercel.json — 300sn (önceki) → 800sn (şimdi)
{
  "version": 2,
  "fluid": true,
  "builds": [{
    "use": "@vercel/node",
    "config": { "maxDuration": 800 }
  }]
}
// Derin analiz, dedektif, vicdan pipeline artık kesilmiyor
07 — Felsefe & Vizyon

Felsefe & Vizyon — Logo ve Değerler

Numex logosu normal bakışta modern bir yapay zeka sembolüdür. 180° döndürüldüğünde Selçuklu mimarisinin 8 köşeli yıldızı ortaya çıkar.

Konya, Sivas ve Erzurum'daki Selçuklu medreseleri döneminin bilim merkezleriydi. O köprü, Sivas Gürün'den İstanbul'a, oradan Numex'e uzanıyor.

"Yapay zekayı şeffaf, güvenilir ve insan merkezli yapmak. Yapay zeka insanı desteklemeli, yerini almamalı."— Nurullah Şahin · Kurucu · 3 Yıl 1 Ay 14 Gün · 7 Kişilik Ekip
  • ⚖️
    Vicdan — Her istek etik değerlendirmeden geçer. GO / REFUSE kararı LLM'e bırakılmış, kural değil anlayan sistem.
  • 🧠
    Akıl — Niyet anlaşılır, ton belirlenir, strateji kurulur. Karmaşık mesajlarda derin akıl yürütme.
  • 💫
    Ruh — Bağlam enjekte edilir. Yanıt kişiselleşir. Sistem kullanıcıyı zamanla tanır.
  • 🕵️
    Dedektif — En iyi yanıt paralel inference ile bulunur. LLM-as-a-Judge. Şeffaf gerekçe.
  • 🔗
    RAG Continuation — Kullanıcı yeni sohbet açar ama bağlamını kaybetmez. Sistem hatırlar.
  • 🛡️
    Graceful — Her başarısızlık kibarca yönetilir. Boş ekran yok. Sistem düşmez, yükselir.