Numex AI — Mimari & Teknoloji Dokümantasyonu

01 — Dedektif Mimarisi

Dedektif Mimarisi — LLM-as-a-Judge

Tek model yanılabilir, önyargılı olabilir. Numex iki modeli paralel çalıştırır, Claude Sonnet hakem olarak en iyi yanıtı seçer ve gerekçesini şeffaf biçimde açıklar.

💬

Kullanıcı mesaj gönderir

Sistem sorunun karmaşıklığını değerlendirir. Basit sorular normal akışa, çıkmaza giren veya derin analiz gerektiren sorular Dedektif moduna yönlendirilir.

⚡

Paralel inference — GPT & Gemini

GPT-4o ve Gemini 2.5 Pro aynı anda sorguya gönderilir. İki farklı mimari, iki farklı perspektif. Bekleme süresi ikiye katlanmaz — tek yanıt süresi kadar sürer.

⚖️

Claude Sonnet — LLM-as-a-Judge

Her iki yanıtı okur, mantık zincirini analiz eder, varsayımları sorgular, kenar durumları kontrol eder, güvenilirlik skoru üretir. Akademik ve endüstri literatüründe değerlendirici model yaklaşımları tartışılmaktadır; Numex ürünündeki sonuçlar kullanım senaryosuna göre değişir ve burada paylaşılan yüzde iddiaları bağımsız bir vaka çalışması veya tekrarlanabilir benchmark ile doğrulanmamıştır.

🏆

Kazanan + gerekçe kullanıcıya ulaşır

Sadece en iyi yanıt değil, neden seçildiği de gösterilir. Şeffaflık güveni inşa eder.

🙋

Kullanıcı tetikli mod

Dedektif her sorguda çalışmaz. Sistem yetersiz kaldığında "Dedektif devreye girsin mi?" diye sorar. Kullanıcı onaylarsa başlar. Maliyet kontrolü + kullanıcıya güç.

Örnek Hakem Kararı

GPT-4o

85

✓ Kazanan

VS

Gemini 2.5

65

🤖

Hakem

Claude Sonnet

Hakem Gerekçesi "GPT-4o daha kapsamlı: hem cleanup eksikliğini hem dependency array hatasını tespit etmiş. Gemini alternatif çözüm sunuyor ama temel sorunu çözmüyor."

Meta-Akıl Yürütme

Claude hakem sadece "hangisi daha iyi?" sormaz. Mantık zinciri, varsayımlar, kenar durumlar, güvenilirlik — dört boyutlu değerlendirme. Her kararın gerekçesi kullanıcıya sunulur.

🎯 Akıllı Tetikleyici — False Positive Önlemi

✓ Tetiklenir — Pozitif Bağlam

"Bu konuda araştır"

"Bunu araştır", "Şunu bul"

"güncel veri", "son istatistik"

"fiyat", "piyasa değeri"

"kim kazandı", "kaç kişi"

✗ Tetiklenmez — Negatif Bağlam

"Araştırmacı olmak istiyorum"

"Araştırma görevlisi arıyorum"

"Kariyer araştırması yapıyorum"

Meslek / kariyer cümleleri

Akademik bağlamlı kullanım

Negatif bağlam kontrolü önce çalışır. Eşleşirse arama başlamaz. Bu mimari false positive üretmez — kullanıcı beklenmedik arama sonuçlarıyla karşılaşmaz.

02 — Model Mimarisi

Model Mimarisi — Fast, Pro, Vision

Pro modunda kullanıcı hiçbir şey seçmek zorunda değildir. Görsel geldiğinde Vision aktif olur, güncel veri sorulduğunda web aranır, derin analiz gerektiğinde Think devreye girer — otomatik olarak.

Numex Fast

Hız Modu

Günlük kullanım, kısa yanıtlar, düşük gecikme. Free ve Basic planlarda varsayılan model.

Kullandığı Modeller

Gemini 2.0 Flash Gemini 1.5 Flash GPT-4o Mini GPT-3.5

Numex Pro

Tam Güç

Görsel anlama + web araması + derin düşünce otomatik. Pro ve üzeri planlarda. Dedektif burada çalışır.

Kullandığı Modeller

Claude Sonnet GPT-4o Gemini 2.5 Pro Gemini 2.0

Numex Vision

Görsel Mod

Görsel yüklendiğinde Pro'dan ayrılmaz — Pro içinde otomatik etkinleşir. Ayrı model değil, entegre yetenek.

Kullandığı Modeller

GPT-4o Gemini 2.5 Pro Gemini 2.0

Pro'da Çift Düşünce Sorunu — Çözüldü

Pro ve Think modelleri zaten dahili chain-of-thought üretiyor. Ek Akıl katmanı 5–15 saniye gereksiz gecikme yaratıyordu:

// Pro / Think zaten kendi thinking'ini yapıyor
// Ekstra Akıl çağrısı → 5–15sn gereksiz gecikme
const hasBuiltInThinking =
  ['numex-pro', 'numex-think'].includes(profile);

const akilOutput = (!hasBuiltInThinking && !isSimpleMessage)
  ? await runAkilReasoning(...)
  : ''; // Pro modunda 0ms — akış anında başlar

03 — RAG Bağlam Sistemi

RAG Bağlam Sistemi — Üç Katmanlı Bağlam

Üç katmanlı RAG mimarisi. Numex bilgi havuzu, kullanıcı belgeleri ve sohbet geçmişi Promise.all ile paralel sorgulanır, birleştirilerek modele bağlam olarak enjekte edilir.

01

🌐

Numex Bilgi Havuzu

Genel Türkçe bilgi tabanı. Tüm kullanıcılar için ortak, sürekli güncellenen referans katmanı. Numex'in uzun dönem belleği.

›

02

📄

Kullanıcı Belgeleri

Yüklenen PDF, DOCX, TXT, PNG/JPG. Chunk'lara bölünür, embed edilir, MongoDB Atlas'a kaydedilir. Sorgu anında ilgili parçalar ragService.search() ile çekilir.

›

03

💬

Sohbet Geçmişi & Tercihler

Kullanıcının önceki konuşmaları, verdiği yanıtlar, tercihleri. 90 gün saklanır. Her mesajda ilgili bağlam enjekte edilir. Sistem kullanıcıyı zamanla tanır ve gelişir.

›

⚡ Promise.all paralel sorgu → Üç katman aynı anda çalışır, birleştirilir, customInstr olarak modele gönderilir

🔄 RAG Continuation

"Yeni Sohbette Devam Et" denildiğinde sistem sohbeti chunk'lara böler, embeddinglerini oluşturur ve yeni sohbete bağlar. Kullanıcı yeni sohbet açıyor ama bağlamını kaybetmiyor.

›Context window maliyeti sıfırlanır

›128K token limiti aşılmaz

›Geçmiş otomatik taşınır — kullanıcı hatırlatmak zorunda değil

›handleRagContinue → /api/rag/bind

⚡ Paralel Sorgu — 200ms Kazanım

// Önceki — Sıralı (600ms toplam)
const rag = await ragService.search(query);
const ctx = await projectService.getCtx();

// Şimdi — Paralel (400ms toplam)
const [rag, ctx] = await Promise.all([
  ragService.search(query),
  projectService.getContext()
]);
// max(400,200) = 400ms — 200ms kazanım

04 — Vicdan Pipeline

Vicdan Pipeline — Etik Değerlendirme Katmanları

Numex sadece zeki değil, iyi olmaya çalışır. Her mesaj üç katmanlı etik değerlendirmeden geçer. NUMEX_VICDAN_PIPELINE=1 — bu bir environment variable değil, bir değer beyanı.

⚖️

Vicdan

GO / REFUSE kararı. Uygunsuz istekleri eler. LLM tabanlı — kural değil, anlayan sistem.

🧠

Akıl

Niyet, ton ve strateji analizi. Karmaşık mesajlarda derin akıl yürütme. Bağlamı kavrar.

💫

Ruh

Akıl çıktısı customInstr'e enjekte edilir. Yanıt kişiselleşir, bağlama uyum sağlar.

✨

Çıktı

Doğrulanmış, etik ve kişiselleştirilmiş yanıt kullanıcıya ulaşır.

Vicdan Timeout

4.000ms → güvenli say, devam et

Akıl Timeout

5.000ms → boş geç, normal devam

Arama Timeout

8.000ms → aramayı atla, yanıt ver

Pro Araç Döngüsü

25.000ms · max 3 tur iterasyon

"Vicdan cevap veremiyorsa — güvenli say." Sistem şüphe durumunda kullanıcıya güveniyor. Varsayılan iyi niyet.— vicdanPipeline.js · VICDAN_CHECK_TIMEOUT_MS = 4000

05 — Graceful Escalation

Graceful Escalation — Model Fallback Zinciri

Bir model yavaşladığında veya başarısız olduğunda sistem sonsuz döngüye düşmez. Bir üst modeli dener. Kullanıcı mağdur olmaz, boş ekran görmez.

Gemini Flash

gemini-2.0-flash · gemini-1.5-flash

İlk tercih — hızlı, ekonomik

↓ başarısız olursa bir üst katmana geç

Gemini Pro

gemini-2.5-pro · gemini-2.0-pro

İkinci katman — daha güçlü

↓ başarısız olursa bir üst katmana geç

GPT-4o

gpt-4o · gpt-4o-mini

Üçüncü katman — OpenAI

↓ başarısız olursa bir üst katmana geç

Claude Sonnet

claude-sonnet · anthropic altyapısı

Son katman — en güvenilir

↓ tüm modeller başarısızsa

Graceful Fallback

buildGracefulFallbackResponse()

Anlamlı mesaj — asla boş ekran

Sonsuz döngü yok. Her eskalasyon adımı bir kez denenir. Tüm katmanlar başarısızsa buildGracefulFallbackResponse nazik, anlamlı bir mesaj döndürür. Ek olarak: ajan özelliği olmayan planda ajan istenirse "Planınızda Agent özelliği yok" mesajı + yükseltme linki gösterilir.

06 — Altyapı

Altyapı — Vercel, MongoDB Atlas, Cloudflare R2

Vercel Edge, MongoDB Atlas, Cloudflare R2. 100K eş zamanlı yük testi geçildi. Fluid Compute aktif, 800 saniye timeout. Production-grade altyapı, günden güne büyüyen sistem.

▲

Vercel

Edge network, otomatik ölçekleme, Fluid Compute ile 800sn timeout. Express monolith üzerinde çalışır.

fluid: true · maxDuration: 800

🍃

MongoDB Atlas

Sohbet geçmişi, RAG oturumları, kullanıcı profilleri, embedding'ler. Otomatik sharding.

RagSession · Embeddings

☁️

Cloudflare R2

Görsel, ses, video çıktıları ve kullanıcı dosyaları. Egress ücretsiz, S3'e kıyasla düşük maliyet.

Egress ücretsiz

💳

iyzico

SSL güvenli ödeme. Tüm plan geçişleri, yıllık/aylık faturalandırma, e-Fatura/e-Arşiv.

6 plan · KDV dahil

Fluid Compute Konfigürasyonu

// vercel.json — 300sn (önceki) → 800sn (şimdi)
{
  "version": 2,
  "fluid": true,
  "builds": [{
    "use": "@vercel/node",
    "config": { "maxDuration": 800 }
  }]
}
// Derin analiz, dedektif, vicdan pipeline artık kesilmiyor

07 — Felsefe & Vizyon

Felsefe & Vizyon — Logo ve Değerler

Numex logosu normal bakışta modern bir yapay zeka sembolüdür. 180° döndürüldüğünde Selçuklu mimarisinin 8 köşeli yıldızı ortaya çıkar.

Konya, Sivas ve Erzurum'daki Selçuklu medreseleri döneminin bilim merkezleriydi. O köprü, Sivas Gürün'den İstanbul'a, oradan Numex'e uzanıyor.

"Yapay zekayı şeffaf, güvenilir ve insan merkezli yapmak. Yapay zeka insanı desteklemeli, yerini almamalı."— Nurullah Şahin · Kurucu · 3 Yıl 1 Ay 14 Gün · 7 Kişilik Ekip

⚖️
Vicdan — Her istek etik değerlendirmeden geçer. GO / REFUSE kararı LLM'e bırakılmış, kural değil anlayan sistem.
🧠
Akıl — Niyet anlaşılır, ton belirlenir, strateji kurulur. Karmaşık mesajlarda derin akıl yürütme.
💫
Ruh — Bağlam enjekte edilir. Yanıt kişiselleşir. Sistem kullanıcıyı zamanla tanır.
🕵️
Dedektif — En iyi yanıt paralel inference ile bulunur. LLM-as-a-Judge. Şeffaf gerekçe.
🔗
RAG Continuation — Kullanıcı yeni sohbet açar ama bağlamını kaybetmez. Sistem hatırlar.
🛡️
Graceful — Her başarısızlık kibarca yönetilir. Boş ekran yok. Sistem düşmez, yükselir.

Pipeline motoru, Dedektif, RAG.Teknik dokümantasyon.

Dedektif Mimarisi — LLM-as-a-Judge

Meta-Akıl Yürütme

Model Mimarisi — Fast, Pro, Vision

Pro'da Çift Düşünce Sorunu — Çözüldü

RAG Bağlam Sistemi — Üç Katmanlı Bağlam

🔄 RAG Continuation

⚡ Paralel Sorgu — 200ms Kazanım

Vicdan Pipeline — Etik Değerlendirme Katmanları

Graceful Escalation — Model Fallback Zinciri

Altyapı — Vercel, MongoDB Atlas, Cloudflare R2

Fluid Compute Konfigürasyonu

Felsefe & Vizyon — Logo ve Değerler

Pipeline motoru, Dedektif, RAG.
Teknik dokümantasyon.