Satış Odaklı AI Ekosistemi — Teknik Döküman

Ham Veriyi Ticari Zekaya
Dönüştüren Akıllı Ekosistem

Binlerce satış diyaloğunu yapay zeka ile analiz eden, semantik kümeleme ve çift katmanlı LLM orkestrasyonuyla en etkili cevapları, stratejileri ve pazar içgörülerini otomatik üreten uçtan uca mühendislik çözümü.

384 Boyutlu Vektör
LLM Katmanı
40 Batch İşleme
0.35 Cosine Eşik
Async Celery + Redis
Uçtan Uca Veri Akışı
💬
Ham Mesajlar
Agent-Hasta Diyalogları
🤖
LLM Extraction
1. Katman — Soru Ayıklama
🔮
Semantic Cluster
Embedding + Kümeleme
LLM Synthesis
2. Katman — Cevap + Strateji
🚀
Yayına Alma
API + Admin Panel

Çift Katmanlı Bağımsız Ekosistem

Birbirinden bağımsız ancak sıkı entegrasyonla çalışan iki platform: biri zekayı üretir, diğeri sahaya dağıtır.

Sistem 1

Intelligence Hub

Ham mesaj verilerini alan, NLP pipeline'ı ile vektörleştiren, semantik kümeleyen ve LLM orkestrasyonuyla stratejik FAQ çıktılarını sentezleyen AI analiz çekirdeği. Flask API üzerinden çalışır, Celery + Redis ile asenkron görevleri yönetir.

Python 3.11 Flask Celery Redis Sentence-Transformers Scikit-learn Claude 3.5/4.5 GPT-4o
Sistem 2

Deployment Hub clinicfaq

Analiz edilen FAQ'ların kalıcı olarak saklandığı, yönetildiği ve satış ekibine sunulduğu bağımsız mikro-servis katmanı. Admin panel üzerinden kategorize etme, düzenleme ve toplu yükleme imkânı sunar. Ana backend'den izole çalışarak yüksek uptime sağlar.

PHP 8+ Vanilla JS CSS3 Grid JSON Storage API Bridge WAF Bypass Inter UI
💡
Neden iki ayrı sistem? Intelligence Hub yoğun GPU/CPU kullanır ve dakikalarca süren analizler çalıştırır. Deployment Hub ise satış ekibinin 7/24 eriştiği hafif bir katmandır. İkisini ayırmak, analiz sırasında bile FAQ erişiminin kesintisiz kalmasını garanti eder — tıpkı bir fabrikanın üretim hattıyla showroom'unun ayrı binada olması gibi.

Faza 1: Veri Zekâsı ve Algoritmik Süreçler

Binlerce satırlık ham mesaj verisinin, yüksek performanslı bir AI boru hattından geçerek stratejik satış bilgisine dönüşme süreci.

01

Yüksek Boyutlu Vektörleştirme (Embedding)

Her soru cümlesi, Sentence-Transformers modeli tarafından 384 boyutlu bir sayısal vektöre dönüştürülür. Bu sayede kelime düzeyinde değil, anlam düzeyinde karşılaştırma mümkün hale gelir.

  • Model: paraphrase-multilingual-MiniLM-L12-v2 — çok dilli, hafif ama güçlü
  • Çıktı: Her cümle için [float × 384] boyutlu dense vektör
  • "Fiyat ne kadar?" ile "Tedavi maliyeti nedir?" aynı anlamsal uzayda yakın noktalar olarak konumlanır
02

Semantik Kümeleme (Semantic Clustering)

Embedding'ler üzerinde hiyerarşik kümeleme uygulanarak, aynı konuyu farklı kelimelerle soran mesajlar otomatik gruplandırılır. Bu, klasik "keyword matching"in çok ötesindedir.

  • Algoritma: Agglomerative Clustering (bottom-up hiyerarşik)
  • Metrik: Cosine Similarity — vektörler arası açısal yakınlık
  • Dinamik Eşik: 0.35 mesafe eşiği ile çok geniş veya çok dar gruplamaların önlenmesi
  • Sonuç: Onlarca "aynı anlama gelen" soru tek bir Kanonik Soru altında birleşir
03

Batch LLM İşleme ve Multi-Model Orkestrasyonu

Binlerce mesaj tek seferde değil, token limitlerini aşmamak ve maliyet optimizasyonu sağlamak adına 40'lık yığınlar (batch) halinde LLM'lere gönderilir.

  • Batch boyutu: 40 mesaj/batch — token & cost optimized
  • Modeller: Claude 3.5/4.5 Sonnet + GPT-4o
  • Hibrit strateji: Her modelin güçlü yönü farklı aşamalarda kullanılır
  • Lazy Loading: NLP modelleri RAM tasarrufu için yalnızca ihtiyaç anında yüklenir
04

FAQ Sentezleme ve Strateji Üretimi

Her küme için LLM, üç katmanlı bir çıktı üretir: profesyonel soru formu, satış odaklı ideal cevap ve psikolojik ikna stratejisi.

  • Kanonik Soru: Kümedeki tüm varyasyonların en profesyonel tek ifadesi
  • İdeal Cevap: Tıbbi güven veren, satış odaklı, dönüşüm oranını artıracak formatta
  • Satış Stratejisi: İtiraz karşılama, psikolojik tüyo ve ikna mekanizması
05

Otomatik Kategorizasyon

Her FAQ maddesi, içerik analizine dayalı olarak otomatik sınıflandırılır.

  • Kategoriler: Saç Ekimi, Diş, Fiyat, Konaklama, Güven, vb.
  • Admin panelinden manuel düzenleme ve yeniden atama imkânı
06

Asenkron İşlem Yönetimi

10-15 dakika sürebilen analizler sırasında kullanıcı arayüzü kesinlikle kilitlenmez.

  • Celery: Dağıtık görev kuyruğu — uzun analizleri worker'lara devreder
  • Redis: Mesaj broker ve sonuç backend olarak görev alır
  • Analiz durumu gerçek zamanlı olarak UI'da takip edilebilir
🎭
Çift Katmanlı LLM Orkestrasyonu — Ne Demek?

Bu pipeline'da yapay zeka tek seferde kullanılmaz. LLM, iki tamamen farklı görev için iki ayrı aşamada devreye girer — her katmanın amacı, girdisi ve çıktısı birbirinden farklıdır.

1. Katman — Extraction
Soru Ayıklama (Ham Veri → Kritik Sorular)

LLM'e binlerce ham mesaj satırı verilir. Görev: kaotik mesaj yığınından yalnızca hastaların gerçek sorularını ve endişelerini çekip çıkarmak.

  • Girdi: Binlerce ham agent-hasta mesajı
  • Çıktı: Temiz, yapılandırılmış soru listesi
  • Hedef: "Sinyal"i "gürültü"den ayırmak
  • Batch'ler halinde (40'lık gruplar) gönderilir
Kümeleme Aşaması
2. Katman — Synthesis
FAQ Sentezleme (Kümeler → Strateji)

1. Katmandan çıkan sorular embedding + kümeleme ile gruplandıktan sonra, LLM'e bambaşka bir görevle tekrar gidilir.

  • Girdi: Kümelenmiş soru grupları
  • Çıktı: Kanonik Soru + İdeal Cevap + Satış Stratejisi
  • Hedef: Veriyi satış silahına dönüştürmek
  • Kategorizasyon da bu aşamada yapılır
Arada ne var? İki LLM katmanı arasında Sentence-Transformers embedding ve Agglomerative Clustering aşaması yer alır — yani AI çağrıları arasına klasik ML katmanı yerleştirilerek hem maliyet düşürülür, hem de LLM'e giden verinin kalitesi dramatik şekilde artırılır. Sonuç: 1. Katman temizler → ML gruplar → 2. Katman strateji üretir.

Kaputun Altındaki ML Katmanları:
Neden Bu "Basit Bir AI Projesi" Değil?

Bu proje yalnızca bir LLM API çağrısından ibaret değildir. Araya yerleştirilmiş iki bağımsız Makine Öğrenmesi (ML) katmanı, sistemi gerçek bir mühendislik çözümüne dönüştürür. İşte bu katmanların her birinin ne yaptığı ve neden kritik olduğu:

🧬 ML Katmanı #1

Sentence-Transformers
Deep Learning / Embedding

SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
Ne yapar?

Cümleleri sadece kelime olarak değil, anlamsal olarak 384 boyutlu matematiksel bir vektöre (sayı dizisine) dönüştürür. Bu bir API çağrısı değil — Derin Öğrenme (Deep Learning) modelinin yerel olarak sunucuda çalıştırılmasıdır.

Neden bu ML?

Bu model, milyonlarca veri ile eğitilmiş bir nöral ağdır. Kelimelerin sözlük anlamını değil, bağlamsal ve anlamsal ilişkisini yakalar. "Kaç para?" ile "Tedavi ücreti ne kadar?" arasında tek bir ortak kelime yoktur — ama bu model ikisinin de aynı şeyi sorduğunu matematiksel olarak bilir.

🔬 ML Katmanı #2

Agglomerative Clustering
Unsupervised Machine Learning

from sklearn.cluster import AgglomerativeClustering
Ne yapar?

LLM'den gelen binlerce soruyu alır, vektör uzayındaki mesafelerine (cosine similarity) bakar ve birbirine anlamca benzeyenleri otomatik olarak gruplar. Literatürde "Gözetimsiz Öğrenme" (Unsupervised Learning) olarak geçer.

Neden bu ML?

Burada kararı bir insan veya bir "prompt" değil, matematiksel bir algoritma (Scikit-learn) verir. Herhangi bir etiketlenmiş veri seti gerektirmez — kendi başına yapıyı keşfeder. Bu yüzden "gözetimsiz" (unsupervised) denir.

💎
Bu Aradaki ML Katmanı Olmasaydı Ne Olurdu?

Sistemdeki ML katmanını çıkardığınızı düşünün — yani LLM'den gelen soruları doğrudan, gruplamadan tekrar LLM'e gönderseniz. İşte fark:

✗ ML Katmanı Olmadan
Düz LLM → LLM Yaklaşımı
  • Maliyet patlar: 1000 soru için 1000 ayrı LLM çağrısı gerekir
  • Token israfı: Birbirine benzeyen sorular tekrar tekrar işlenir
  • Kalite düşer: LLM'e çok fazla benzer veri verildiğinde modelin kafası karışır
  • Gruplama yok: Hangi sorunun ne kadar çok sorulduğu bilinemez
  • Sonuç: Pahalı, yavaş, kalitesiz
✓ ML Katmanı ile (Mevcut Mimari)
LLM → ML → LLM Hibrit Yaklaşımı
  • Maliyet %90+ düşer: 1000 soru → ML ile ~50 gruba indirgenir → sadece 50 LLM çağrısı
  • Sıfır israf: Her grup, içindeki en temiz ve en temsili veriyle işlenir
  • Kalite artar: LLM'e sadece rafine edilmiş veri gider, "daha zeki" cevaplar üretir
  • İstatistik çıkar: Küme büyüklükleri, hangi konunun ne kadar sorulduğunu gösterir
  • Sonuç: Ucuz, hızlı, yüksek kaliteli
⭐ Altın Cümle — Mimari Özet
"Sistem, sadece Üretken Yapay Zeka (Generative AI) kullanmakla kalmaz; araya yerleştirilen Vektörel Embedding ve Hiyerarşik Kümeleme (ML) katmanlarıyla veriyi rafine eder. Bu hibrit mimari, maliyeti minimize ederken, üretilen satış stratejilerinin doğruluğunu maksimize eder."
Özetle: Bu projede hem Modern AI (LLM — Claude & GPT-4o) hem de Klasik ML (Deep Learning Embedding + Unsupervised Clustering) kullanılarak hibrit bir mühendislik çözümü inşa edilmiştir. Bu, "ben sadece ChatGPT'ye sordum" diyen projelerden bu çözümü ayıran en büyük farktır.

Uçtan Uca Operasyonel Döngü

Verinin sisteme girişinden satış ekibinin ekranına ulaşmasına kadar tüm adımlar.

Veri Toplama

Belirli tarih aralığındaki (örn: son 30 gün) tüm agent–hasta yazışmaları veritabanından otomatik çekilir. Binlerce ham mesaj satırı sisteme beslenir.

Soru Ayıklama — LLM Katman 1 (Extraction)

LLM, mesaj yığını içinden yalnızca hastaların kritik sorularını ve endişelerini (fiyat, güven, süreç, ağrı, garanti vb.) ayıklar. Gürültü ve gereksiz mesajlar elenir.

Anlamsal Kümeleme — ML Katmanı (Embedding + Clustering)

Ayıklanan sorular Deep Learning modeli ile embedding'lere dönüştürülür, ardından Unsupervised ML algoritması ile birbirine anlamca benzeyen sorular (örn: "Fiyat nedir?" ↔ "Kaç para?") aynı kümede toplanır.

FAQ Sentezleme — LLM Katman 2 (Synthesis)

En büyük kümeler (en çok sorulan konular) için Kanonik Soru, İdeal Cevap ve Satış Stratejisi üretilir. ML tarafından rafine edilen veri sayesinde LLM çok daha isabetli sonuçlar verir.

Kategorizasyon & Yayına Alma

Her FAQ maddesi otomatik sınıflandırılır ve faqs.json dosyasına kaydedilerek Deployment Hub üzerinden satış ekibinin anlık kullanımına açılır.

Faza 2: Dağıtım ve Yönetim Katmanı

Analiz çıktılarının yönetildiği, servis edildiği ve satış ekibine sunulduğu bağımsız platform.

🛡️

API Bridge & Güvenlik

api.php katmanı, ModSecurity ve WAF engellerini aşmak için özelleştirilmiş User-Agent ve Header doğrulama mekanizmaları içerir. SQL bağımlılığı yoktur — veriler optimize edilmiş faqs.json flat-file'da tutularak okuma hızı maksimize edilir.

🎛️

Admin Panel

Modern, Inter-font tabanlı UI ile tüm FAQ'ların kategorize edilmesi, düzenlenmesi, silinmesi ve regex tabanlı Bulk Load (toplu yükleme) işlemleri yapılır. Metin blokları otomatik ayrıştırılır ve sisteme eklenir.

📡

Bağımsız Mikro-Servis

clinicfaq dizini ana backend'den tamamen izole çalışır. Intelligence Hub'da analiz devam ederken bile satış ekibi mevcut FAQ'lara kesintisiz erişim sağlar — yüksek uptime garantisi.

Teknik İnovasyon × Ticari ROI

Bu ekosistem neden "basit bir chatbot" veya "sıradan bir FAQ sayfası" değil — ve işletmeye ne kazandırır.

Tam Otomasyon

Manuel raporlama ve soru derleme ihtiyacını ortadan kaldırır. Binlerce mesaj dakikalar içinde analiz edilir, insan müdahalesi minimumda tutulur.

🧬

Semantik Deduplication

Kelime eşleşmesine değil, cümlenin gerçek anlamına göre gruplandırma. Aynı sorunun onlarca varyasyonu tek kanonik forma indirgenir — gerçek NLP gücü.

🔄

Asenkron Mimari

Celery + Redis sayesinde 10-15 dakikalık analizler arka planda çalışır. UI kilitlenmez, satış ekibi kesintisiz çalışmaya devam eder.

🏆

Bilgi Standardizasyonu

En iyi satış danışmanının tecrübesi, AI aracılığıyla tüm ekibe (junior-senior fark etmeksizin) aktarılır. Bilgi asimetrisi sıfırlanır.

🎯

İtiraz Karşılama

Hastaların en zor sorularına karşı önceden hazırlanmış psikolojik Satış Stratejileri ile dönüşüm oranları (Conversion Rate) doğrudan artırılır.

📊

Proaktif Pazar Analizi

Hastaların en çok hangi aşamada kararsız kaldığını (Fiyat, Güven, Doktor Tecrübesi vb.) istatistiksel olarak raporlar — somut veri ile strateji.

🚀

Hızlı Onboarding

Yeni işe başlayan satış danışmanları için hazır bilgi bankası. Adaptasyon süresi dramatik şekilde kısalır, performans ilk günden yükselir.

💎

Hasta Deneyimi

Tüm ekipten tutarlı, profesyonel ve güven verici cevaplar. Hasta memnuniyeti ve marka algısı yükselir.

🎯
Hibrit Model Avantajı: Hem OpenAI (GPT-4o) hem Anthropic (Claude 3.5/4.5 Sonnet) desteklenir. Her modelin güçlü yönü farklı aşamalarda devreye girer — tek bir AI sağlayıcısına bağımlılık yoktur, maliyet ve kalite dengesini siz kontrol edersiniz.

Sistem Gereksinimleri ve Stack

Ekosistemin arkasındaki tüm teknoloji bileşenleri.

Bileşen Teknoloji
🐍 Backend AI EnginePython 3.11, Flask, Celery, Redis
🧠 NLP / Machine LearningSentence-Transformers (MiniLM-L12-v2), Scikit-learn, NumPy
🤖 LLM ProvidersAnthropic (Claude 3.5 / 4.5 Sonnet), OpenAI (GPT-4o)
🖥️ Frontend & Admin UIPHP 8+, Vanilla JavaScript, CSS3 (Variables, Grid, Flexbox)
💾 StorageFlat-File JSON (faqs.json) — SQL-free, Read-Optimized
🔐 GüvenlikCustom API Bridge (api.php), WAF/ModSecurity Header Bypass
⚙️ Task QueueCelery Worker + Redis (Broker & Result Backend)
🎨 TypographyInter Font Family, JetBrains Mono (code)

Deployment Notları

Sistemi ayağa kaldırmak için gereken üç temel adım.

01

Flask API Engine

python -m venv venv
source venv/bin/activate
pip install -r requirements.txt

# .env dosyasını yapılandırın
# ANTHROPIC_API_KEY=...
# OPENAI_API_KEY=...

python app.py

API anahtarları .env dosyasında tanımlanmalı.

02

Celery Worker

# Redis çalışıyor olmalı
redis-server

# Worker başlat
celery -A celery_app worker \
  --loglevel=info

Asenkron analiz görevleri bu worker üzerinden yürütülür.

03

Frontend & Deployment Hub

# PHP sunucusu üzerinden
# dizinleri yayına alın:

/0602       → Ana Frontend
/clinicfaq  → FAQ API + Admin

clinicfaq dizini bağımsız domain/subdomain olarak da çalışabilir.