AI — Akıllı Veri Analiz & FAQ Dağıtım Ekosistemi

Sistem Mimarisi

Çift Katmanlı Bağımsız Ekosistem

Birbirinden bağımsız ancak sıkı entegrasyonla çalışan iki platform: biri zekayı üretir, diğeri sahaya dağıtır.

Sistem 1

Intelligence Hub

Ham mesaj verilerini alan, NLP pipeline'ı ile vektörleştiren, semantik kümeleyen ve LLM orkestrasyonuyla stratejik FAQ çıktılarını sentezleyen AI analiz çekirdeği. Flask API üzerinden çalışır, Celery + Redis ile asenkron görevleri yönetir.

Python 3.11 Flask Celery Redis Sentence-Transformers Scikit-learn Claude 3.5/4.5 GPT-4o

Sistem 2

Deployment Hub `clinicfaq`

Analiz edilen FAQ'ların kalıcı olarak saklandığı, yönetildiği ve satış ekibine sunulduğu bağımsız mikro-servis katmanı. Admin panel üzerinden kategorize etme, düzenleme ve toplu yükleme imkânı sunar. Ana backend'den izole çalışarak yüksek uptime sağlar.

PHP 8+ Vanilla JS CSS3 Grid JSON Storage API Bridge WAF Bypass Inter UI

💡

Neden iki ayrı sistem? Intelligence Hub yoğun GPU/CPU kullanır ve dakikalarca süren analizler çalıştırır. Deployment Hub ise satış ekibinin 7/24 eriştiği hafif bir katmandır. İkisini ayırmak, analiz sırasında bile FAQ erişiminin kesintisiz kalmasını garanti eder — tıpkı bir fabrikanın üretim hattıyla showroom'unun ayrı binada olması gibi.

AI Pipeline Detayları

Faza 1: Veri Zekâsı ve Algoritmik Süreçler

Binlerce satırlık ham mesaj verisinin, yüksek performanslı bir AI boru hattından geçerek stratejik satış bilgisine dönüşme süreci.

Yüksek Boyutlu Vektörleştirme (Embedding)

Her soru cümlesi, Sentence-Transformers modeli tarafından 384 boyutlu bir sayısal vektöre dönüştürülür. Bu sayede kelime düzeyinde değil, anlam düzeyinde karşılaştırma mümkün hale gelir.

Model: paraphrase-multilingual-MiniLM-L12-v2 — çok dilli, hafif ama güçlü
Çıktı: Her cümle için [float × 384] boyutlu dense vektör
"Fiyat ne kadar?" ile "Tedavi maliyeti nedir?" aynı anlamsal uzayda yakın noktalar olarak konumlanır

Semantik Kümeleme (Semantic Clustering)

Embedding'ler üzerinde hiyerarşik kümeleme uygulanarak, aynı konuyu farklı kelimelerle soran mesajlar otomatik gruplandırılır. Bu, klasik "keyword matching"in çok ötesindedir.

Algoritma: Agglomerative Clustering (bottom-up hiyerarşik)
Metrik: Cosine Similarity — vektörler arası açısal yakınlık
Dinamik Eşik: 0.35 mesafe eşiği ile çok geniş veya çok dar gruplamaların önlenmesi
Sonuç: Onlarca "aynı anlama gelen" soru tek bir Kanonik Soru altında birleşir

Batch LLM İşleme ve Multi-Model Orkestrasyonu

Binlerce mesaj tek seferde değil, token limitlerini aşmamak ve maliyet optimizasyonu sağlamak adına 40'lık yığınlar (batch) halinde LLM'lere gönderilir.

Batch boyutu: 40 mesaj/batch — token & cost optimized
Modeller: Claude 3.5/4.5 Sonnet + GPT-4o
Hibrit strateji: Her modelin güçlü yönü farklı aşamalarda kullanılır
Lazy Loading: NLP modelleri RAM tasarrufu için yalnızca ihtiyaç anında yüklenir

FAQ Sentezleme ve Strateji Üretimi

Her küme için LLM, üç katmanlı bir çıktı üretir: profesyonel soru formu, satış odaklı ideal cevap ve psikolojik ikna stratejisi.

Kanonik Soru: Kümedeki tüm varyasyonların en profesyonel tek ifadesi
İdeal Cevap: Tıbbi güven veren, satış odaklı, dönüşüm oranını artıracak formatta
Satış Stratejisi: İtiraz karşılama, psikolojik tüyo ve ikna mekanizması

Otomatik Kategorizasyon

Her FAQ maddesi, içerik analizine dayalı olarak otomatik sınıflandırılır.

Kategoriler: Saç Ekimi, Diş, Fiyat, Konaklama, Güven, vb.
Admin panelinden manuel düzenleme ve yeniden atama imkânı

Asenkron İşlem Yönetimi

10-15 dakika sürebilen analizler sırasında kullanıcı arayüzü kesinlikle kilitlenmez.

Celery: Dağıtık görev kuyruğu — uzun analizleri worker'lara devreder
Redis: Mesaj broker ve sonuç backend olarak görev alır
Analiz durumu gerçek zamanlı olarak UI'da takip edilebilir

🎭

Çift Katmanlı LLM Orkestrasyonu — Ne Demek?

Bu pipeline'da yapay zeka tek seferde kullanılmaz. LLM, iki tamamen farklı görev için iki ayrı aşamada devreye girer — her katmanın amacı, girdisi ve çıktısı birbirinden farklıdır.

1. Katman — Extraction

Soru Ayıklama (Ham Veri → Kritik Sorular)

LLM'e binlerce ham mesaj satırı verilir. Görev: kaotik mesaj yığınından yalnızca hastaların gerçek sorularını ve endişelerini çekip çıkarmak.

Girdi: Binlerce ham agent-hasta mesajı
Çıktı: Temiz, yapılandırılmış soru listesi
Hedef: "Sinyal"i "gürültü"den ayırmak
Batch'ler halinde (40'lık gruplar) gönderilir

⟹

Kümeleme Aşaması

⟹

2. Katman — Synthesis

FAQ Sentezleme (Kümeler → Strateji)

1. Katmandan çıkan sorular embedding + kümeleme ile gruplandıktan sonra, LLM'e bambaşka bir görevle tekrar gidilir.

Girdi: Kümelenmiş soru grupları
Çıktı: Kanonik Soru + İdeal Cevap + Satış Stratejisi
Hedef: Veriyi satış silahına dönüştürmek
Kategorizasyon da bu aşamada yapılır

Arada ne var? İki LLM katmanı arasında Sentence-Transformers embedding ve Agglomerative Clustering aşaması yer alır — yani AI çağrıları arasına klasik ML katmanı yerleştirilerek hem maliyet düşürülür, hem de LLM'e giden verinin kalitesi dramatik şekilde artırılır. Sonuç: 1. Katman temizler → ML gruplar → 2. Katman strateji üretir.

ML Deep Dive — Teknik Ayrıntı

Kaputun Altındaki ML Katmanları:
Neden Bu "Basit Bir AI Projesi" Değil?

Bu proje yalnızca bir LLM API çağrısından ibaret değildir. Araya yerleştirilmiş iki bağımsız Makine Öğrenmesi (ML) katmanı, sistemi gerçek bir mühendislik çözümüne dönüştürür. İşte bu katmanların her birinin ne yaptığı ve neden kritik olduğu:

🧬 ML Katmanı #1

Sentence-Transformers
Deep Learning / Embedding

SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')

Ne yapar?

Cümleleri sadece kelime olarak değil, anlamsal olarak 384 boyutlu matematiksel bir vektöre (sayı dizisine) dönüştürür. Bu bir API çağrısı değil — Derin Öğrenme (Deep Learning) modelinin yerel olarak sunucuda çalıştırılmasıdır.

Neden bu ML?

Bu model, milyonlarca veri ile eğitilmiş bir nöral ağdır. Kelimelerin sözlük anlamını değil, bağlamsal ve anlamsal ilişkisini yakalar. "Kaç para?" ile "Tedavi ücreti ne kadar?" arasında tek bir ortak kelime yoktur — ama bu model ikisinin de aynı şeyi sorduğunu matematiksel olarak bilir.

🔬 ML Katmanı #2

Agglomerative Clustering
Unsupervised Machine Learning

from sklearn.cluster import AgglomerativeClustering

Ne yapar?

LLM'den gelen binlerce soruyu alır, vektör uzayındaki mesafelerine (cosine similarity) bakar ve birbirine anlamca benzeyenleri otomatik olarak gruplar. Literatürde "Gözetimsiz Öğrenme" (Unsupervised Learning) olarak geçer.

Neden bu ML?

Burada kararı bir insan veya bir "prompt" değil, matematiksel bir algoritma (Scikit-learn) verir. Herhangi bir etiketlenmiş veri seti gerektirmez — kendi başına yapıyı keşfeder. Bu yüzden "gözetimsiz" (unsupervised) denir.

💎

Bu Aradaki ML Katmanı Olmasaydı Ne Olurdu?

Sistemdeki ML katmanını çıkardığınızı düşünün — yani LLM'den gelen soruları doğrudan, gruplamadan tekrar LLM'e gönderseniz. İşte fark:

✗ ML Katmanı Olmadan

Düz LLM → LLM Yaklaşımı

Maliyet patlar: 1000 soru için 1000 ayrı LLM çağrısı gerekir
Token israfı: Birbirine benzeyen sorular tekrar tekrar işlenir
Kalite düşer: LLM'e çok fazla benzer veri verildiğinde modelin kafası karışır
Gruplama yok: Hangi sorunun ne kadar çok sorulduğu bilinemez
Sonuç: Pahalı, yavaş, kalitesiz

✓ ML Katmanı ile (Mevcut Mimari)

LLM → ML → LLM Hibrit Yaklaşımı

Maliyet %90+ düşer: 1000 soru → ML ile ~50 gruba indirgenir → sadece 50 LLM çağrısı
Sıfır israf: Her grup, içindeki en temiz ve en temsili veriyle işlenir
Kalite artar: LLM'e sadece rafine edilmiş veri gider, "daha zeki" cevaplar üretir
İstatistik çıkar: Küme büyüklükleri, hangi konunun ne kadar sorulduğunu gösterir
Sonuç: Ucuz, hızlı, yüksek kaliteli

⭐ Altın Cümle — Mimari Özet

"Sistem, sadece Üretken Yapay Zeka (Generative AI) kullanmakla kalmaz; araya yerleştirilen Vektörel Embedding ve Hiyerarşik Kümeleme (ML) katmanlarıyla veriyi rafine eder. Bu hibrit mimari, maliyeti minimize ederken, üretilen satış stratejilerinin doğruluğunu maksimize eder."

Özetle: Bu projede hem Modern AI (LLM — Claude & GPT-4o) hem de Klasik ML (Deep Learning Embedding + Unsupervised Clustering) kullanılarak hibrit bir mühendislik çözümü inşa edilmiştir. Bu, "ben sadece ChatGPT'ye sordum" diyen projelerden bu çözümü ayıran en büyük farktır.

İş Akışı

Uçtan Uca Operasyonel Döngü

Verinin sisteme girişinden satış ekibinin ekranına ulaşmasına kadar tüm adımlar.

①

Veri Toplama

Belirli tarih aralığındaki (örn: son 30 gün) tüm agent–hasta yazışmaları veritabanından otomatik çekilir. Binlerce ham mesaj satırı sisteme beslenir.

②

Soru Ayıklama — LLM Katman 1 (Extraction)

LLM, mesaj yığını içinden yalnızca hastaların kritik sorularını ve endişelerini (fiyat, güven, süreç, ağrı, garanti vb.) ayıklar. Gürültü ve gereksiz mesajlar elenir.

③

Anlamsal Kümeleme — ML Katmanı (Embedding + Clustering)

Ayıklanan sorular Deep Learning modeli ile embedding'lere dönüştürülür, ardından Unsupervised ML algoritması ile birbirine anlamca benzeyen sorular (örn: "Fiyat nedir?" ↔ "Kaç para?") aynı kümede toplanır.

④

FAQ Sentezleme — LLM Katman 2 (Synthesis)

En büyük kümeler (en çok sorulan konular) için Kanonik Soru, İdeal Cevap ve Satış Stratejisi üretilir. ML tarafından rafine edilen veri sayesinde LLM çok daha isabetli sonuçlar verir.

⑤

Kategorizasyon & Yayına Alma

Her FAQ maddesi otomatik sınıflandırılır ve faqs.json dosyasına kaydedilerek Deployment Hub üzerinden satış ekibinin anlık kullanımına açılır.

Deployment Hub

Faza 2: Dağıtım ve Yönetim Katmanı

Analiz çıktılarının yönetildiği, servis edildiği ve satış ekibine sunulduğu bağımsız platform.

🛡️

API Bridge & Güvenlik

api.php katmanı, ModSecurity ve WAF engellerini aşmak için özelleştirilmiş User-Agent ve Header doğrulama mekanizmaları içerir. SQL bağımlılığı yoktur — veriler optimize edilmiş faqs.json flat-file'da tutularak okuma hızı maksimize edilir.

🎛️

Admin Panel

Modern, Inter-font tabanlı UI ile tüm FAQ'ların kategorize edilmesi, düzenlenmesi, silinmesi ve regex tabanlı Bulk Load (toplu yükleme) işlemleri yapılır. Metin blokları otomatik ayrıştırılır ve sisteme eklenir.

📡

Bağımsız Mikro-Servis

clinicfaq dizini ana backend'den tamamen izole çalışır. Intelligence Hub'da analiz devam ederken bile satış ekibi mevcut FAQ'lara kesintisiz erişim sağlar — yüksek uptime garantisi.

Değer & Faydalar

Teknik İnovasyon × Ticari ROI

Bu ekosistem neden "basit bir chatbot" veya "sıradan bir FAQ sayfası" değil — ve işletmeye ne kazandırır.

⚡

Tam Otomasyon

Manuel raporlama ve soru derleme ihtiyacını ortadan kaldırır. Binlerce mesaj dakikalar içinde analiz edilir, insan müdahalesi minimumda tutulur.

🧬

Semantik Deduplication

Kelime eşleşmesine değil, cümlenin gerçek anlamına göre gruplandırma. Aynı sorunun onlarca varyasyonu tek kanonik forma indirgenir — gerçek NLP gücü.

🔄

Asenkron Mimari

Celery + Redis sayesinde 10-15 dakikalık analizler arka planda çalışır. UI kilitlenmez, satış ekibi kesintisiz çalışmaya devam eder.

🏆

Bilgi Standardizasyonu

En iyi satış danışmanının tecrübesi, AI aracılığıyla tüm ekibe (junior-senior fark etmeksizin) aktarılır. Bilgi asimetrisi sıfırlanır.

🎯

İtiraz Karşılama

Hastaların en zor sorularına karşı önceden hazırlanmış psikolojik Satış Stratejileri ile dönüşüm oranları (Conversion Rate) doğrudan artırılır.

📊

Proaktif Pazar Analizi

Hastaların en çok hangi aşamada kararsız kaldığını (Fiyat, Güven, Doktor Tecrübesi vb.) istatistiksel olarak raporlar — somut veri ile strateji.

🚀

Hızlı Onboarding

Yeni işe başlayan satış danışmanları için hazır bilgi bankası. Adaptasyon süresi dramatik şekilde kısalır, performans ilk günden yükselir.

💎

Hasta Deneyimi

Tüm ekipten tutarlı, profesyonel ve güven verici cevaplar. Hasta memnuniyeti ve marka algısı yükselir.

🎯

Hibrit Model Avantajı: Hem OpenAI (GPT-4o) hem Anthropic (Claude 3.5/4.5 Sonnet) desteklenir. Her modelin güçlü yönü farklı aşamalarda devreye girer — tek bir AI sağlayıcısına bağımlılık yoktur, maliyet ve kalite dengesini siz kontrol edersiniz.

Bileşen	Teknoloji
🐍 Backend AI Engine	Python 3.11, Flask, Celery, Redis
🧠 NLP / Machine Learning	Sentence-Transformers (MiniLM-L12-v2), Scikit-learn, NumPy
🤖 LLM Providers	Anthropic (Claude 3.5 / 4.5 Sonnet), OpenAI (GPT-4o)
🖥️ Frontend & Admin UI	PHP 8+, Vanilla JavaScript, CSS3 (Variables, Grid, Flexbox)
💾 Storage	Flat-File JSON (faqs.json) — SQL-free, Read-Optimized
🔐 Güvenlik	Custom API Bridge (api.php), WAF/ModSecurity Header Bypass
⚙️ Task Queue	Celery Worker + Redis (Broker & Result Backend)
🎨 Typography	Inter Font Family, JetBrains Mono (code)

Kurulum

Deployment Notları

Sistemi ayağa kaldırmak için gereken üç temel adım.

Flask API Engine

python -m venv venv
source venv/bin/activate
pip install -r requirements.txt

# .env dosyasını yapılandırın
# ANTHROPIC_API_KEY=...
# OPENAI_API_KEY=...

python app.py

API anahtarları .env dosyasında tanımlanmalı.

Celery Worker

# Redis çalışıyor olmalı
redis-server

# Worker başlat
celery -A celery_app worker \
  --loglevel=info

Asenkron analiz görevleri bu worker üzerinden yürütülür.

Frontend & Deployment Hub

# PHP sunucusu üzerinden
# dizinleri yayına alın:

/0602       → Ana Frontend
/clinicfaq  → FAQ API + Admin

clinicfaq dizini bağımsız domain/subdomain olarak da çalışabilir.