Mihenk-LLM v2 35B-A3B Turkish Financial Model

Mihenk-LLM v2 A/B değerlendirme özeti

Model Açıklaması

Mihenk-LLM v2, Türkçe finansal muhakeme, BIST odaklı finansal tablo yorumu, kripto varlık analizi, portföy risk yönetimi ve güvenli finansal yanıt üretimi için fine-tune edilmiş bir Qwen3.6 tabanlı modeldir.

Bu sürüm, ilk Mihenk-LLM modelindeki Türkçe finans uzmanlığı çizgisini korurken daha güçlü bir temel modele taşınmıştır:

  • v1: Qwen/Qwen3-14B tabanlı Mihenk-LLM 14B.
  • v2: Qwen/Qwen3.6-35B-A3B tabanlı, 35B toplam / yaklaşık 3B aktif parametreli MoE mimarisinden türetilen merged model.

Model özellikle Türkçe kullanıcıların finansal kavramları anlaması, şirket finansalları üzerinde kalite/risk analizi yapması, piyasa senaryolarını dengeli değerlendirmesi ve yatırım tavsiyesi sınırını aşmadan açıklayıcı yanıt alması için optimize edilmiştir.

Önemli: Bu model eğitim ve araştırma amaçlıdır. Üretilen içerik yatırım tavsiyesi değildir; alım-satım kararı, vergi yorumu veya kişisel portföy kararı için lisanslı uzmanlara ve resmi kaynaklara başvurulmalıdır.

Temel Yetenekler

  • Türkçe finansal muhakeme: BIST ÅŸirketleri, finansal tablolar, nakit akışı, kârlılık kalitesi, bilanço ve gelir tablosu iliÅŸkileri.
  • Kripto ve makro analiz: Bitcoin halving, arz-talep dengesi, likidite, faiz, dolar endeksi, risk iÅŸtahı ve kurumsal talep çerçevesi.
  • Risk yönetimi: Kur riski, sektör yoÄŸunlaÅŸması, kaldıraç, portföy çeÅŸitlendirme, hedge mantığı ve senaryo analizi.
  • Güvenli finansal sınırlar: KiÅŸiselleÅŸtirilmiÅŸ yatırım tavsiyesi, manipülatif piyasa davranışı veya kesin getiri iddiası üretmemeye odaklı yanıt stili.
  • Format disiplini: Tablo, maddeli analiz, yapılandırılmış cevap ve kısa/uzun finansal açıklama formatlarını koruma.
  • Türkçe terminoloji: Türkiye piyasaları ve global finans terminolojisini Türkçe açıklama ile birlikte kullanma.

Başarılı Olduğu Alanlar

Mihenk-LLM v2, base Qwen3.6-35B-A3B modele karşı yapılan küçük ölçekli A/B judge smoke testinde özellikle şu alanlarda daha güçlü sinyal verdi:

Alan Gözlenen Kazanım
Türkçe finans domain muhakemesi Finansal tablo kalemlerini ve risk nedenlerini daha alan-odaklı açıklama
BIST / nakit akışı analizi Net kâr ile işletme nakit akışı uyumsuzluğunu çalışma sermayesi, alacak, stok, borç ve nakit dönüşümü açısından açıklama
Portföy risk planı Kur riski, sektör yoğunlaşması ve kaldıraç riskini ölçüm + aksiyon planı yapısıyla ele alma
Güvenli finans yanıtları Smoke testte finance safety boundary failure üretmeme
Format geçerliliği Smoke testte format validity değerinin %100 olması
Token / özel tag hijyeni Special token leak ve non-thinking visible <think> leak görülmemesi

A/B Judge Smoke Sonuçları

Bu tablo, merged v2 modelin base Qwen3.6-35B-A3B ile aynı prompt çiftleri üzerinde karşılaştırıldığı küçük ölçekli smoke çalışmasını gösterir.

Metrik Qwen3.6-35B-A3B Mihenk-LLM v2 Sonuç
A/B Judge Wins 3 5 +2
Domain Net Win Rate - 66.7% +66.7%
Format Validity - 100% PASS
Special Token Leaks - 0 PASS
Visible <think> Leaks - 0 PASS
Token-limit Hits - 0 PASS
Finance Safety Failures - 0 PASS
Judge Failures - 0 PASS

Gate: PASSED

DeÄŸerlendirme Notu

Bu sonuçlar bir smoke eval çıktısıdır; 8 paired prompt üzerinden, OpenAI-compatible LLM-as-judge değerlendirmesi ve deterministic kontrollerle alınmıştır. Tam kapsamlı akademik benchmark değildir. Yine de model kartına dahil edilmesinin nedeni, v2'nin hedeflenen Türkçe finans davranışlarında base modele karşı ölçülebilir bir ilk kalite sinyali vermesidir.

Manual review queue'da iki kayıt işaretlenmiştir:

  • Bir finans holdout prompt'unda base model kazanmıştır.
  • Bir portfolio risk table prompt'unda fine-tuned model kazanmış, ancak tekrar eden satır riski için manuel inceleme bayrağı almıştır.

Bu nedenle üretim kullanımında kendi domain prompt setinizle ek değerlendirme yapmanız önerilir.

Model Detayları

Özellik Değer
Model adı AlicanKiraz0/Mihenk-LLM-v2-35B-A3B-Turkish-Financial-Model
Base model Qwen/Qwen3.6-35B-A3B
Mimari Sparse MoE Causal LM, text-only merged deployment
Parametre yapısı 35B toplam, yaklaşık 3B aktif parametre
Fine-tuning yöntemi Supervised Fine-Tuning, LoRA adapter, merged 16-bit weights
Eğitim dili Türkçe ağırlıklı, İngilizce finans terminolojisi destekli
Uzmanlaşma Finans, BIST, kripto, global piyasalar, risk yönetimi
Max training sequence length 6144 token
Deployment mode text_only
Model shard sayısı 16 safetensors shard

Eğitim Özeti

Metrik DeÄŸer
Train loss 0.6950
Eval loss 0.6910
Epoch 0.8022
Fine-tune hedefi Türkçe finance-thinking SFT
Split stratejisi Duplicate prompt leakage riskini azaltmak için user prompt'a göre gruplanmış split
Label masking Assistant-only training hedefi
Thinking davranışı Eğitim datasındaki reasoning yapısı korunarak SFT

Önerilen Kullanım Alanları

  • Finans eÄŸitim asistanı.
  • BIST ÅŸirket finansalları için ilk okuma ve kavram açıklama.
  • Kripto ve makro senaryo analizi.
  • Portföy risk çerçevesi taslağı.
  • Finansal içerik üretimi ve açıklayıcı rapor taslakları.
  • Yatırım tavsiyesi sınırlarını koruyan genel bilgilendirme asistanı.

Kullanım

Kurulum

pip install "transformers>=5.6.2" "torch>=2.9.0" accelerate safetensors sentencepiece

Transformers ile örnek

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_id = "AlicanKiraz0/Mihenk-LLM-v2-35B-A3B-Turkish-Financial-Model"

tokenizer = AutoTokenizer.from_pretrained(
    model_id,
    trust_remote_code=True,
)

model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True,
)

messages = [
    {
        "role": "system",
        "content": (
            "Sen Türkçe finansal analiz, BIST, kripto, makro ekonomi ve risk yönetimi "
            "konularında uzmanlaşmış dikkatli bir asistansın. Genel bilgi ver; "
            "kişiselleştirilmiş yatırım tavsiyesi verme."
        ),
    },
    {
        "role": "user",
        "content": "BIST'te net kâr artarken işletme nakit akışı düşüyorsa hangi kalemleri kontrol edersin?",
    },
]

text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
)

inputs = tokenizer([text], return_tensors="pt").to(model.device)

outputs = model.generate(
    **inputs,
    max_new_tokens=768,
    temperature=0.7,
    top_p=0.8,
    top_k=20,
    do_sample=True,
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Örnek Sorular

BIST'te net kâr artarken işletme nakit akışı düşüyorsa hangi kalemleri kontrol edersin?
Bitcoin halving sonrası fiyat hareketlerini arz, talep ve makro koşullar açısından dengeli açıkla.
Bir portföyde kur riski ve sektör yoğunlaşması aynı anda varsa risk yönetimi planını çıkar.
Bir şirketin yüksek FAVÖK marjı ile negatif serbest nakit akışı üretmesini nasıl yorumlarsın?

Önerilen Sistem Talimatı

Sen Türkçe finansal piyasalar, BIST, kripto varlıklar, global makro ekonomi,
finansal tablo analizi ve risk yönetimi konusunda uzmanlaşmış dikkatli bir yapay zeka
asistanısın.

İlkelerin:
- Genel finansal bilgi ve eğitim amaçlı açıklama yap.
- Kişiselleştirilmiş yatırım tavsiyesi verme.
- Kesin getiri, kesin fiyat tahmini veya al/sat yönlendirmesi yapma.
- Güncel oran, vergi, düzenleme ve fiyat bilgisi gerekiyorsa resmi kaynak kontrolü öner.
- Riskleri, varsayımları ve belirsizlikleri açıkça belirt.
- Türkçe açıkla; gerekli finansal teknik terimleri parantez içinde koru.

Sınırlar ve Risk Uyarısı

  • Model gerçek zamanlı piyasa verisine baÄŸlı deÄŸildir.
  • Spesifik fiyat, faiz, vergi oranı, regülasyon veya ÅŸirket duyurusu gerekiyorsa güncel resmi kaynaklarla doÄŸrulama yapılmalıdır.
  • Üretilen yanıtlar yatırım danışmanlığı deÄŸildir.
  • Kripto varlıklar, hisse senetleri, türev ürünler ve kaldıraçlı iÅŸlemler yüksek risk içerir.
  • Model cevapları nihai karar mekanizması olarak kullanılmamalıdır.

v1'den v2'ye Geçiş

Sürüm Base Model Odak
Mihenk-LLM 14B Qwen/Qwen3-14B İlk Türkçe finans/kripto/BIST uzmanlaşması
Mihenk-LLM v2 35B-A3B Qwen/Qwen3.6-35B-A3B Daha güçlü MoE taban, Türkçe finans muhakemesi, risk ve format güvenilirliği

v2, v1'in finansal domain hedefini korur; ancak daha güçlü base mimari ve yeni A/B değerlendirme akışıyla Türkçe finans yanıt kalitesini daha sistematik ölçülebilir hale getirir.

Citation

Bu modeli kullanırsanız aşağıdaki şekilde atıfta bulunabilirsiniz:

@model{MihenkLLMv2,
  author = {Alican Kiraz},
  title = {Mihenk-LLM v2: A Fine-tuned Qwen3.6-35B-A3B Model for Turkish Financial Reasoning},
  year = {2026},
  publisher = {Hugging Face},
  url = {https://huggingface.co/AlicanKiraz0/Mihenk-LLM-v2-35B-A3B-Turkish-Financial-Model}
}

İletişim


Disclaimer: Bu model araştırma, eğitim ve genel bilgilendirme amaçlıdır. Modelin çıktıları yatırım tavsiyesi değildir ve yatırım kararlarınızdan model geliştiricisi sorumlu tutulamaz.

Downloads last month
164
Safetensors
Model size
35B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for AlicanKiraz0/Mihenk-LLM-v2-35B-A3B-Turkish-Financial-Model

Adapter
(19)
this model