Presenter Tuvshin

01 · LOCAL AI

Яагаад локал ажиллуулах вэ?

Cloud AI үйлчилгээнүүд бидний датаг гадаад серверт илгээдэг. Локал AI буюу өөрийн сервер дээр ажиллуулах загвар нь өгөгдөл нууцлал, Мөн өөрийн сургалтын хөтөлбөрийн цахим сан бүрдүүлэх, Суралцагч бүрийн хэрэглээг хянах зэрэг олон давуу тал эдлэх юм.

🔒

Өгөгдөл нууцлал

Суралцагчын асуусан асуулт болон хариулт бүгд Server дотроо үлдэнэ.

⚡

Хичээлийн хоцрогдол

Багшийн заасан хичээлийг өөрийн сурах хурданд тохируулж нөхөж судлах боломжтой.

💰

Зардал хэмнэлт

API дуудалтанд мөнгө төлөхгүй. Нэг удаа тоног төхөөрөмж авбал хязгааргүй ашиглана.

🎛️

Бүрэн тохируулга

Загварыг өөрчилж, fine-tune хийж, аль ч параметрийг тохируулах эрх бидэнд байгаа.

АРХИТЕКТУР

👤 Хэрэглэгч

↓ HTTPS Request

🌐 https://olonlog.ai

↓ дамжуулна

🚀 VLLM
Engine

🗄️ Vector
DB

↓ GPU Load Balancer

💎 Gemma3 12B загвар

↓ хариулт

🖥️ Суралцагчийн interface

    02 · RAG
  

Retrieval Augmented Generation

RAG нь AI загварыг дахин сургалгүйгээр бидний сургалтын материалд тулгуурлан хариулт өгдөг архитектур юм. Загвар зөвхөн өөрийн цээжилсэн мэдлэгт найдахгүй — хэрэглэгч асуулт тавихад шууд мэдээллийн санаас хамааралтай хэсгүүдийг татаж авч, тэдгээрийг контекст болгон ашигладаг.

Гол санаа: текстийг вектор хэлбэрт (embedding) хийж хөрвүүлж вектор мэдээллийн санд хадгална. Хэрэглэгч асуулт тавихад уг асуултыг мөн вектор болгоод, мэдээллийн сангаас хамгийн ойр утгатай хэсгүүдийг косинус ижил төстэй байдлаар хайна.

RAG ҮЙЛДЛИЙН ЖИЦ

1

Баримт бичиг оруулах

PDF, Markdown, HTML → давхцалтай хэсгүүдэд хуваана (ж.нь: 512 токен, 50 давхцал)

2

Вектор болгох (Embedding)

Хэсэг бүр → embedding загвар → тоон вектор [0.12, -0.87, 0.34, …] (768–4096 хэмжээс)

3

Вектор хайлт

Асуултыг вектор болгоод → ANN хайлтаар косинус ижил төстэй байдлаар хамгийн ойр K хэсгийг олно

4

Хариулт үүсгэх

LLM авна: системийн заавар + олдсон хэсгүүд + хэрэглэгчийн асуулт → эх сурвалжид тулгуурласан хариулт

Жишээ

Vector Database

Өгөгдлийн хэрхэн хайж байгааг харна уу

          Ready — press Search
        

DIMENSION 1

DIMENSION 2

LEGEND

Stored vectors

Query vector

Top-K matches

Similarity link

TOPICS

TOP-5 Results

IDLE

EMBED QUERY

SCAN SPACE

RANK

RETURN TOP-K

03 · СЕРВЕР & GPU

Хэдэн хэрэглэгч нэгэн зэрэг ашиглах вэ?

Сервер дээр VLLM + Gemma3 12B ажиллуулахад ямар GPU сонголт тохирох, хэдэн concurrent user дэмждэг, хэзээ queue үүсдгийг энд харна уу.

СЕРВЕРС

Olonlog AI Server Build

        🟢 Авхаар төлөвлөж буй Server
      

⚡

CPU

AMD Ryzen 9 9950X3D

16C/32T · 5.7GHz boost

🧠

RAM

96GB DDR5 5600MHz

Corsair Vengeance 2×48GB

💾

STORAGE

Samsung 9100 PRO 8TB

PCIe 5.0 · 14,800 MB/s

🖥️

MOTHERBOARD

GIGABYTE X870E Aero X3D

PCIe 5.0 · DDR5 support

❄️

COOLER

DeepCool Mystique 360

LCD Display · 360mm AIO

🔌

PSU

Phanteks Revolt 2200W

80+ Platinum · 2x GPU хүч

GPU СОНГОЛТУУД — ҮНЭ & ЧАДАВХ

СОНГОЛТ А

2× RTX 4090

24GB GDDR6X × 2 = 48GB

НИЙТ ҮНЭ

~$5,500

~$2,750 × 2

8–12

CONCURRENT

~400

ТОК/СЕК

VRAM (нийт)48GB (тус бүр 24GB)

Gemma3 12B FP16✓ Тохирно

Tensor Parallel✓ 2-GPU split

TDP (нийт)900W (450W × 2)

Зах зээлийн үнэ '26↑ Өссөн (+70% MSRP)

СЕРВЕР ✓

СОНГОЛТ Б — ОДООГИЙН

2× RTX 5090

32GB GDDR7 × 2 = 64GB

НИЙТ ҮНЭ

~$7,400

~$3,700 × 2 (зах зээл)

15–25

CONCURRENT

~750

ТОК/СЕК

VRAM (нийт)64GB (тус бүр 32GB)

Gemma3 12B FP16✓ Тав тухтай

Tensor Parallel✓ 2-GPU split

TDP (нийт)1150W (575W × 2)

Bandwidth1.79 TB/s × 2 🔥

ЖИНХЭНЭ AI DATACENTER GPU-ТЭЙГЭЭ ХАРЬЦУУЛБАЛ

GPU	VRAM	ХУДАЛДАХ ҮНЭ	CLOUD/ЦАГ	CONCURRENT (12B)	ЗОРИУЛАЛТ
RTX 4090 Ada Lovelace · Consumer	24GB GDDR6X	~$2,750	$0.40–0.59/hr	4–8	Dev / тест
RTX 5090 Миний сонголт Blackwell · Consumer	32GB GDDR7	~$3,700	$0.80–1.20/hr	8–15	Local prod ✓
2× RTX 5090 Tensor Parallel · VLLM	64GB (32×2)	~$7,400	—	15–30	Бүрэн байршуулалт
A100 80GB Ampere · Datacenter	80GB HBM2e	$10K–15K	$1.49–2.50/hr	25–50	Enterprise cloud
H100 80GB SXM Hopper · Datacenter	80GB HBM3	$25K–40K	$2.69–4.50/hr	50–100	Big AI lab

⚠️ QUEUE ЯАЖ ҮҮСДЭГ ВЭ?

VLLM нь дотоодоо continuous batching хийдэг. GPU-гийн KV cache дүүрэхэд шинэ хүсэлтүүд queue-д орно.

🟢 0–15 хэрэглэгч (2× 5090)

Queue байхгүй. Бүх хүсэлт шууд боловсруулагдана. Хоцрогдол: 200–800мс

🟡 15–30 хэрэглэгч

Богино queue үүснэ. Continuous batching-ийн ачаар харагдахааргүй байж болно. Хоцрогдол: 1–3 сек

🔴 30+ хэрэглэгч

OOM эрсдэл эсвэл урт queue. Хоцрогдол: 5–30+ сек. Нэмэлт GPU шаардагдана.

 QUEUE ТООЦООЛОЛ

Нэгэн зэрэг хэрэглэгч: 10

12550

GPU ачаалал (KV Cache) 62%

Queue-д хүлээж буй 0 хүсэлт

✓ Боловсруулалт хэвийн

Дундаж хоцрогдол: ~400 мс

04 · ИНТЕРФЭЙС

Хоёр төрлийн interface

6–12-р анги

🎓

Дунд, Ахлах ангийн

AI Туслах

Ахлах анги

📋

Сурагчдын бүртгэл

Нэвтрэх эрхтэй. Хэн юу асуусан бүртгэгдэнэ.

🔍

Prompt history шалгалт

Багш нар сурагчдын бүх асуулга харах боломжтой.

💬

Text → Text горим

Бичгээр асуулт → бичгээр хариулт. Chat UI загвартай.

⚡

Claude API — хүчтэй загвар

Зарим сурагчид Claude API- эрх авна.

🗂️

KV Cache идэвхтэй

Урт яриа, нэг session-д контекст хадгалагдана.

👁️

Жишээ загвар үзэх

Хариулт хэрхэн гарахыг урьдчилж харах товчтой.

Claude API VLLM KV Cache

Туршилтын загвар →

⭐ ✨ 🌟

1–5-р анги

🧒

Бага ангийн хүүхдийн

AI Найз

Бага анги

🎤

Speech → Text горим

Хүүхэд бичихгүй — зүгээр ярина. Дуу нь текст болно.

🔊

Text → Speech горим

AI-н хариултыг Chimege дуугаар уншиж өгнө.

🔒

Бүртгэлгүй — нэрээ хэлэхгүй

Нэвтрэх шаардлагагүй. Хүүхэд шууд ашиглана.

🧹

History үүсэхгүй

Яриа хадгалагдахгүй. KV cache ашиглахгүй. Хөнгөн.

🇲🇳

Chimege API — монгол дуу

Монгол TTS/STT — хүүхдэд ойлгомжтой дуугаралт.

Chimege API Speech API No Auth Stateless

Туршилтын загвар →

05 · ТОХИЖИЛТ

Төслийн хүрээнд шинэчлэгдэж буй ангиуд

ЗАСАГДАЖ БАЙГАА

505 тоот

1 / 4

Дунд, Ахлах ангийн AI Room

505 ТООТ · ДУНД АХЛАХ СУРГУУЛЬ

СТАТУС МЭДЭГДЭЛ

🏗️ Дотоод засал өнөөдөр дуусна · 🪑 Тавилгын ажил 2025 оны 4 сарын 9-нд бүрэн дуусах төлөвлөгөөтэй · 🥽 Apple Vision Pro ашиглан AI-д нэвтрэнэ · 🔬 Science experiment-үүдийг бодитоор хийнэ · 🎓 Дунд ахлах ангийн сурагчдад зориулсан ·

🥽

Apple Vision Pro

AI нэвтрэлт

🔬

Science Lab

Бодит туршилт

🤖

Local Server

AI Server энэ өрөөнд байрлана.

ХУВААРЬ

Өнөөдөр

Дотоод засал дуусна

4 сарын 9

Тавилга бүрэн дуусна

Удахгүй

AI системийн тохиргоо

    ДАРААГИЙН АНГИУД
    
    ТӨЛӨВЛӨГДСӨН

501 тоот

🖥️

Бага сургуулийн

AI Kiosk Room

▸ All-in-one Kiosk том дэлгэц

▸ Big screen — AI хариулт харагдана

▸ Хананд AR гэрэлтдэг самбар

▸ Хичээлийн агуулга AR дүрслэлтэй

Kiosk AR Wall Big Screen

IB

📚

IB сургуулийн

Номын сан

▸ Номын сан 2 хувааж номын сан CS Lab хамт байрлана.

✦

Нэмэлт ангиуд

Тохижуулагдаж болно

▸ Робот програмчлалын анги

▸ Multimedia анги

УДАХГҮЙ

+ Нэмэлт

НИЙТ ЯВЦ

1 / 4 анги бэлэн болж байна

505 тоот 85%

501 тоот 0%

IB Номын сан 0%

Нэмэлт ангиуд —

Хиймэл Оюун Ухаан Olonlog ai v1