ภาคผนวก A — Provider, โมเดล และราคา

ภาคผนวก A · English

ภาคผนวกนี้คือ catalog ของ thClaws.cloud gateway — รายการโมเดลที่ เรียกได้เมื่อชี้ agent ไปที่ https://thclaws.cloud/gateway หรือ รัน thClaws.cloud แบบ self-host เอง สำหรับ desktop / CLI build จะมี catalog แยกของตัวเองที่ครอบคลุม 25 provider — ดูที่ บทที่ 6 — Provider, โมเดล และ API key

Catalog refresh ครั้งล่าสุด: 2026-06-02 ถ้าอยากดึงรายการโมเดล และอัตรา latest จาก upstream API + LiteLLM pricing feed ให้รัน python3 scripts/refresh-model-catalogue.py จากราก repo

โครงสร้างราคา

ราคาด้านล่างคือ ราคาที่คุณจ่ายจริง — นั่นคือ upstream cost × platform markup ภายใน gateway แยกออกเป็น 2 ชั้น:

ชั้น	สิ่งที่เก็บ	ที่อยู่
อัตราใน DB row	ราคา upstream แบบดิบจาก LiteLLM (USD ต่อ token)	ตาราง `model_pricing` seed โดย `scripts/refresh-model-catalogue.py`
Platform markup	ตัวคูณ `1.25×` ใช้ตอน meter	env var `THCLAWS_PLATFORM_MARKUP` บน gateway service

วิธีนี้หมายความว่า: ถ้า Anthropic ปรับ Opus 4.8 ขึ้นเป็น $6/M คุณแค่ อัปเดต LiteLLM (หรือรอ sync รอบหน้า) gateway จะ pick up อัตราใหม่ ในการ refresh pricing ครั้งถัดไป — markup ยังคงเป็น env var ตัวเดียว ที่ปรับแยก

ราคาทั้งหมดแสดงเป็น ดอลลาร์สหรัฐ ต่อ 1,000,000 token (1M token) ใน DB เก็บเป็น microcent ต่อ 1k token (µ¢/kt) สูตรคือ $/M = µ¢/kt / 100,000

Anthropic

โมเดล	Tier	Input ($/M)	Output ($/M)	หมายเหตุ
`claude-haiku-4-5-20251001`	starter	$1.25	$6.25	Haiku ตัวล่าสุด (alias ที่ระบุวันที่ของ `claude-haiku-4-5`)
`claude-opus-4-8`	enterprise	$6.25	$31.25	Opus flagship ตัวปัจจุบัน
`claude-opus-4-7`	enterprise	$6.25	$31.25	Opus flagship ตัวก่อนหน้า
`claude-opus-4-6`	enterprise	$6.25	$31.25
`claude-opus-4-5-20251101`	enterprise	$6.25	$31.25
`claude-opus-4-1-20250805`	enterprise	$18.75	$93.75	Opus 4.1 รุ่นเก่า — Anthropic ยังเสิร์ฟอยู่ แต่งานใหม่ควรใช้ Opus 4.8
`claude-opus-4-20250514`	enterprise	$18.75	$93.75	Opus 4.0 รุ่นเก่า
`claude-sonnet-4-6`	pro	$3.75	$18.75	โมเดล default ปัจจุบัน
`claude-sonnet-4-5-20250929`	pro	$3.75	$18.75
`claude-sonnet-4-20250514`	pro	$3.75	$18.75	Sonnet 4.0 รุ่นเก่า

หมายเหตุ — คอลัมน์ tier เป็น แค่ display เท่านั้น thClaws.cloud ยกเลิก tier-gating ladder ไปแล้วใน v0.28 — user ที่มี credit เป็นบวก เรียกโมเดล active ตัวไหนก็ได้ ความต่างของราคาต่อการเรียกเป็น gate เดียวที่เหลือ ดูที่ ch27 § “Why no tier gate” สำหรับเหตุผลเบื้องหลัง

OpenAI

โมเดล	Tier	Input ($/M)	Output ($/M)	หมายเหตุ
`gpt-4o`	pro	$3.125	$12.50
`gpt-4o-mini`	starter	$0.1875	$0.75	โมเดล chat ของ OpenAI ที่ถูกที่สุดบน gateway
`o1`	enterprise	$18.75	$75.00	โมเดล reasoning — token output รวม reasoning token ที่ซ่อนอยู่

OpenAI expose โมเดล chat-capable ประมาณ 76 ตัวผ่าน /v1/models (gpt-5.x, o3, o4 ทุก variant พร้อม dated snapshot) ตอนนี้ใน gateway seed ไว้แค่ 3 ตัว ด้านบน ถ้าต้องการตัวเฉพาะ ให้รัน refresh script ด้วย --providers openai --apply มันจะดึง pricing จาก LiteLLM มาให้อัตโนมัติ รายการ upstream ทั้งหมดที่ มีให้ใช้:

gpt-5.5, gpt-5.5-pro, gpt-5.4, gpt-5.4-pro, gpt-5.4-mini, gpt-5.4-nano, gpt-5.3-codex, gpt-5.3-chat-latest
gpt-5.2, gpt-5.2-pro, gpt-5.2-codex, gpt-5.2-chat-latest
gpt-5.1, gpt-5.1-codex, gpt-5.1-codex-max, gpt-5.1-codex-mini
gpt-5, gpt-5-pro, gpt-5-codex, gpt-5-mini, gpt-5-nano, gpt-5-search-api
gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
o3, o3-pro, o3-mini, o3-deep-research, o4-mini, o4-mini-deep-research, o1-pro
รุ่นเก่า: gpt-4, gpt-4-turbo, gpt-3.5-turbo*

Google (Gemini)

โมเดล	Tier	Input ($/M)	Output ($/M)	หมายเหตุ
`gemini-2.0-flash`	starter	$0.125	$0.50	โมเดลที่ถูกที่สุดบน gateway ในบรรดาทุก provider
`gemini-2.0-pro`	pro	$1.95	$7.81	⚠ ดูหมายเหตุด้านล่าง — ไม่มีใน LiteLLM อัตรามาจาก seed ตอนแรกอาจจะ stale

Google expose โมเดล Gemini 20+ ตัวผ่าน /v1beta/models (gemini-2.5-flash, gemini-2.5-pro, gemini-3-pro-preview, gemini-3.1-flash-lite ฯลฯ) รัน refresh script เพื่อ seed ด้วยราคาปัจจุบัน

OpenRouter

โมเดล	Tier	Input ($/M)	Output ($/M)	หมายเหตุ
`openrouter/auto`	starter	(pass-through)	(pass-through)	OpenRouter’s auto-router; cost จริงขึ้นกับโมเดลที่ routed ไป gateway forward usage ไปตามนั้น
`openrouter/fusion`	—	(แปรผัน)	(แปรผัน)	Fusion router — panel เริ่มต้น คิดเงินตาม panel + judge ที่รัน ต้นทุนแปรไปตาม request
`openrouter/fusion+`	—	(แปรผัน)	(แปรผัน)	Fusion แบบปรับแต่งได้ (panel/judge/ลิมิต — ดูบทที่ 6) เป็น pseudo-model ของ thClaws การเรียกจริงคือ outer model ของคุณ + tool `openrouter:fusion`

DB row ของ openrouter/auto / fusion / fusion+ เก็บค่า sentinel ราคา แปรผัน เพราะ upstream cost แปรไปตาม request ในกรณีนี้พึ่ง metering ของ OpenRouter เอง

โมเดลสร้างสื่อ (ภาพและวิดีโอ)

media tools ที่มีมาให้ (TextToImage / ImageToImage / TextToVideo / ImageToVideo — ดูบทที่ 11) คิดเงิน ต่อภาพ หรือ ต่อวินาทีวิดีโอ ไม่ใช่ต่อ token จึงอยู่นอกตาราง $/M ด้านบน และ ต้องมี key ของ provider ที่เกี่ยวข้อง (GEMINI_API_KEY / OPENAI_API_KEY / DASHSCOPE_API_KEY)

Provider	ภาพ	วิดีโอ
Google	`gemini-3.1-flash-image`, `gemini-3.1-pro-image`	`veo-3.1-{fast,,lite}-generate-preview` (4–8 วิ, 720P/1080P)
OpenAI	`gpt-image-2` (คิดเป็น token ด้วย: ~$5 / $30 ต่อ M in/out)	—
Alibaba DashScope	`qwen-image-2.0`, `qwen-image-2.0-pro`	`happyhorse-1.0-t2v`, `happyhorse-1.0-i2v` (720P/1080P)

อัตราต่อหน่วยอยู่ในฟิลด์ price_per_image_usd / price_per_video_second_usd ของ catalogue ดูค่าที่ seed ไว้ปัจจุบันด้วย /models (บาง row ของสื่อยังใช้ได้เฉพาะ key ฝั่ง desktop และยังไม่ผ่าน การ meter ที่ gateway)

Row ที่ inactive / deprecated

โมเดล	เหตุผล
`anthropic/claude-haiku-4-5`	ถูกแทนที่ด้วย alias ที่ระบุวันที่ `claude-haiku-4-5-20251001` — `/v1/models` ของ Anthropic ไม่ return alias เปล่าแล้ว เก็บ row ไว้ด้วย `active=FALSE` เพื่อให้ usage row เก่า ๆ ยัง join ได้

หมายเหตุเรื่องความถูกต้องของราคา

Row	สถานะ
14 จาก 16 active row	ตรงเป๊ะ กับราคาที่ LiteLLM ประกาศ ณ 2026-06-02
`google/gemini-2.0-pro`	ไม่มีใน LiteLLM — อัตราปัจจุบันมาจาก seed ของ migration 006 ตอนแรก Google อาจจะเปลี่ยนไปแล้ว refresh script ไม่สามารถ reprice row นี้อัตโนมัติได้ ควรเช็คเป็นระยะกับ ai.google.dev/pricing
`openrouter/auto`	Pass-through ไม่มี canonical cost

ถ้าพบ price drift ให้รัน:

python3 scripts/refresh-model-catalogue.py --reprice-only            # dry-run
python3 scripts/refresh-model-catalogue.py --reprice-only --apply    # commit

ปรับ platform markup

ตัวคูณ 1.25× เป็น env var ตัวเดียวบน gateway service:

# thclaws-cloud/docker-compose.yml
gateway:
  environment:
    THCLAWS_PLATFORM_MARKUP: ${THCLAWS_PLATFORM_MARKUP:-1.25}

เปลี่ยนเป็น 1.50 แล้ว bounce gateway คือวิธีที่เร็วที่สุดในการเพิ่ม margin แบบ uniform ทั่วทุกโมเดล gateway จะ clamp ค่าใด ๆ ที่ต่ำกว่า 1.0 (รันที่ราคา upstream เป๊ะ ๆ คือขั้นต่ำ — ต่ำกว่านี้คือขาดทุนต่อ การเรียก) และจะ emit warning

ถ้าอยากตั้งราคาต่างกันต่อโมเดล แก้ row ใน model_pricing ตรง ๆ ได้ — แต่ระวังว่า refresh script จะ reprice กลับไปเป็น LiteLLM ใน run --reprice ครั้งถัดไป ทางออกคือตั้ง active=FALSE แล้ว active=TRUE ด้วยอัตรา custom พร้อมตั้ง --providers scope ให้ไม่รวม provider นั้น

โค้ดที่เกี่ยวข้อง

เรื่อง	ไฟล์
คำนวณ cost	`thclaws-cloud/gateway/src/pricing.rs` (`cost_cents_with_markup`)
Parse markup env var	`thclaws-cloud/gateway/src/config.rs` (`platform_markup`)
จุดเรียก meter	`thclaws-cloud/gateway/src/meter.rs`
Schema ของ pricing table	`thclaws-cloud/api/alembic/versions/006_*.py`
Refresh script	`scripts/refresh-model-catalogue.py`