เปรียบเทียบ เลือกใช้ และเริ่มต้นได้ทันที — OpenAI, Anthropic, Google, Meta และอีกมากมาย
โมเดลที่ผู้ใช้เลือกใช้มากที่สุดในแพลตฟอร์ม
Anthropic
Claude Opus 4.6 พัฒนาจาก Opus 4.5 ด้วยการปรับปรุงครั้งใหญ่ในด้านการวางแผน การรีวิวโค้ด การดีบัก และการทำงานกับ codebase ขนาดใหญ่ เปิดตัว "Agent Teams" สำหรับการทำงานร่วมกันแบบ multi-agent ทำคะแนน SWE-bench 80.8% และ OSWorld 72.7% รองรับ context ยาวถึง 1M token ในเบต้า
Anthropic
Claude Sonnet 4.6 มีประสิทธิภาพใกล้เคียง Opus 4.6 ในราคาถูกกว่า 5 เท่า ทำคะแนน SWE-bench 79.6% และ OSWorld 72.5% ผู้ใช้ Claude Code เลือก Sonnet 4.6 มากกว่า Sonnet 4.5 ถึง 70% เป็นโมเดลเริ่มต้นใน Claude เก่งด้านโค้ด การใช้คอมพิวเตอร์ การออกแบบ และงาน knowledge work
Gemini 3.1 Pro มีประสิทธิภาพด้านเหตุผลมากกว่า Gemini 3 Pro ถึง 2 เท่า ทำคะแนน ARC-AGI-2 ที่ 77.1% และ MCP Atlas 69.2% มีฟีเจอร์ "Deep Think Mini" สำหรับปรับระดับการคิดวิเคราะห์ รองรับ context ยาว 1M token เก่งด้านเหตุผล โค้ด agentic workflows และงาน multimodal
OpenAI
GPT-5.3 Codex เป็นโมเดลเขียนโค้ดแบบ Agentic ที่ทรงพลังที่สุดของ OpenAI รวมประสิทธิภาพการเขียนโค้ดระดับแนวหน้ากับความสามารถด้านเหตุผลของ GPT-5.2 เร็วกว่ารุ่นก่อน 25% และทำคะแนนสูงสุดใน SWE-Bench Pro ที่ 55.6%
OpenAI
GPT-5.3 Codex Spark เป็นรุ่นเล็กที่เร็วมากของ GPT-5.3 Codex ออกแบบมาเพื่อการตอบสนองโค้ดแบบเรียลไทม์ ใช้ Cerebras Wafer-Scale Engine ให้ความเร็วกว่า 1,000 token ต่อวินาที เหมาะสำหรับ code completion และ debugging แบบโต้ตอบ
แสดง 1–12 จาก 341 โมเดล
DeepSeek V4 มีพารามิเตอร์ทั้งหมด 1 ล้านล้าน พร้อมนวัตกรรมสถาปัตยกรรม 3 อย่าง ทำคะแนน SWE-bench 80%+ ด้วยต้นทุนต่ำกว่าคู่แข่ง 10-40 เท่า ออกแบบให้รันบนฮาร์ดแวร์ผู้บริโภคได้ เปิดซอร์สภายใต้ Apache 2.0 รองรับ context มากกว่า 1M token
GPT-5.2 Pro is OpenAI’s most advanced model, offering major improvements in agentic coding and long context performance over GPT-5 Pro. It is optimized for complex tasks that require step-by-step reasoning, instruction following, and accuracy in high-stakes use cases. It supports test-time routing features and advanced prompt understanding, including user-specified intent like "think hard about this." Improvements include reductions in hallucination, sycophancy, and better performance in coding, writing, and health-related tasks.
Claude Opus 4.5 is Anthropic’s frontier reasoning model optimized for complex software engineering, agentic workflows, and long-horizon computer use. It offers strong multimodal capabilities, competitive performance across real-world coding and reasoning benchmarks, and improved robustness to prompt injection. The model is designed to operate efficiently across varied effort levels, enabling developers to trade off speed, depth, and token usage depending on task requirements. It comes with a new parameter to control token efficiency, which can be accessed using the OpenRouter Verbosity parameter with low, medium, or high. Opus 4.5 supports advanced tool use, extended context management, and coordinated multi-agent setups, making it well-suited for autonomous research, debugging, multi-step planning, and spreadsheet/browser manipulation. It delivers substantial gains in structured reasoning, execution reliability, and alignment compared to prior Opus generations, while reducing token overhead and improving performance on long-running tasks.
Gemini 2.5 Pro is Google’s state-of-the-art AI model designed for advanced reasoning, coding, mathematics, and scientific tasks. It employs “thinking” capabilities, enabling it to reason through responses with enhanced accuracy and nuanced context handling. Gemini 2.5 Pro achieves top-tier performance on multiple benchmarks, including first-place positioning on the LMArena leaderboard, reflecting superior human-preference alignment and complex problem-solving abilities.
Claude Sonnet 4.5 is Anthropic’s most advanced Sonnet model to date, optimized for real-world agents and coding workflows. It delivers state-of-the-art performance on coding benchmarks such as SWE-bench Verified, with improvements across system design, code security, and specification adherence. The model is designed for extended autonomous operation, maintaining task continuity across sessions and providing fact-based progress tracking. Sonnet 4.5 also introduces stronger agentic capabilities, including improved tool orchestration, speculative parallel execution, and more efficient context and memory management. With enhanced context tracking and awareness of token usage across tool calls, it is particularly well-suited for multi-context and long-running workflows. Use cases span software engineering, cybersecurity, financial analysis, research agents, and other domains requiring sustained reasoning and tool use.
o3 is a well-rounded and powerful model across domains. It sets a new standard for math, science, coding, and visual reasoning tasks. It also excels at technical writing and instruction-following. Use it to think through multi-step problems that involve analysis across text, code, and images.
DeepSeek R1 is here: Performance on par with [OpenAI o1](/openai/o1), but open-sourced and with fully open reasoning tokens. It's 671B parameters in size, with 37B active in an inference pass. Fully open-source model & [technical report](https://api-docs.deepseek.com/news/news250120). MIT licensed: Distill & commercialize freely!
Grok 3 is the latest model from xAI. It's their flagship model that excels at enterprise use cases like data extraction, coding, and text summarization. Possesses deep domain knowledge in finance, healthcare, law, and science.
Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward pass (400B total). It supports multilingual text and image input, and produces multilingual text and code output across 12 supported languages. Optimized for vision-language tasks, Maverick is instruction-tuned for assistant-like behavior, image reasoning, and general-purpose multimodal interaction. Maverick features early fusion for native multimodality and a 1 million token context window. It was trained on a curated mixture of public, licensed, and Meta-platform data, covering ~22 trillion tokens, with a knowledge cutoff in August 2024. Released on April 5, 2025 under the Llama 4 Community License, Maverick is suited for research and commercial applications requiring advanced multimodal understanding and high model throughput.
Gemini 2.5 Flash is Google's state-of-the-art workhorse model, specifically designed for advanced reasoning, coding, mathematics, and scientific tasks. It includes built-in "thinking" capabilities, enabling it to provide responses with greater accuracy and nuanced context handling. Additionally, Gemini 2.5 Flash is configurable through the "max tokens for reasoning" parameter, as described in the documentation (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning).
Mistral Large 3 2512 is Mistral’s most capable model to date, featuring a sparse mixture-of-experts architecture with 41B active parameters (675B total), and released under the Apache 2.0 license.
Jamba Large 1.7 is the latest model in the Jamba open family, offering improvements in grounding, instruction-following, and overall efficiency. Built on a hybrid SSM-Transformer architecture with a 256K context window, it delivers more accurate, contextually grounded responses and better steerability than previous versions.
หน้า 1 จาก 29